Voice Search, was ist das eigentlich?
Erinnerst du dich die Burger King Werbung (siehe unten), in der ein Mitarbeiter uns mitteilt, dass es unmöglich ist, innerhalb von 15 Sekunden alle frischen Zutaten eines Whoppers aufzuzählen? Stattdessen sagt er “Okay Google, what is the Whopper Burger?” direkt in die Kamera.
Die Idee dahinter ist gut: Die Werbung soll die Sprachsuche aller Android-Geräte triggern, die sich in "Hörweite" befinden, und damit die Frage beantworten.
Dennoch ging die Kampagne nach hinten los, denn der Voice Search Algorithmus zog die Wikipedia-Seite der Fastfood-Kette als Antwort heran und die ist ja bekanntlich relativ leicht manipulierbar. So landeten unter anderem das Gift Zyanid, Kinder oder Präservative in der Zutatenliste. Trotz aller Bemühungen von Burger King, die Kampagne noch zu retten, musste am Ende doch Google das Spiel beenden.
Auch wenn dieser Versuch einer viralen Kampagne misslang, zeigt er doch, wie weitreichend Voice Search sein kann. Google, Alexa, Cortana, Siri & Co. haben inzwischen ihren festen Platz in unserem Alltag eingenommen.
Doch was genau ist Voice Search und wie wirkt sie sich insbesondere auf die Suchmaschinenoptimierung aus?
TL;DR – Voice Search (SEO) in a nutshell
- Status quo der Sprachsuche: Die Nutzung und Zahl der Anwendungsmöglichkeiten steigt kontinuierlich.
- Wie sich die Sprachsteuerung auf SEO auswirkt: Die neue Art zu fragen erzwingt eine neue Art zu antworten. Intention, Standort und Zeitpunkt werden wichtiger.
- Wie sich Voice Search entwickeln wird: Künstliche Intelligenz wird Stimmen und Stimmungen erkennen und Antworten entsprechend anpassen.
Definition: Was ist Voice Search?
Voice Search (deutsch: Sprachsuche) beschreibt die sprachgesteuerte Nutzung der Suchmaschine von Google, die inzwischen per Mobile App sowie über den Google Chrome Browser auch am Desktop nutzbar ist. Mittlerweile können wir unzählige Apps per Sprache steuern, nicht nur die, die aus dem Hause Google (beispielsweise Google Maps), Apple (Siri), Microsoft (Cortana) oder Amazon (Alexa) stammen. Aufgrund der guten Usability (sogar die Barrierefreiheit ist gewährleistet) – sowohl auf mobilen wie auch stationären Endgeräten – integriert sich Voice Search ideal in unseren Alltag.
Carsten Rauh, Director Search Advertising & Strategic Sales bei Microsoft Deutschland, ist überzeugt, dass wir "immer stärker dazu übergehen werden, das, was wir bisher per Tastatureingabe entweder übers Handy oder per Desktop machen, über persönliche digitale Assistenten zu kommunizieren – abhängig davon, wie schnell sich die Qualität dieser Services verbessert. Es ist einfacher bequemer, natürlich mit einem Device zu sprechen [als die passenden Antworten durch Trial-and-Error zu finden]."
Und auch Gary Vaynerchuk ist überzeugt: Voice ist die nächste Suchmaschine (ein Klick aufs Bild führt dich zu Facebook).
Exkurs: Die Entstehung der Voice Search
Speech Recognition-Technologien werden seit den 1950ern Jahren immer weiterentwickelt. Die 70er Jahre markieren eine Hochzeit der Entwicklung, die vor allem durch großes Interesse und die Förderung durch das US-amerikanische Verteidigungsministerium gekennzeichnet sind. Im Zuge dessen entstand das “Harpy Speech Recognition System” (1976), das erstmals über eine rudimentäre Suchfunktion verfügte. Den nächsten Meilenstein markiert Google 2002 mit der Einführung der ersten Version ihrer "Voice Search". Damals mussten Suchende ihren Suchbegriff allerdings noch telefonisch über eine Hotline mitteilen.
Würdest du sowas heute ernsthaft in Betracht ziehen? Also ich nicht...
Die moderne Google Voice Search, wie sie auf jedem Android-Smartphone installiert oder als App für andere Systeme erhältlich ist, wurde 2012 eingeführt.
Inzwischen sind die zur Spracheingabe nutzbaren Endgeräte vielfältig: Smartphones, Tablets, Smart Watches, Laptops/Desktops, Spielekonsolen und Smart Speakers, wie etwa der bekannte Amazon Echo/Echo Dot, Google Home oder Apple Home Pod (ab Dezember 2017).
Status quo der Sprachsuche
Die steigende Nutzung von Voice Search fußt vor allem auf der Popularität sprachgesteuerter Virtual Assistants, die seit der Einführung von Apples Siri im Jahr 2011 sowie Google Now (2012), Microsoft Cortana (2014) und Amazons Alexa (2014) einem Massenpublikum vertraut geworden sind. Die smarten Helfer haben unser Nutzungsverhalten nachhaltig verändert und neben der Sprachsuche auch die allgemeine Sprachsteuerung zunehmend in unseren Alltag integriert.
Bereits 2016 gab Google CEO Sundar Picha im Rahmen einer Keynote bekannt, dass schon 20 % der Suchanfragen über mobile Geräte per Sprache geschehen. Bis 2020 soll es gut die Hälfte aller Suchanfragen (über alle Plattformen, einschließlich Bing, Baidu & Co.) sein.
Sowohl die momentan verfügbaren Zahlen als auch aktuelle Entwicklungen (beispielsweise Samsung Bixby (2017/2018) oder der noch zu benennende Sprach-Assistent von Facebook) sprechen in Hinblick auf Voice Search eine eindeutige Sprache.
Und laut Google stehen Nutzer, die einen Lautsprecher mit Sprachsteuerung besitzen, Marken als Teil des Erlebnisses positiv gegenüber. "Sie sind offen für Informationen, die hilfreich und relevant für ihren Lebensstil sind."
Voice Search Optimierung: Wie sich die Sprachsteuerung auf SEO-Strategien auswirkt
Die Freude über die steigende Popularität der sprachgesteuerten Suche teilt nicht jeder. Insbesondere SEO-Verantwortliche sehen der Entwicklung mit gemischten Gefühlen entgegen.
Aber welche Auswirkungen hat Voice Search auf die Suchmaschinenoptimierung? Wie unterscheidet sich "Voice Search SEO" von bisherigen Methoden?
Die gute Nachricht zuerst (laut Carsten Rauh): "Es wird so weitergehen, wie bisher, aber es wird einen deutlich höheren Komplexitätsgrad erreichen. Denn insgesamt nimmt die Zahl der Möglichkeiten zu, durch die – abseits der Suchmaschinen – transaktionale Anfragen getriggert werden können."
1. Eine neue Art zu suchen. Eine neue Art zu antworten.
Zuerst solltest du dir das Nutzerverhalten vor Augen führen: Während der Nutzer bei einer gängigen Suche im Web – sei es mobil oder am PC – ein oder mehrere Schlagworte in die Suchmaske eingibt und sich dann durch die angezeigten Ergebnisseiten (SERP) klickt, schaut er bei einer Voice Search in der Regel nicht einmal mehr auf seinen Bildschirm. Laut Gartner wird das bis 2020 in 30 % der Web Browsing Sessions der Fall sein. Schließlich ist es uns ein Leichtes, die Suche mithilfe eines Sprachbefehls ("Okay Google...") zu aktivieren und die Suche verbal zu starten. Und die Ergebnisse, genauer gesagt: das vermeintliche beste Ergebnis, werden uns dabei nicht angezeigt, sondern vorgelesen. Vorbei ist die Zeit der Listen und der "Top-Rankings" im Plural.
Diese veränderte Ausgangssituation verdeutlicht, dass der Suchende über andere Intentionen und Bedürfnisse verfügt. Ihm ist normalerweise nicht viel daran gelegen, lange zu recherchieren. Im Gegenteil: er stellt eine direkte Frage, auf die er eine (!) konkrete Antwort erwartet.
2. Conversational Search: Von Keywords zu Key Sentences
Im Vergleich zur herkömmlichen Google-Suche ist die Voice Search deutlich dialogorientierter (wir sprechen daher auch von "conversational search"), wobei der Suchende in der Regel eine ausformulierte Frage stellt, anstatt anhand konkreter Keywords zu suchen. Der Fokus von Voice Search SEO sollte dementsprechend eher auf Fragen (bzw. deren Antworten) und Longtail Keywords liegen. Dieser Trend ist zwar schon eine Weile zu beobachten, wird aber als Vorbereitung auf die Sprachsuche noch wichtiger.
Fokussiere dich auf typische W-Fragen (Wann? Wie? Wo? Wer? Warum? Welche? etc.) und beantworte sie so präzise wie möglich. Das erhöht ganz nebenbei übrigens auch deine Chance, in Googles Rich Snippets aufzutauchen und dich damit an der Spitze (quasi Position 0, siehe Bild in der Infobox) der klassischen Suchergebnisliste zu platzieren. Gängige Fragen lassen sich mit Hilfe von Content-Tools wie Searchmetrics oder Linkbird identifizieren. Derartige Tools ermitteln anhand der vorher festgelegten Keywords Fragen, die im selben Kontext von Nutzern gestellt wurden. Du kannst diese dann zum Beispiel in Überschriften oder direkt in deine URLs einbinden, wie ich das bspw. bei meiner Blogparade "Was ist Content Marketing?" gemacht habe.
Unterm Strich heißt das für dich, dass du deine Keyword-Recherche nicht nur auf einzelne Keywords beschränken, sondern auf Suchphrasen erweitern solltest. Dabei helfen dir Gespräche mit Kunden, Kommentare und Rezensionen auf deiner Webseite oder auch mal ein genauerer Blick in Richtung Mitbewerber – insbesondere in die FAQ. Zudem könntest du testen, inwieweit sich eine Optimierung deiner Longtail Keywords auf die von Googles KI akzeptierten Sprachbefehle, wie bspw. “Zeige mir Fotos von Berlin”, rentiert.
Was sind Rich Snippets?
Rich Snippets sind kleine (Text-)Ausschnitte aus deinem Blog bzw. einer Website, die die Suchanfrage (nach Meinung des Google Algorithmus) am besten bedienen. Sie bestehen aus einem Titel, einer URL und einem Content-Teil, der je nach Snippet-Art unterschiedlich ausfällt. Durch entsprechendes Markup im Quellcode deiner Website (sogenannte Structured Data) kannst du dich für bestimmte Arten von Snippets (etwa Produkte, Rezepte oder Bewertungen) qualifizieren und hast einen gewissen Einfluss auf den Inhalt der Snippets. Im Idealfall platzierst du, neben der Antwort auf die Suchanfrage, einen Call-to-Action.
Zwar gehören laut Google weder das Markup, noch Rich Snippets an sich, zu den Ranking-Faktoren, dennoch verfügen sie über einige Vorteile: Zum einen steigern die Zusatzinformationen die Relevanz für den Nutzer, was sich positiv auf die Klickrate auswirkt, und zum anderen eignen sich Rich Snippets sehr gut für Voice Search SEO, da die darin enthaltenen Informationen leicht vorgelesen werden können.
Aber Vorsicht: Nur, weil du in der Text-Suche (PC/Mobile) mit einem Rich Snippet angezeigt wirst, heißt das nicht automatisch, dass das auch bei derselben Suchanfrage per Spracheingabe der Fall ist!
Mein Rich Snippet zum Begriff "Thought Leadership" (Stand: November 2017)
Wie schon erwähnt, orientieren sich Anfragen per Sprachbefehl mehr an einem klassischen Dialog. Der Nutzer “spricht” mit seinem Endgerät. Diese Herangehensweise spiegelt sich bestenfalls auch im Content wider – "holistisch" ist hier das passende Stichwort, ebenso "Semantic SEO".
Dafür hilft ein Blick auf die Auto-Vervollständigung der Google-Suche (Welche Suchbegriffe/Fragen werden neben der eigenen angezeigt?) sowie ein weiterer auf die ähnlichen Suchanfragen am Ende der Suchergebnisseiten.
Der Vorteil der Voice Search ist, dass sich der User Intent (siehe Infobox unten) genauer identifizieren lässt als es durch die Eingabe von Schlagworten möglich ist. Diese Tatsache schlägt sich auch in den Suchergebnissen nieder.
Nehmen wir an, ein Nutzer sucht nach den richtigen Schuhen für einen Marathonlauf. Gibt er “marathon laufschuhe” in die Suchmaske ein, werden ihm sowohl informationale als auch transaktionale (also kommerzielle) Ergebnisse angezeigt.
Tätigt derselbe Nutzer die Anfrage wiederum per Sprachbefehl und als Frage (“Okay Google, welche Schuhe eignen sich für einen Marathonlauf?”), verändern sich die Ergebnisse.
Die ersten beiden Rankings sind identisch. Das liegt womöglich daran, dass Achim Achilles Portal sowohl auf Longtail als auch auf normale Keywords optimiert ist und alle gängigen Fragen rund um das Thema Laufen beantwortet. Auf diese Ergebnisse folgen auf Platz drei und vier in der klassischen Suche jedoch Online-Shops, bei der Sprachsuche hingegen ein Marathon-Portal und das Forum eines Shops. Die Titel und Meta Descriptions gehen stärker auf die gestellte Frage ein, was die Wahrscheinlichkeit erhöht, dass der Nutzer eine befriedigende Antwort auf seine Anfrage bekommt.
Was bedeutet User Intent (in Bezug auf SEO)?
In den vergangenen Jahren ist die Intention des Nutzers, der sogenannter "User Intent" als Google Ranking-Faktor immer wichtiger geworden. Damit ist seine Absicht / sein Bedürfnis hinter seiner Suchanfrage gemeint. Gerade bei der Voice Search ist dieser besonders gut zu erkennen, da der Nutzer meist eine relativ präzise Frage stellt. Je nach Intention hat der Suchende unterschiedliche Ansprüche an die Suchergebnisse.
Wir unterscheiden grundlegend zwischen drei verschiedenen Intentionen:
- Navigational: Der Nutzer will zu einem bestimmten Ort oder zu einer bestimmten Seite.
- Informational: Der Nutzer möchte mehr über ein bestimmtes Thema wissen.
- Transaktional: Der Nutzer hat die Absicht etwas zu kaufen.
3. Standort und Zeitpunkt im Fokus
Aufgrund der überwiegend mobilen Nutzung von Voice Search spielen der Standort des Nutzers sowie die Uhrzeit der Anfrage eine große Rolle. Sucht jemand am späten Abend nach Pizza oder Sushi, erwartet er konkrete Ergebnisse zu Restaurants und Lieferdiensten in der Umgebung. Je nachdem, was für ein Business du hast, solltest du daher noch größeren Wert auf Google Maps-Einträge und eigene Google Locations samt Adress- und Kontaktdaten legen.
Karl Gilis hat hierzu in seinem Vortrag auf dem growth marketing SUMMIT 2017 ein extrem amüsantes (fiktives) Beispiel präsentiert: Einen Autofahrer (Standort), der abends (Zeitpunkt) nach "ARAL" sucht. Da das Unternehmen seine Online-Auftritte weder in Hinblick auf Local Search noch Voice Search optimiert hat, wird dem Autofahrer lediglich die Corporate Website ausgespielt – und nicht das, was er gerade dringend braucht: die nächste Tankstelle.
Dieses Beispiel macht deutlich, wie wichtig diese beiden Faktoren für die User Experience sind und sich schon kurzfristig auf die Markenwahrnehmung auswirken.
Auch Carsten Rauh ist überzeugt, dass die Suche vorhersehbarer werden wird. Von Suchmaschinen wird erwartet, dass „alles überall verfügbar ist.“
Durch all das, was wir über einen Nutzer wissen – vor allem seine Vorlieben und Präferenzen (zum Beispiel seine präferierte Airline und Reisezeit, wenn er einen „Flug nach Berlin“ sucht) – und das, was wir aus der großen Masse an bereits bestehenden Lösungen von anderen Nutzern kennen. Hinzu kommt der Kontext, in dem sich der Nutzer im Moment befindet, der bei der Auswahl der passenden Lösungen berücksichtigt wird. Dadurch entsteht eine neue Qualität der Suchergebnisse und macht die Suche an sich zum einem deutlich persönlicheren Erlebnis.
Vielleicht auch interessant für dich:
Wie wird sich Voice Search entwickeln?
Was die technischen Möglichkeiten der Voice Search betrifft, stehen wir noch am Anfang. Ob Google, Cortana, Alexa oder Siri – die gängigen Apps werden fortwährend optimiert, um die User Experience zu verbessern – speziell durch die Vermeidung von Missverständnissen bei der Spracheingabe.
Auch die Anzahl anderer per Sprache zu bedienenden Apps dürfte über die nächsten Monate und Jahre steigen.
Darüber hinaus sind folgende Entwicklungen absehbar:
- Von der Anfrage zum Gespräch
Die Weiterentwicklung der KI hinter Virtual (Voice) Assistants wird zu Dialogen zwischen Anwender und Assistent führen, die über das Frage-Antwort-Schema hinausgehen. Sowohl der Google Assistant als auch Alexa verfügen schon über die notwendige Technologie, um Rückfragen zu stellen, die für eine Präzisierung der Suchergebnisse genutzt werden kann. Auch Folgefragen zu einem Ergebnis kann der Anwender stellen, ohne die Ausgangsfrage wiederholen zu müssen. Ein einfaches “Okay Google, nächstes Ergebnis” oder “Siri, hast du noch mehr?” reichen, um weitere Informationen zu erhalten. - Emotionen und Stimmungen erkennen
In Zukunft wird es nicht nur darauf ankommen, welche Frage der Benutzer stellt und welche Intention sich dahinter verbirgt, auch seine Stimme bzw. Stimmung wird Einfluss auf die Ergebnisse haben. Derzeit arbeiten zahlreiche Firmen und Startups an Voice Recognition-Software, die die Tonlage und Ausdrucksweise des Anwenders analysieren und dadurch Rückschlüsse auf deren emotionalen Zustand ziehen können. Steht der Anwender beispielsweise unter Stress, benötigt er schnell konkrete Informationen. Ist er wiederum ruhig und gut gelaunt, steht ihm wahrscheinlich mehr der Sinn nach inspirierendem Content.
In the not so far future, our aim is to add vocal biomarker analysis to our feature set, enabling Virtual Private Assistants to analyze your voice for specific health conditions. – Yucal Mor, CEO Beyond Verbal
Darüber hinaus sollen Voice Search-Algorithmen bald auch fähig sein, gesundheitliche Beschwerden des Anwenders zu erkennen (etwa an einer rauen Stimme oder Husten während der Spracheingabe) und diese darauf aufmerksam zu machen und bestenfalls gleich passende Lösungen vorzuschlagen. - Keyword Stuffing gehört der Vergangenheit an (jetzt erst!?)
Das leidige Thema “Keyword Stuffing” gehört mit der stärkeren Ausbreitung der Voice Search endgültig der Vergangenheit an. Wie bereits erwähnt, werden Semantic SEO und ein holistisches Umfeld mit Longtail Keywords deutlich sinnvoller. Insgesamt rückt der Benutzer bei der Sprachsuche in den Vordergrund, weshalb ich diese Entwicklung sehr begrüße. - Schwindende Werbung? Wohl kaum…
Ohne Suchergebnislisten oder sogar ohne Bildschirm müsste Werbung, wie wir sie von Google AdWords oder Bing Ads kennen, analog zu Radio und Podcasts zwangsläufig verbal kommuniziert werden. Sie ähnlich wie bei YouTube Pre-Roll-Anzeigen vor dem eigentlichen Content auszuspielen kann jedoch nicht im Sinne der Benutzer sein. Wir können jedoch sicher davon ausgehen, dass es auch Voice Search Ads geben wird.
Carsten Rauh weiste in unserem Gespärch außerdem darauf hin, dass Suchmaschinen durch die ganzen Informationen, die sie über die vielen neuen Entrypoints (Amazon Echo, Google Home, Smartphone Apps etc.) mitnehmen, dem Werbetreibenden ein deutlich komplexeres, ergo detaillierteres Anforderungsprofil des Nutzers geben können. Vielleicht schafft es Werbung ja doch irgendwann, relevant zu sein. ;-)
Schau dir dazu auch das YouTube-Video von Rand Fishkin an:
Zwei weitere Bereiche, die von der fortschreitenden Verbreitung der Sprachsteuerung betroffen sind bzw. sein werden, sind Social Media und Webseiten. Ich hab leider keine Glaskugel zur Hand, aber ein paar Veränderungen sind offensichtlich:
- Social Media
Ich sehe immer mehr Menschen, die über WhatsApp nicht mehr schreiben, sondern sich Sprachnachrichten schicken. Wieso auch nicht, bequemer ist es ja. Auch das Posten auf Twitter & Co. könnte theoretisch schon jetzt per Sprache geschehen, doch noch ist die Nutzung von Voice in Social Media recht gering. Das dürfte sich spätestens mit dem Roll-out Facebooks eigener Voice Search und Sprachsteuerung ändern dürfte. In Zukunft greifen wir wahrscheinlich auf jede App – Social Media oder nicht – zu, indem wir "mit ihr sprechen". Genug Potenzial ist ja da…
Quelle: Stone Temple
-
Webseiten per Sprache navigieren
Wir waren es gewohnt, per Navigation und Links durch eine Webseite zu klicken. Durch mobile Endgeräte und das Aufkommen von Onepage-Konzepten nimmt die Zahl der Klicks ab und wir scrollen bzw. swipen immer häufiger. Es ist also nicht unvorstellbar, dass wir bald per Sprache navigieren. Aus Tastenkürzel werden Sprachbefehle. Wer weiß, womöglich füllen wir auch Formulare und Kommentare per Sprache aus, woraus vielleicht sogar "echte" Dialoge entstehen...
Noch ein Wort zu Microsoft Bing
Wir sprechen in Bezug auf Voice Search hauptsächlich über Google, aber Microsofts Suchmaschine Bing gewinnt im Verborgenen immer mehr Marktanteile. Denn Sowohl Siri als auch Alexa und Facebook greifen auf Bing-Daten zurück! Simon Penson von Zazzle Media hat hierzu eine praktische Übersicht erstellt:
Fazit: Lohnt sich die Investition in Voice Search (SEO) schon?
Eindeutig: Ja!
Die steigende Nutzungsrate spricht eine klare Sprache. An Voice Search führt kein Weg vorbei! Warum auch? Die Technologie integriert sich ideal in unseren Alltag: In Bezug auf die Informationsbeschaffung via Google & Co. hat das Raten nach passenden Suchbegriffen ein Ende. Fragen müssen nicht spezifiziert werden, sondern können ganz selbstverständlich an die Software gerichtet werden. In Bezug auf Musik-Streaming oder Shopping sprechen wir schon jetzt mit Alexa, als säße sie neben uns auf der Couch.
Voice Search SEO avanciert zu einem der wichtigsten Themen des Marketings. Google arbeitet bereits daran, die Voice Search Nutzung in seine Analytics zu integrieren und damit die relevanten Daten für die Suchmaschinenoptimierung zu liefern.
Und gerade für das Content Marketing bietet Voice Search eine echte Chance, denn hier werden bereits relevante Inhalte produziert, die Fragen beantworten und Bedürfnisse befriedigen sollen.
Wer sich also bisher noch nicht mit der Sprachsteuerung beschäftigt hat, probiert das am besten erst mal selbst aus, um ein Gefühl für Bedienung zu erlangen. Ich war auch kein Early Adopter, aber ich finde es ein extrem spannendes Feld, in dem ich mich definitiv noch länger aufhalten werde.
Wie stehst du dazu? Wie gut bist du mit Siri befreundet und weiß Alexa von eurer Beziehung?
Möchtest du weiterhin investigative, inspirative und inhaltlich tiefgründige Fachartikel mit journalistischen Anspruch erhalten? Dann unterstütze mich dabei – jeder Beitrag, schon ab 1 Euro, ist eine wertvolle Hilfe, um die Zukunft von toushenne.de zu sichern.
Robert ist Autor des Bestsellers „Content Design“ (Hanser Verlag), unabhängiger Content-Stratege und Gründer dieses Magazins (ehem. „toushenne.de“). Daneben lehrt er Content-Marketing an der FH JOANNEUM sowie Content Design an der ZHAW. Mit über zehn Jahren Erfahrung aus dem Agenturgeschäft, E-Commerce- & SaaS-Unternehmen sowie zahlreichen Freelance-Projekten mit führenden Marken wie Adobe, Bike24 und contentbird, entwickelt er wirksame Strategien für die Optimierung des Content ROI.