Christine Spies

     

2011 trat die Semantik erstmals im SEO-Kontext in Erscheinung. Der Sprachcomputer „Watson“ führte in der Quizshow Jeopardy vor, zu was maschinelle Sprachverarbeitung fähig ist. Als Linguistin aus dem SEO-Team der dmc.de habe ich mich natürlich sofort auf diese Neuigkeit gestürzt und die wichtigsten Erkenntnisse in einem Blogtext zusammengefasst.


::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

Suchmaschine vs. Leser - Ich lese was, was du nicht liest

07. Juni 2011     

Suchmaschinen sind auch nur Menschen. Sie sammeln Informationen und gehen dabei den Weg des geringsten Widerstandes. Sie bevorzugen Texte, die sie nicht lesen, sondern nach wichtigen Begriffen scannen. Was Suchmaschinen   jedoch (noch) von menschlichen Lesern unterscheidet, ist die Fähigkeit, komplexe semantische Zusammenhänge zu erfassen und zu deuten. Dass sich das bald  ändern könnte, hat uns erst kürzlich ein wortgewandter Sprachcomputer gezeigt.

--------------------------------------------------------------------------------------------------------------

IBM   zeigt uns, zu was elektronische Schaltkreise inzwischen fähig sind. In der Quizsendung Jeopardy verwies der findige Computer „Watson“ seine beiden menschlichen Kontrahenten auf ihre Plätze. Mit der Fähigkeit, Doppeldeutigkeiten zu verstehen, konnte er die meisten Fragen richtig beantworten und damit den Sieg einheimsen. Bisher war es möglich, einen Computer mit reinen Daten zu Füttern, die per Stichworteingabe abgerufen werden konnten. „Watson“ beweist, dass er in der Lage ist, die Bedeutung einer Frage richtig zu deuten und daraus eine Antwort abzuleiten. Eine Fähigkeit, der sich auch Suchmaschinen wie Google bedienen.

Da es hierbei nicht nur um die Verarbeitung von Einzelbegriffen geht, sprechen wir von einem Information Retrieval. Ein Vorgang, bei dem maschinell aus einer komplexen Begriffsabfolge eine Bedeutung destilliert wird, die wiederum zur Auffindung von Inhalten in Textform verwendet wird. Eine Kompetenz, die auch Suchmaschinen zu eigen ist und auf das Ranking unmittelbaren Einfluss hat.

Unfreiwillige SEO-Poesie

Mit dem Schlachtruf „content is king“ führen daher emsige Suchmaschinenoptimierer die gesteigerte Bedeutung von SEO-Texten ins Feld. Manchmal gleicht das Platzieren von Texten auf einer Website jedoch einer Gratwanderung. Wenn ursprünglich der Text auf einer Website den reinen Zweck hatte, Inhalte zu vermitteln, rückte in der Vergangenheit immer stärker dessen Funktion als „Suchmaschinen-Futter“ in den Vordergrund. Mitunter wurde dieser zum Selbstzweck und der Nutzer sieht sich auch heute noch mit sperrigen Texten konfrontiert, die alles andere als leserfreundlich sind. Schreibfehler, Keyword-Spamming und der Einsatz von standardmäßigen Floskeln führen in manchen Fällen zu unfreiwilliger Komik.

Allerdings sind die Betreiber von Suchmaschinen aktuell sehr darum bemüht (Panda Update), gerade die SEO-Texte abzustrafen, die offensichtlich nur zum Zweck der Suchmaschinenoptimierung geschrieben wurden. Google arbeitet zwar fieberhaft an der semantischen Erfassung von Texten, doch müht sich das Unternehmen vermutlicherweise gerade erst einmal am Englischen ab. Eine Sprache ist schließlich ein komplexes Gebilde, das mithilfe von Begriffen ein Bedeutungsgeflecht herstellt.

Auf der anderen Seite nutzt es auch nichts, in goetheähnlicher Manier hochliterarische Texte für die Suchmaschinenoptimierung zu verfassen. Denn diese scheren sich keinen Deut um stilistische Raffinessen. Maschinelles Sprachverständnis findet bisher ausschließlich auf der Ebene der lexikalischen Semantik statt. Metaphern verstehen sie nicht und Ironie ist ihnen vollkommen fremd. Die Fähigkeit, Texte inhaltlich zu verstehen, bewegt sich bei Suchmaschinen momentan auf dem sprachlichen Niveau eines Kleinkindes. Der Suchmaschine fehlt die Fähigkeit, die Einstellung und das Wissen des Gegenübers zu kalkulieren oder über die metasprachliche Ebene zu reflektieren.

Die nächste Phase des Spracherwerbs

Trotzdem sind jetzt schon Richtlinien, die das Leseverständnis fördern auch in der Suchmaschinenoptimierung nützlich. Am Bildschirm ist längst nicht mehr vom Lesen, sondern vom Scannen der Texte die Rede. Ein Text am Bildschirm sollte daher in der Länge ungefähr einer DIN A4 Seite entsprechen und in kleine Abschnitte untergliedert sein. Diese helfen dem Leser mit Zwischenüberschriften, auf einen Blick zu erfassen, ob der folgende Inhalt von Interesse ist.

Daher ist festzuhalten, dass die Texte vordergründing natürlich für den Nutzer und nicht für die Suchmaschinen geschrieben werden müssen. Die gängigen Suchmaschinen bewegen sich in ihrem Sprachverständnis momentan zwar noch auf einem recht niedrigen Interpretationsniveau, doch kann sich diese Sprachkompetenz schneller entwickeln, als es manchen Suchmaschinenoptimierern lieb ist.

„Watson“ hat gezeigt, dass das Sprachverständnis einer Maschine längst nicht mehr auf der lexikalischen Ebene verharrt. Wenn wir uns vorstellen, dass sich die gängigen Suchmaschinen bisher noch auf dem sprachlichen Niveaus eines Kleinkindes bewegen, dann müssen wir uns an den Gedanken gewöhnen, dass diese Maschinen auch sprachlich immer mehr dazu lernen werden. Im besten Fall sollte der Content daher jetzt schon für zukünftige Fähigkeiten der   Suchmaschinen geschrieben werden, die den Fähigkeiten eines echten Lesers ohnehin immer ähnlicher werden.