Was ist ein Stop-Word (Stoppwort)?
Stop-Words sind Wörter, die bei der Verarbeitung natürlicher Sprache häufig als irrelevant angesehen werden. Sie werden oft aus Suchanfragen entfernt, bevor die Daten zur weiteren Verarbeitung weitergeleitet werden. Dazu gehören Wörter wie “der”, “die” und “das”. Diese Wörter sind nützlich, um die Anzahl der relevanten Wörter einzuschränken, die für die Verarbeitung der Sprache benötigt werden.
In der SEO-Terminologie sind dies die häufigsten Wörter, die die meisten Suchmaschinen vermeiden und sparen Platz und Zeit bei der Verarbeitung großer Datenmengen beim Crawlen oder Indizieren. Dies hilft Suchmaschinen, Platz in ihren Datenbanken zu sparen.
Sagen wir zum Beispiel wenn Sie nach einer Anfrage suchen “Wie man einen Kuchen backt”. Suchmaschinen ignorieren in der Regel: “Wie”, “man” und “einen” Wörter und suchen gezielt nach “backt “+”kuchen”.
Vorteile von Stop-Words
Stop-Words haben den Vorteil, dass sie die Verarbeitung natürlicher Sprache vereinfachen und die verfügbaren Ressourcen effektiver nutzen. Sie werden häufig verwendet, um die Anzahl der relevanten Wörter zu reduzieren, die für die Verarbeitung der Sprache benötigt werden. Dadurch wird die Geschwindigkeit und Genauigkeit der Verarbeitung verbessert.
Nachteile von Stop-Words
Stop-Words können einige nützliche Informationen aus den Daten entfernen. Während sie häufig verwendet werden, um die Anzahl der relevanten Wörter zu reduzieren, die für die Verarbeitung der Sprache benötigt werden, können sie auch wichtige Kontextinformationen entfernen, die für die Verarbeitung der Sprache wichtig sein können.
Anwendungsfälle von Stop-Words
Stop-Words werden häufig in Suchmaschinen, Chatbots und anderen Anwendungen verwendet, die natürliche Sprache verarbeiten. Sie werden verwendet, um die Anzahl der relevanten Wörter zu reduzieren, die für die Verarbeitung der Sprache benötigt werden. Sie können auch verwendet werden, um unerwünschte Wörter aus Texten zu entfernen, bevor sie weiterverarbeitet werden.
Beispiele von Stop-Words
Häufig verwendete Stop-Words sind: “der”, “die”, “das”, “ein”, “eine”, “sein”, “sie”, “es”, “ist” und “haben”. Dies sind häufig vorkommende Wörter, die bei der Verarbeitung natürlicher Sprache als irrelevant betrachtet werden.
Google Hummingbird und Stop-Words
Das Hummingbird Update brachte eine signifikante Änderung des Google-Algorithmus im Jahr 2013. Hummingbird wirkt sich stark auf natürliche Sprachfragen aus, insbesondere wenn es um Kontext und Bedeutung über einzelne Keywords geht. Es werden auch Inhalte auf einzelnen Seiten einer Website genauer betrachtet. Dadurch wird die Wahrscheinlichkeit verbessert, Suchergebnisse zu liefern, die optimal die geeignete Seite und nicht nur eine Homepage enthalten.
Das Update markierte den wichtigsten sematischen Einschnitt der Google-Suche seit vielen Jahren für benutzerfreundlicheren Suchinteraktionen. So wurden Verleger und Autoren ermutigt, ihre Websites mit natürlichem Schreiben zu optimieren, anstatt mit erzwungenen Keywords und Keyword-Stuffing zu Rankings zu gelangen.
Dieses Update ermöglichte es Google, den Inhalt der Webseite besser zu verstehen. Nun kann Google Stoppwörter besser als bisher handhaben. Mit Hummingbird kann Google auch deutlich besser mit Long Tail Keywords umgehen.
Wie Stoppwörter die SEO beeinflussen können
Generell schaden Stop-Words Ihrer SEO in der Regel nicht. Es wird jedoch bevorzugt, Stoppwörter zu vermeiden, um lange Titel oder URLs zu vermeiden. Stoppwörter können Platz verschwenden. Dies ist umso wichtiger, wenn das Suchergebnis Ihre URL, Ihren Titel oder Ihre Beschreibung aufgrund umfangreicher Inhalte nicht vollständig anzeigt. Daher wird empfohlen, Stoppwörter von On-Page-SEO-Faktoren wie URLs, Titeln und Beschreibungen nach Möglichkeit zu vermeiden, ohne die Lesbarkeit zu beeinträchtigen.
Vermeiden Sie im Folgenden die Verwendung von Stoppwörtern:
- Seitentitel-Tags
- URLs von Webseiten
- Metabeschreibungen (Nur falls keine Beeinträchtigung der Lesbarkeit)
- Bild Alt Text
- Schlüsselwörter (falls vorhanden)
Arten von Stoppwörtern
Stoppwörter werden im Allgemeinen als “ein einziger Satz von Wörtern” betrachtet. Sie können für verschiedene Anwendungen wirklich unterschiedliche Bedeutungen haben. Zum Beispiel kann in einigen Anwendungen das Entfernen aller Stoppwörter direkt von den Determinanten (z.B. das, a, an) über Präpositionen (z.B. oben, quer, vorher) bis hin zu einigen Adjektiven (z.B. gut, nett) eine geeignete Stoppwörter Liste sein.
Für einige Anwendungen kann dies jedoch nachteilig sein. Beispielsweise kann das Entfernen von Adjektivbegriffen wie “gut” und “nett” sowie Negationen wie “nicht” bei der Stimmungsanalyse Algorithmen aus der Bahn werfen. In solchen Fällen kann man je nach den Erfordernissen der Anwendung wählen, ob man eine minimale Stoppwörter Liste verwenden möchte, die nur aus Determinanten oder Determinanten mit Präpositionen oder nur aus koordinierenden Konjunktionen besteht.
Beispiele für kleine Stop-Word – Listen, die man verwenden kann:
- Determinanten – Determinanten neigen dazu, Substantive zu markieren, wobei auf einen Determinanten normalerweise ein Substantiv folgt
Beispiele: das, a, an, ein anderes - Koordinierende Konjunktionen – Koordinierende Konjunktionen verbinden Wörter, Sätze und Klauseln
Beispiele: für, ein, noch, aber, oder, noch, so - Präpositionen – Präpositionen drücken zeitliche oder räumliche Beziehungen aus
Beispiele: in, unter, gegen, vor
In einigen domänenspezifischen Fällen, wie z.B. bei klinischen Texten, kann es sein, dass wir einen ganz anderen Satz von Stoppwörtern wünschen. Zum Beispiel können Begriffe wie “mcg”, “dr” und “Patient” im Vergleich zu Begriffen wie “Herz”, “Herzinsuffizienz” und “Diabetes” eine geringere Unterscheidungskraft bei der Erstellung intelligenter Anwendungen haben. In solchen Fällen können wir auch domänenspezifische Stoppwörter konstruieren, im Gegensatz zur Verwendung einer veröffentlichten Stopword Liste.
Fazit
Stop-Words sind nützlich, um die Anzahl der relevanten Wörter zu reduzieren, die für die Verarbeitung der Sprache benötigt werden. Dies kann die Geschwindigkeit und Genauigkeit der Verarbeitung verbessern. Sie können jedoch auch wichtige Kontextinformationen entfernen, die für die Verarbeitung der Sprache wichtig sein können. Stop-Words werden häufig in Suchmaschinen, Chatbots und anderen Anwendungen verwendet, die natürliche Sprache verarbeiten.
" Zurück zum Glossar-Index