« Back to Glossary Index

Was ist ein Index?
Der (Suchmaschinen-) Index ist der Ort, an dem alle Daten, die eine Suchmaschine (Google, Bing, Yahoo, etc.) gesammelt hat, gespeichert werden. Es ist der Suchmaschinenindex, der die Ergebnisse für die Suchanfragen liefert. Die Suchmaschinen-Indizierung ist also der Prozess einer Suchmaschine, die Daten zu sammeln, zu analysieren und zu speichern, welche von der Suchmaschine verwendet werden. Ohne einen solchen Suchmaschinenindex müssten Suchmaschinen bei jeder Suchanfrage jede Website und Datenbank durchsuchen. Aber um sicherzustellen, dass die Informationen vollständig geliefert werden, würde eine Suche nur nach den Keywords nicht ausreichen. Es müsste jedesmal jede Datenbank durchsucht werden zu der die Suchmaschine Zugang hat. Das dieses Vorgehen nicht praktikabel sein kann liegt auf der Hand. Deshalb werden von Suchmaschinen sogenannte Searchengine-Spider (auch Crawler genannt) genutzt. Crawler, scannen in bestimmten Intervallen jede Website im Web nach Informationen ab, welche anschließend im Suchmaschinenindex gespeichert werden. Ein Suchmaschinenindex besteht aus vielen verschiedenen Teilen, wie z.B. Designfaktoren und Datenstrukturen. Die Designfaktoren eines Suchmaschinenindex gestalten die Struktur dessen Struktur und diktieren damit, wie der Index funktioniert. Die einzelnen Bestandteile werden kombiniert, um den letztendlichen Index zu erstellen. Zu den Bestandteilen gehören z.B.:- Merge-Faktoren, die entscheiden, wie Informationen in den Index gelangen und ob es sich um neue oder zu aktualisierende Daten handelt.
- Die Indexgröße, die sich auf die Menge an möglichem “computing Space” bezieht, die zur Unterstützung des Indexes erforderlich ist.
- Speichertechniken die entscheiden, wie die Informationen gespeichert werden sollen. Bspw. werden größere Dateien komprimiert, während kleinere Dateien einfach gefiltert werden.