Was sind strukturierte Daten?
Die Strukturierte Daten befinden sich in der Regel in relationalen Datenbanken (RDBMS). Darin speichern Felder längenbezogene Datentelefonnummern, Sozialversicherungsnummern oder Postleitzahlen. Sogar Texte von variabler Länge wie Namen sind in Datensätzen enthalten, so dass die Suche einfach ist. Hierbei können Daten von Menschen oder Maschinen erzeugt werden, solange die Daten innerhalb einer RDBMS-Struktur erstellt werden. Dieses Format ist sowohl mit vom Menschen generierten Abfragen als auch über Algorithmen mit Datentyp und Feldnamen, wie z.B. alphabetisch oder numerisch, Währung oder Datum, hervorragend durchsuchbar.
Zu den gängigen relationalen Datenbankanwendungen mit strukturierten Daten gehören Reservierungssysteme für Fluggesellschaften, Bestandskontrolle, Verkaufstransaktionen und ATM-Aktivitäten. Structured Query Language (SQL) ermöglicht die Abfrage dieser Art von strukturierten Daten in relationalen Datenbanken.
Einige relationale Datenbanken speichern oder verweisen auf unstrukturierte Daten wie z.B. Customer Relationship Management (CRM)-Anwendungen. Die Integration kann bestenfalls umständlich sein, da sich Memofelder nicht an traditionelle Datenbankabfragen anlehnen. Dennoch sind die meisten CRM-Daten strukturiert.
Was sind unstrukturierte Daten?
Unstrukturierte Daten sind im Wesentlichen alles andere. Unstrukturierte Daten haben eine interne Struktur, sind aber nicht über vordefinierte Datenmodelle oder Schemata strukturiert. Es kann textuell oder nicht-textuell sein und von Menschen oder Maschinen erzeugt werden. Es kann auch in einer nicht-relationalen Datenbank wie NoSQL gespeichert werden.
Strukturierte vs. unstrukturierte Daten: Worin besteht der Unterschied?
Neben dem offensichtlichen Unterschied zwischen dem Speichern in einer relationalen Datenbank und dem Speichern außerhalb einer Datenbank besteht der größte Unterschied in der einfachen Analyse strukturierter Daten gegenüber unstrukturierten Daten. Reife Analysetools gibt es für strukturierte Daten, aber Analysetools für die Gewinnung unstrukturierter Daten entstehen und entwickeln sich.
Die Benutzer können einfache Inhaltssuchen über textuelle unstrukturierte Daten durchführen. Jedoch der Mangel an geordneter interner Struktur widerspricht dem Zweck traditioneller Data-Mining-Tools, und das Unternehmen erhält wenig Mehrwert aus potenziell wertvollen Datenquellen wie Rich Media, Netzwerk- oder Weblogs, Kundeninteraktionen und Social-Media-Daten. Auch wenn unstrukturierte Datenanalysetools auf dem Markt sind, ist kein einziger Anbieter oder Toolset ein klarer Gewinner. Und viele Kunden zögern, in Analysetools mit unsicheren Entwicklungs-Roadmaps zu investieren.
Hinzu kommt, dass es einfach viel mehr unstrukturierte Daten als strukturierte gibt. Unstrukturierte Daten machen 80% und mehr der Unternehmensdaten aus und wachsen mit einer Rate von 55% bzw. 65% pro Jahr.
" Zurück zum Glossar-Index