Google ermöglicht Blick ins kulturelle Genom

Hintergrund und Technik

Seit Google 2004 damit begonnen hat, weltweit Bücher einzuscannen, hat der Suchmaschinengigant bislang 15 Millionen Bücher digitalisiert. In Kooperation mit Forschern der Harvard University hat Google jetzt einen Datensatz bestehend aus 5,2 Millionen Büchern, die innerhalb der letzten 200 Jahre in sieben verschiedenen Sprachen (Englisch, Deutsch, Französisch, Spanisch, Chinesisch, Spanisch und Hebräisch) erschienen sind, erstellt und unter der Creative Commons Lizenz zum Download bereit gestellt. Eigentliches Highlight ist jedoch die Webapplikation Google Ngram Viewer mit der der riesige Datensatz von über 500 Milliarden Wörtern durchsucht werden kann. Über diese werkübergreifende Volltextsuche lässt sich in Sekundenschnelle die Entwicklung von Worthäufigkeiten über den Zeitverlauf und über die verschiedenen Sprachräume hinweg ermitteln. Nach etlichen Stunden des Ausprobierens bin ich von den Möglichkeiten des Werkzeugs (die ich zugegebenermaßen noch nicht alle durchblicke und auszuschöpfen vermag) begeistert und der Ansicht, dass Google fast stillschweigend einen forschungsmethodischen Meilenstein gesetzt hat.

Einige Anwendungsbeispiele Wortgebrauch im zeitlichen Wandel

Für den deutschen Sprachraum lässt sich die Entwicklung der Wortnennungen von Kriminologie, Kriminalbiologie, Kriminalistik und Forensik anschaulich nachvollziehen. Um 1900 tauchen die Begriffe Kriminalistik und Kriminologie vermehrt in deutschsprachigen Veröffentlichungen auf (z.B. in der Encyclopädie der Kriminalistik von Hans Gross, 1901). Die meisten Nennungen von Kriminalistik entfallen auf das Jahr 1904. Seit 1950 entfallen die meisten Nennungen auf den den Begriff Kriminologie, wobei ein deutlicher (und von wenigen kleineren Einbrüchen abgesehen) kontinuierlicher Anstieg der Nennungen von Kriminologie in deutschsprachigen Publikationen zu verzeichnen ist ...

Zum vollständigen Artikel

Cookies helfen bei der Bereitstellung unserer Dienste. Durch die Nutzung erklären Sie sich mit der Cookie-Setzung einverstanden. Mehr OK