Erinnert sich noch jemand an den Google Ngram Viewer? Dieses coole Tool, mit dem man die Häufigkeit bestimmter Begriffe zeitlich untersuchen konnte? Nein? Auch egal.
Ich finde derartige Tools einfach faszinierend und momentan sind sie wohl die beste Demonstration der Möglichkeiten der Digital Humanities – Nachforschungen, die früher unmöglich waren oder Jahre dauerten, sind jetzt innerhalb von Sekunden möglich. Für jeden, ohne Zugang zu einer Bibliothek, ohne großen Aufwand, einfach so. Will man wissen, ab wann etwa der Erste Weltkrieg als Weltkrieg bezeichnet wird, kann man dies in Sekunden herausfinden.
Der Google Ngram Viewer nutzt die immense Datenbank von Google Books, differenziert aber leider nicht zwischen verschiedenen Genres. Es ist ein Unterschied, ob ein Begriff in der Fachliteratur, der Populärliteratur oder in Romanen auftaucht. Es gibt einige Dienste wie Jstors Data for Research, welche sich etwa auf wissenschaftliche Artikel konzentrieren.
Viel umfangreicher ist Bookworm, welches ebenfalls zum Culturomics-Projekt gehört: Es nutzt die frei verfügbaren, urheberrechtsfreien Bücher des Internet Archives und der Open Library. Dies hat den Vorteil, dass man die Bücher nach unzähligen verschiedenen Kategorien differenzieren kann. Da gibt es nicht nur Science, sondern auch Military Science, es gibt die Social Sciences, eine Unterscheidung nach Erscheinungsland, Sprache, Thema etc.
All of our site builds on the amazing work of the Open Library and Internet Archive projects. The Internet Archive makes scans of books publically available to the public with Optical Character Recognition already perfomed. The books come mostly from major research libraries and are scanned by the Internet Archive itself, Google, Microsoft and other scanning initiatives. The Open Library is the Internet Archive’s cataloging wing; they hope to create a publically editable library catalogue with an entry for every book ever published. We try to include all the books available bothe Open Library and the Internet Archive. Currently, that means about 950,000 books. When you build a corpus, you can see exactly how many books you are searching in the construction box.
Das Ergebnis ist ein Abfragetool, mit dem man erstaunliche Ergebnisse herausfinden kann – oder auch nicht, denn auch hier schlägt der Fluch jedes Historikers wieder gnadenlos zu: Je genauer man hinschaut, je feinjustierter die Abfragen, je durchdachter die Nachfrage, desto mehrdeutiger, unklarer und komplexer wird auch die Antwort.
Leider behindert auch hier das Urheberrecht mal wieder die Forschung: Da aktuelle Bücher noch geschützt sind, können sie hier nicht verwendet werden. Die Abfragen sind also nur bis ca. 1922 korrekt, danach werden die Daten schwammig.
Danke für die nützliche Zusammenstellung, bookworm kannte ich noch nicht.
Pingback: Visualisierungstools | Cultural Sources of Newness
Pingback: Netzfunde vom 12.2. bis zum 18.2. - "Nächstens mehr."