Suchmaschine
baut in Data Center eines Rechenzentrums eine
Buchdatenbank
auf
Die Literatur
ist etwa so alt wie der Mensch denken kann. Es scheint ein
ewiges Bedürfnis der Menschen gewesen zu sein, das Erlebte
weiterzugeben, Geschichten zu erzählen und Ereignisse
festzuhalten. Wurden früher Geschichten, Erzählungen und
Überlieferungen buchstäblich in Stein gemeißelt, waren es
später Lederfälle, auf denen mit Tierblut Zeichnungen und
Symbole gezeichnet wurden. Die alten Ägypter erfanden die erste
Schriftsprache und nachdem auch sie viele ihrer Texte auf
Steinen zu verewigen versuchten, folgten später
Pergamentpapiere, die einen weltweiten Erfolg haben
sollten.
Tatsächlich
wird auch heute noch, im multimedialen Zeitalter, vieles noch
zu Papier gebracht was für die Nachwelt erhalten bleiben soll.
Papier hält aber – wie Stein, eine Diskette oder andere
einfache Aufzeichnungsmethoden, nicht ewig. So kennen alle
Formen der Aufzeichnung ein Verfalldatum, doch scheint man nun
mit den technischen Möglichkeiten eines Rechenzentrums erstmals
die Möglichkeit zu haben einmal eingespeiste Daten für ewig
aufbewahren zu können. Im Gegensatz zu einem alten Buch, können
elektrische Daten nämlich unzählige Male reproduziert werden
und bleiben so für immer erhalten. So werden literarische Werke
heutzutage allesamt digitalisiert. Zur Unterhaltung der
Konsumenten werden sie von bekannten Stimmen vorgelesen und auf
einer CD gespeichert. Für die visuelle Erhaltung werden seit
vielen Jahren mehrere Datenbanken gepflegt, in welche nicht nur
wichtige Dokumente aus früheren Zeiten abgelegt werden, sondern
auch neue Werke digitalisiert werden können.
Viele dieser
Schriftstücke sind, mindestens auszugsweise, im weltweiten Netz
verfügbar. Diese zu finden und als wertvolle Sammlung zu
erkennen, ist eine große Herausforderung, die sich auch für
Suchmaschinen stellt. Ziel einer Suchmaschine ist es, in einem
Data Center eines Rechenzentrums eine
Literatur Datenbank aufzubauen, in dem ganze Bücher
gespeichert werden. Dazu wird die so genannte Searchengine
mit vielen Technologien, wie Scanner, Texterkennung und
Indiziermethoden unterstützt. Der wichtigste Faktor kommt
aber der Speicherkapazität in einem Rechenzentrum zu: Hier
müssen alle Informationen des Data Center gespeichert werden
und zwar an mehreren Orten, getrennt durch brandsichere
Wände und auch so, dass natürliche und künstliche
Umwelteinflüsse jeder Art keine negative Auswirkungen auf
die Erhaltung der Daten nehmen können. Dass diese wichtige
Aufgabe seinen Preis hat und auch an die Leistungsgrenze der
Hardware große Ansprüche stellt, steht außer Frage. Dass
damit die Geschichte der Menschheit, das Erbgut der
Zivilisation für die Ewigkeit erhalten bleibt, macht diese
Maßnahmen aber unumgänglich und auch nützlich.
Die Betreiber
der Suchmaschine möchten nun den Zugang zu den schriftlichen
Informationen gewährleisten und ein rasches Finden ermöglichen.
Alleine für die Erstellung der dafür nötigen Indexierungen
werden im Rechenzentrum eine Vielzahl Computer
benötigt. Die Datenbanken werden von mehreren Hundert
Angestellten gepflegt und regelmäßig aktualisiert. Bücher
die eingelesen werden bleiben natürlich urheberrechtlich
geschützt. Dank der elektronischen Erhaltung werden diese
Werke aber noch viele Jahrhunderte nach dem möglichen Ende
der Menschheit erhalten bleiben und späteren Zivilisationen
von großer Hilfe sein.
Mit so viel
Weitsichtigkeit baut die Suchmaschine aber ihre Literatur
Datenbank noch nicht auf. Zuerst gilt es alle verfügbaren
Bücher zu digitalisieren und sie der breiten Öffentlichkeit
zugänglich zu machen. Dazu wird im Data Center eines riesigen
Rechenzentrums eine Buchdatenbank aufgebaut, die es in den
kommenden Jahren auszubauen und zu pflegen gilt.
|