Diese Website ist seit dem Ende des Studiengangs Informationswissenschaft
im Juni 2014 archiviert und wird nicht mehr aktualisiert.
Bei technischen Fragen: Sascha Beck - s AT saschabeck PUNKT ch
Drucken

Projekte

Buchbesprechungen

William T. Arms: Digital Libraries

4. Innovation and Research

  • Panel 4.1: The Coalition for Network Information
  • Organisation
  • Panel 4.2: The Digital Libraries Initiative
  • Archiving and Preservation
  • Object Models
  • User Interfaces and Human-Computer Interaction
  • Conversion
  • Descriptive Metadata: Cataloging and Indexing
  • Scale
  • Natural-Language Processing
  • Reliability and Robustness
  • Non-textual Material
  • Managing and Preserving Collections
  • Research around the World





Innovation durch Bibliotheken und Publisher ist bei weitem nicht systematisch. Meistens fehlt es an Geldern f�r Forschung und Entwicklung. Publisher steuern nicht viel zur Forschung bei, obwohl sie dem Markt viele Ideen zuf�hren. Gro�e Verlage haben die Mittel, um gr��ere Investitionen in neue Ideen zu stecken. doch Projekte werden hier als Gesch�ftsentwicklung betrachtet, nicht als Forschung. Der Trend, wissenschaftliche Zeitschriften online zug�nglich zu machen, kann nicht als Forschung bezeichnet werden. Bibliotheken neigen dazu, innovativer zu sein, obwohl sie oft schlecht organisiert erscheinen. Fast das gesamte Budget wird in gegenw�rtige Aktivit�ten gesteckt. Innovation wird h�ufig als ein Extra angesehen, nicht als der Schl�ssel f�r die Zukunft. Gro�e Bibliotheken verf�gen �ber gro�e Budgets, die jedoch so unflexibel sind, dass Forschung und Innovation d�nn bestetzt sind.

Das Library of Congess National Library Program ist wahrscheinlich das wichtigste Bibliothek-Projekt in den USA. Es ist ein Beispiel daf�r, wie sich eine Bibliothek trotz ihrer traditionellen Rolle vergr��ern kann. Die Sammlungen werden mit neuen Materialien verwaltet und stellen gr��eren Zugang bereit. Und doch stellt die die Library of Congress wenig finanzielle Mittel bereit. Die meisten Gelder kommen aus privaten Foundations und anderen Spenden, die Mitarbeiter sind in Kurzzeitvertr�gen gebunden.
Bibliotheken ver�ndern sich auf breiter Front, insbesondere an Universit�ten. Viele Projekte haben ihren Ursprung in Universtit�tsbibliotheken. Einige konvertieren Materialien in digitale Formate, andere arbeiten mit Publizisten zusammen, um Materialien online zug�nglich zu machen. Die meisten Projekte werden durch Fonds aus Foundations, Industrie und der Regierung erm�glicht.

nach oben

Bis in die 90er waren digitale Bibliotheken nicht ausschlie�lich Thema der Forschung der Regierung. 1992 gr�ndete DARPA das Computer Science Technical Reports Projekt, das von der Coporation for National Research Initiatives koordoniert wurde und f�nf Bibliotehken einbezog: Carnegie Mellon, Cornell, MIT, Stanford und Berkeley. Die Initiative, die das Gebiet digitale Bibliotheken als Forschungsfeld etablierte, wurde 1994 durch NSF, DARPA und die National Aeronautic and Space Agency geschaffen: die Digital Libraries Iniative. So wurde internationale Aufmerksamkeit auf das Forschungsgebiet der digitalen Bibliotheken gezogen. In Panel 4.2 vertieft Arms die einzelnen Projekte an den Universit�ten.

Mit Information Discovery bezeichnet der Autor das generelle Problem des Auffindens von Information, wobei in digitalen Bibliotheken Information Retrieval und Browsing vermischt werden. Die meisten dieser Information Discovery-Systeme nutzen Katalog- oder Indexierungsmetadaten, die von Experten wie Bibliotheksindexierern oder Abstract- und Indexingdienste erstellt werden. Manuelles Indexieren ist jedoch zu langsam und teuer. Die gro�en Mengen an Material, das sich stetig ver�ndert, erfordert andere Ma�nahmen. Einige Metadaten werden automatisch generiert, andere durch ausgebildete Spezialisten, wiederum andere durch weniger erfahrenen Leute oder einfach durch Bitten des Erstellers der digitalen Information, die Metadaten mitzuliefern. Diese k�nnen dan in ein automatisches Indexierungssystem eingegeben werden. Die Forschung f�r automatisches Indexieren nutzt Computerprogramme um digitale Objekte zu scannen, die Information herauszuziehen und einen durchsuchbaren Index zu genenerieren. Suchmaschinen wie Alta Vista, Lycos und Infoseek sind Produkte dieser Forschungsarbeit.

nach oben

Textsuche h�ngt davon ab, ob das Suchprogramm Sprachstrukturen versteht. Relevante Forschung in der Computerlinguistik beinhaltet dabei das automatische parsing, um grammatische Strukturen zu identifizieren, oder arbeiten an der Morphologie, um Wortvarianten zu erfassen. Die meisten Methoden der Informationssuche nutzen Text, doch es werden Fortschritte erziehlt, um spezifische Inhalte in anderen Formaten zu erfassen. Die Spracherkennung wird gerade erst f�r die Indexierung von Radioprogrammen und Videos nutzbar. Derzeit wird auch intensiv an der Bilderkennung zur Erfassung von Bildmerkmalen geforscht.

Die Langzeitaufbewahrung von digitalem Material ist zeit kurzem ein Hauptforschungsfeld auf dem Gebiet der Verwaltung von Sammlungen. Die Speichermedien f�r digitale Daten sind – im Vergleich zu physischen Material wie B�cher – eher kurzlebig. Die Daten m�ssen periodisch in andere Medien kopiert werden. Erschwerend kommt hinzu, da� die Formate, in denen Informationen gespeichert sind, h�ufig durch neuere Versionen ersetzt werden. Text- und Bildverarbeitungsprogramme, die noch vor zehn Jahren allgemein gebr�uchlich waren, sind heute schwer zu verwenden und der Nutzer hat Probleme, archiviertes Material anzuzeigen.

Eine weitere Herausforderung f�r digitale Bibliotheken ist die Interoperabilit�t – wie bringt man die Vielfalt der Computersysteme dazu, zusammenzuarbeiten? Weltweit sind viele unabh�ngig verwaltete digitale Bibliotheken geschaffen worden. Diese haben verschiedene Verwaltungsvorschriften und Computersysteme. Interoperabilit�t und Standardisierung sind eng miteinander verbunden. Der Proze� der Schaffung von internationalen Standards ist jedoch f�r die kurzlebige digitale Welt zu langsam. F�r Interoperabilit�t gibt es verschiedene Aspekte.

User interfaces – Der Nutzer soll sich unah�ngig von Computersystem und der Handhabung von Sammlungen Materialien aus digitalen Bibliotheken beschaffen k�nnen.

Naming and identification – Arms zufolge gibt es keine ausreichenden Wege, um Materialien in digitalen Bibliotheken zu identifizieren. Es gibt zwar URLs zur Anzeige der Location, doch es werden Identifier f�r das darin enthaltene Material ben�tigt. Location unabh�ngige Identifier werden auch Uniform Resource Names (URN) genannt.

Formats – Es werden Materialien in allen bekannten digitalen Formaten gespeichert. Durch das Internet haben sich Formate wie HTML f�r Text, GIF und JPEG f�r Bilder dals Standard durchgesetzt. Dahinter gibt es jedoch wenig �bereinstimmungen in Bezug auf die Interoperabilit�t.

Metadata – Metadaten werden h�ufig in drei Kategorien aufgeteilt:
Descriptive Metadata, f�r bibliographische Zwecke und zur Suche und Retrieval.
Structural Metadata, das verschiedene Objekte miteineander verbindet.
Administrative Metadata, zur Verwaltung der Sammlungen und zur Kontrolle des Zugriffs.
Da Metadaten zwischen Computern ausgetauscht werden, wird eine �bereinstimmung bei der Benennung der Metadatenfelder und der Formate, mit denen diese generiert werden ben�tigt, zumindest aber eine gewisse semantische �bereinstimmung.

Distributed Searching – Der Nutzer will h�ufig Informationen finden, die auf viele Sammlungen verteilt ist, was jedoch zu Problemen f�hren kann. Denn obwohl die Sammlungen etwa gleich organisiert sind, variieren die Metadaten oder die verf�gbaren Suchm�glichkeiten. Bisher wollte man erreichen, dass alle Sammlungen einen Standard f�r Metadaten befolgen und die gleichen Suchprotokolle. Heute h�lt man dies in der Forschung f�r unrealistisch.

Network Protocols – Auch auf der Netzwerk-Ebene ist Interoperabilit�t erforderlich, da die Internetprotokolle Schw�chen bei der �bertragung von gro�en Datenmengen zeigen.

nach oben

Retrieval Protocols – Neben dem einfachen Internetprotokoll HTTP gibt es noch Komplexere. Ideal w�re ein Protokoll, das die Authentifikation der beiden „kommunizierenden“ Computer unterst�tzt, erweiterte Suchm�glichkeiten, um gegenseitig Informationen zu finden, mehrere Suchm�glichkeiten, Methoden zur Speicherung und Modifizierung von Zwischenergebnissen, sowie eine Oberfl�che f�r verschiedene Formate und Vorg�nge.

Authentication and Security – Eines der gr��ten Probleme in puncto Interoperabilbit�t zwischen digitalen Bibliotheken stellt die Authentizit�t bez�glich der Nutzer, der Computer und des Materials in Bibliotheken dar.

Semantic Interoperability – Computer ben�tigen einheitliche semantische Interpretationen der ausgetauschten Daten und Informationen.

Interoperabilit�t ist Arms zufolge leicht zu beschreiben, doch schwer erreichbar. Wenn neue Konzepte mit Verbesserungen entwickelt werden, sind sie schwer einzuf�hren. Neue Methoden sollten funktionell sein und dennoch nicht zu teuer sein.

Digitale Bibliotheken h�ngen von komplexen sozialen �konomischen und gesetzlichen Rahmenbedingungen ab. Die gesetzlichen Bereiche gehen von national bis international und beinhalten Copyright, Kommunikation, Moral oder nationale Sicherheit. Die sozialen Komponenten reichen von Autorenschaft, Eigentum, Authenizit�t oder Integrit�t.
Bibliotheken und Publizisten wollen den Zugriff zu ihrem Material kontrollieren. Diesen Vorgang kann man als access management bezeichnen, da der Bereich „Zugriff“ nicht nur Copyrightkontrolle oder Verdienst beinhaltet. Viele Methoden des Access Management beinhalten auch Kodierung. Dies ist ein komplexes Feld, indem Technologie, Gesetze und allgemeine Grunds�tze eng miteinander verkn�pft sind.

Digitale Bibliotheken und die Forschung auf diesem Gebiet sind ein weltweites Ph�nomen. Artikel �ber Forschung zu digitalen Bibliotheken, die monatlich im D-Lib Magazine ver�ffentlicht werden, zeigen die Internationalit�t dieses Feldes.

nach oben