Diese Website ist seit dem Ende des Studiengangs Informationswissenschaft
im Juni 2014 archiviert und wird nicht mehr aktualisiert.
Bei technischen Fragen: Sascha Beck - s AT saschabeck PUNKT ch
Drucken

Projekte

Buchbesprechungen

William T. Arms: Digital Libraries

9. Text

  • Converting Text
  • Style Sheets
  • Panel 9.1: The Oxford English Dictionnary
  • Panel 9.5: Cascading Style Sheets and Extensible Style Language
  • Encoding Characters
  • ASCII
  • TeX
  • Unicode
  • PostScript
  • Panel 9.2: Scripts Represented in Unicode
  • Portable Document Format
  • Transliteration
  • Panel 9.6: Portable Document Format
  • SGML
  • Structure versus Appearance of Documents
  • Panel 9.3: DTDs for Scholarship
  • Panel 9.4: Features of HTML
  • XML




Textmaterial hat in jeder Bibliothek einen besonderen Platz, digitale Bibliotheken eingeschlossen. Textdokumente in digitalen Bibliotheken stammen aus verschiedenen Quellen. Sie sind f�r die Online-Nutzung erstellt worden, wurden von Print- oder anderen Medien konvertiert. Diese Kapitel beschreibt wie Textdokumente zur Speicherung in Computern dargestellt werden und wie sie dem Nutzer zum Drucken und Anzeigen vorgelegt werden.

Methoden zur Speicherung von Textmaterial m�ssen zwei Aspekte beachten: die Struktur und das Erscheinungsbild eines Dokuments.
Die Struktur beschreibt die Aufteilung eines Textes in Elemente wie Buchstaben, W�rter, Abs�tze und �berschriften. Sie benennt Teile des Dokuments, die betont sind, Tabellen oder Fu�noten. Der in Computern gespeicherte Text wird oft durch Markup Beschreibung dargestellt. In den letzten Jahren wird weitestgehend SGML (Standard Generalized Markup Language) f�r die Strukturbeschreibung akzeptiert.
Das Erscheinungsbild zeigt das Aussehen eines Dokuments bei der Anzeige an einem Bildschirm oder beim Druck auf Papier. Es bezieht sich auf die Wahl des Formats, Schrift und Gr�sse, Seitenr�nder und Zeilenabst�nde oder die Darstellung von �berschriften. Page description languages dienen dazu, Dokumente zu speichern und vorzulegen, und zwar so, dass das Erscheinungsbild genau beschrieben wird. In diesem Kapitel beschreibt der Autor drei verschiedene Ans�tze zur Seitenbeschreibung: TeX, Postscript und PDF.

nach oben

Die erste der drei Sprachen wurde um 1980 entwickelt. Das Ziel war, Drucken mit hoher Qualit�t zu erreichen, mit besonderer Betonung auf der Mathematik. TeX stellt Regeln zur Enkodierung von Mathematik als Sequenz von ASCII-Charakteren bereit, zur Eingabe, Speicherung und Bearbeitung durch den Computer, mit „tags“ zur Anzeige des Formats.
Postscript ist ein Produkt von Adobe Systems. Es ist eine Programmiersprache f�r graphischen Druck und wurde auf dem Gebiet der Laser Drucker verwendet. Es hatte aber auch Verwendung im Speichern und Austauschen von Texten oder Graphiken.
Mit der Erfahrung von PostScript entwickelte Adobe Portable Document Format (PDF), ein besseres Format zur Speicherung von Bildern in einem beweglichen Format, das unabh�ngig von jeweiligen Computer-System und seinen Anwendungen ist. PDF ist heute die beliebteste Seitenbeschreibungssprache, mit einem wirkungsvollen Format und Werkzeugen zum Erstellen, Speichern und Anzeigen von Dokumenten. Die meisten PDF-Dokumente sind bei einer Anzeige am Bildschirm sehr leicht zu lesen. Die PDF-Anzeige Applikation wird von Adobe kostenlos zur Verf�gung gestellt, so wird nicht der User zur Kasse gebeten.

Markup languages beschreiben die strukturellen Elemente eines Dokuments, wohingegen Style Sheets das Erscheinungsbild eines Dokuments bestimmen, wenn es am Bildschirm angezeigt oder gedruckt wird. Cascading Style Sheets (CSS) wurden zur Verwendung in HTML entwickelt. Ein CSS style sheet ist eine Aufstellung von Regeln, die zu bestimmten Elementen in einem Dokument hinzugef&uumlgt werden, um das Erscheinungsbild zu bestimmen. Der Autor veranschaulicht dies noch in Beispielen in Panel 9.5.

nach oben