Virtuelles Handbuch Informationswissenschaft
Das Internet
World Wide Web
Andreas Placzek
Das World Wide Web ist das graphische Gegenstück zum Gopher. Während im Gopher die Daten textorientiert angelegt sind, sind die Dokumente im WWW (auch W3 genannt) als Hypertext mit Grafik, Ton etc. abgelegt. Die Hypertext Markup Language (HTML) erlaubt es Text mit Graphik, Ton und anderen Hypertextdokumenten zu verbinden. So entsteht ein Netz aus Dokumenten, in dem man sich mittels eines Browsers (z.B. Netscape, Mosaic …) bewegen kann.
Durch die graphische Orientierung ist die Informationssuche im WWW viel angenehmer als im Gopher, in den Archie-Servern usw.
Leider birgt die Grafik auch eine große Gefahr in sich: Im Vergleich zum Text belastet eine Grafik das Netz um ein vielfaches mehr. Schon heute droht das Internet unter der Last des WWW zusammenzubrechen, wie man an miserablen Übertragungsraten erkennen kann.
Die Dokumente des WWW lassen sich aber auch im Textmodus nutzen. Für den Fall, daß die Graphiken nicht relevant sind, sollte man Lynx als WWW-Browser verwenden oder den eigenen Browser im Textmodus betreiben.
Ebenfalls zu einer deutlichen Entlastung des Netzes tragen Caches bei. Man kann einen eigenen Diskcache einrichten oder im Browser einen Proxy-Server angeben, der als Cache dient. Bevor Daten von außen angefordert werden, wird dann zuerst im Cache bzw. im Proxy-Server nachgeschaut, ob das Dokument in letzter Zeit schon mal angefordert wurde. In diesem Fall wird es aus dem Cache entnommen und braucht nicht erneut von außen angefordert zu werden.
Im WWW kann man über sog. Search-Engines (Suchmaschinen) auch Recherchieren. Gesucht wird nach Indizes von HTML-Dokumenten, die auf den einzelnen WWW-Servern angeboten werden.
Diese Datenbanken werden von sog. Robotern erstellt, die rekursiv das WWW absuchen und sämtliche Dokumente indizieren.
Die bekanntesten Search-Engines sind:
http://lycos.cs.cmu.edu
http://www.yahoo.com
http://webcrawler.com
Bewertung von Suchmaschinen (März 1999)