Suchdienste oder Wie finde ich Informationen im Internet?

Transcription

Suchdienste oder Wie finde ich Informationen im Internet?
Suchdienste oder Wie finde ich Informationen im Internet?
http://www.ub.ruhr-uni-bochum.de/DigiBib/Schulung/SuchmaschinenSchulung.doc
Stand: 12.03.2003
Grundlagen:
Internet:
Das Internet verknüpft alle Rechner weltweit, die online kommunizieren können, miteinander.
Die Kommunikation funktioniert mit einem Datenübertragungsprotokoll, das sich TCP nennt.
Um die Kommunikation der Rechner miteinander zu ermöglichen, braucht man jedoch nicht
nur ein Datenübertragungsprotokoll, sondern man benötigt auch eine Kennzeichnung von
Absender und Empfänger der Daten. Eine solche Kennzeichnung erfolgt über die IP-Adresse
(Internet Protocol-Adresse).
Jeder am Internet angeschlossene Computer hat eine solche weltweit einmalige Nummer.
Das System der IP-Adressierung ist vergleichbar mit dem der Telefonnummern. Eine IPAdresse besteht aus vier Zahlengruppen, die durch Punkte voneinander getrennt sind, und
könnte folgendermaßen aussehen:
134.147.50.100
134
147
247
1
Class Class Class
PC
A
B
C
Der vordere Teil der IP-Adresse bestimmt das Netz, in dem sich der zugehörige Rechner
befindet, die letzte Zahlengruppe bezeichnet einen einzelnen Rechner innerhalb des
Netzwerkes.
Auf diese Weise können theoretisch alle Informationen, also Dokumente, Dateien u.ä., die auf
allen Online-Rechnern weltweit liegen, auch von allen anderen Rechnern weltweit genutzt
werden. Das heißt aber auch, dass das Internet lediglich das Kommunikationsmedium ist,
selber aber keine Daten bereit hält.
Word Wide Web (WWW):
Das WWW umfasst alle Informationen, die via Internet zur Verfügung gestellt werden. Um
diese Informationen nutzen zu können, braucht man einen Zugang zum Internet. Dies
geschieht üblicherweise über eine Verbindung (Telefon, Funk u.ä.) zu einen sogenannten
Internet Service Provider (ISP), der den Zugang zum Internet zur Verfügung stellt.
Um Dokumente im WWW, sogenannte Webseiten, zu betrachten, benötigt man einen
Browser, der die „Sprache“ der Seiten, überwiegend HTML (Hypertext markup language),
sichtbar macht. HTML ermöglicht nicht nur die Darstellung von Text und die
Implementierung von Bildern, Tabellen und anderen Dateien, z.B. Videos, sondern bietet vor
allem „Links“.
Links stellen die Verbindung zwischen verschiedenen Webseiten her, die mittels Mausklick
aktiviert werden und direkt zu der verlinkten Webseite führen.
Uniform resource locator (URL):
Die Links arbeiten mittels URL’s. Jede Seite im WWW hat eine solche eindeutige „Adresse“.
URL’s basieren auf den oben beschriebenen IP’s der einzelnen Rechner. Der Internetnutzer
bekommt die IP-Adresse in der Regel nicht zu sehen, da sie meistens durch einen Hostnamen
ersetzt wurde. Ein solcher Hostname ist beispielsweise www.ub.ruhr-uni-bochum.de.
Eine URL besteht mindestens aus dem Übertragungsprotokoll und dem Hostnamen.
Gegebenfalls werden noch Verzeichnisnamen und ein Dateiname hinzugefügt:
http:// www. ruhr-uni-bochum.de/ Suche/
Start.htm
Das Übertragungsprotokoll legt fest, welcher Internetdienst genutzt werden soll. Das WWW
(World Wide Web) wird mit "http" (HyperText Transfer Protocol) angesteuert. Weitere
Internetdienste sind z.B. E-Mail und Dateitransfer mittels ftp (File Tranfer Protocol). Die
Endung des Hostnamens heißt Top-Level-Domain. Es handelt sich entweder um eine
Länderkennung oder eine allgemeine Bezeichnung.
Länderkennungen
(Country Code
Domains):
Allgemeine Kennungen
(Generic Domains):
de = Deutschland
at = Österreich
ch = Schweiz
...
Index
com = Kommerziell orientierter
Namensinhaber
org = Organisation
net = Allgemeines Netz
edu = Amerikanische Hochschulen
gov = Amerikanische Behörden
mil = Amerikanische Militäreinrichtungen
...
Wozu überhaupt Suchdienste?
Das weltweit zugängliche WWW enthält mehr als 7 Milliarden Web-Dokumente, zu denen
täglich ca. 7,3 Millionen neue Seiten hinzu kommen. Außerdem ändern sich täglich ungefähr
40 % der Seiten. Hier Informationen zu finden ist fast unmöglich, da es keinen zentralen
Index oder ähnliches gibt, dass die Webseiten erfasst und strukturiert.
Hinzu kommt, dass häufig auf die einzelnen Rechner, die am Internet angeschlossen sind,
kein direkter Zugriff möglich ist, so dass die Informationen dieser Rechner nicht zur
Verfügung stehen.
Um an die Informationen heranzukommen, braucht man ein Hilfsmittel, die Suchdienste.
Suchdienste:
Wie arbeiten Suchdienste:
Suchdienste verschaffen sich mittels bestimmter Programme Zutritt zu sehr vielen Rechnern
und sammeln die Informationen, die sie dort finden.
Dies kann immer nur ein Auszug aus der Gesamtheit aller Webseiten sein, und auch nur eine
Momentaufnahme dieser Seiten. Da sich Webseiten teilweise sehr rasch ändern, können
Suchergebnisse, die durch eine Suchdienst gefunden werden, auf Seiten verweisen, die
entweder inzwischen nicht mehr existieren oder andere Informationen enthalten.
Wenn man zu einer Suchanfrage keine Informationen im WWW findet, heißt das also nicht,
daß es keine Informationen dazu gibt, sondern lediglich, daß der / die Suchdienste keine
entsprechenden Seiten auflisten. Zu den technischen Grenzen der Auffindbarkeit aller
Dokumente, die im WWW vorhanden sind, kommen auch noch interlektuelle Grenzen, die
die einzelnen Suchdienste, zum größten Teil unbemerkt, setzten, die man als eine Art von
Zensur beschreiben könnte. Diese Zensur erfolgt meist auf nationaler Ebene, um zu
vermeiden, daß dem Suchenden Seiten angezeigt werden, deren Inhalt in dem jeweiligen
Land verboten ist. Google z.B. führt immer zuerst einen Check durch, aus welchem Land sich
der Kunde meldet, und schaltet dann den entsprechenden Filter zu.
Yahoo z.B. betreibt weltweit in Co-Location 4500 Server in 16 Datencentren und verarbeitet
täglich mehr als 1,5 Milliarden Informationen (Pageviews) der Spider. Das zeigt, um welch
große Datenmengen es sich bei den Datenbanken der Suchdienste handelt.
Arten von Suchdiensten:
Roboterbasierte Suchmaschinen:
Eine roboterbasierte Suchmaschine besteht aus drei Teilen:
1. Informationssammler (robot, spider, crawler):
Diesem Programm wird eine Liste von Web-Adressen vorgegeben, die es der Reihe nach
besucht. Der HTML-Code jeder besuchten Seite wird zur späteren Bearbeitung in einer
Datenbank (Repository) abgelegt. Ein anderes Programm bearbeitet diese abgelegten
Seiten und durchsucht sie nach bisher unbekannten Links, die dann wiederum an den
Spider weitergegeben werden.
Durch die vielfache Verlinkung der einzelnen Webseiten untereinander kann so
theoretisch das gesamte Web erfaßt werden.
2. Indexierungssoftware (indexer):
Erst die Strukturierung der gespeicherten Daten macht es möglich, daß Suchmaschinen,
trotz der riesigen Datenmengen, die durchsucht werden, schnelle Antwortzeiten haben.
Für die Indexierung werden Worte herangezogen, die besonders häufig in einer Webseite
vorkommen oder in deren Titel, Abstract oder den Metadaten (Beschreibung des Inhalts
der Webseite) stehen. Bei der Indexierung wird jedem Wort die Seitennummer
zugeordnet, auf dem es steht. Es entsteht ein inverser Index. Zusätzlich wird jeder Seite
eine Bewertung zugeordnet, wie relevant sie für das Wort ist, mit dem sie verknüpft ist.
Welche Kriterien bei dieser Bewertung zu Grunde gelegt werden, ist bei den meisten
Suchmaschinen ein wohlgehütetes Geheimnis.
3. Software, die die Suchanfragen auswertet:
Wird eine Suchanfrage gestellt, durchsucht diese Software nicht den Volltext der
gespeicherten Webseiten, sondern „nur“ den inversen Index. Dieses Verfahren reduziert
die Datenmenge um den Faktor 100.000. Alle im Index dem eingegebenen Stichwort
zugeordneten Seiten werden nach ihrer Bewertung sortiert und ausgegeben.
Die Suche mittels dieser Suchmaschinen ist mit einer Stichwortsuche vergleichbar.
Vorteil von Suchmaschinen:
Große Datenbank
Nachteil von Suchmaschinen:
Suchmaschinen arbeiten rein formal, dh. wenn Sie z.B. das Suchwort "Kiefer" eingeben,
finden Sie Treffer zur Gesichtschirurgie, zur Holzfabrik Kiefer, zum Tennisspieler Nicolas
Kiefer...u.ä. Rein formell heißt aber auch, daß die Suche aus einem einfachen Abgleichen der
eingegebenen Zeichenketten mit den Zeichenketten des Index besteht.
Roboterbasierte Suchmaschinen sind z.B.:Google: http://www.google.de/ ; Alta Vista:
http://www.altavista.com/ oder http://de.altavista.com/
Manuell erstellte Kataloge:
Webkataloge bzw. Verzeichnisse sind intellektuell erschlossene, hierarchisch geordnete
Sammlungen von Hyperlinks. Ein Redaktionsteam sieht sich die Seiten an und ordnet sie
entsprechend ihrem Inhalt in Kategorien ein. Zunehmend werden auch Möglichkeiten zur
Stichwortsuche angeboten.
Vorteil von Web-Verzeichnissen:
Die Seiten werden inhaltlich erschlossen und in eine Verzeichnisstruktur eingearbeitet. Sie
können sich dort vom Allgemeinen zum Speziellen durchklicken. Vor allem wenn Sie sich
neu in ein Thema einarbeiten wollen, bieten sich hierarchische Suchsysteme an, denn Sie
finden eine Auswahl an Webseiten zum gesuchten Thema, ohne nach geeigneten Stichwörtern
suchen zu müssen.
Nachteil von Web-Verzeichnissen:
Internet-Kataloge haben eine relativ kleine Datenbanken im Vergleich zu den
Suchmaschinen und durch die redaktionelle Bearbeitung entsteht eine gewisse
Zeitverzögerung, bis die Webseiten in die Hierarchie eingeordnet sind.
Internetverzeichnisse sind z.B.: Yahoo: http://www.yahoo.com/ oder http://de.yahoo.com/ ;
Dino: http://www.dino-online.de/ und web.de: http://web.de/
Meta- Suchdiensten:
Meta-Suchdienste fragen parallel mehrere Suchdienste über eine zentrale Eingabeseite ab,
sind im eigentlichen Sinne also keine eigenen Suchdienste.
Vorteil von Meta-Suchdiensten:
Metasuchdienste eignen sich vor allem bei ganz speziellen Informationsproblemen, bei denen
einzelne Suchdienste nur wenige Treffer aufweisen. Sie sind in der Regel auf dem neuesten
Stand und beinhalten ganz neue Suchdienste oder ganz spezielle Datenbanken, die sonst noch
gar nicht verbreitet bzw. bekannt sind.
Nachteil von Meta-Suchdiensten:
Verknüpfungen von Suchbegriffen können nicht immer richtig verarbeitet werden, da die
einzelnen Suchdienste unterschiedliche Indizierungsmethoden anwenden.
Meta-Suchdienste sind z.B.: MetaGer: http://www.metager.de/ ; MetaCrawler:
http://www.metacrawler.com/ ; Ixquick: http://ixquick.com/
Spezielle Suchdienste
Neben den Universalsuchdiensten, die das Internet unabhängig von ihrem Inhalt erschließen,
gibt es auch spezielle Suchdienste, die sich auf bestimmte Fachgebiete, Personen, Software,
Musik usw. beschränken. Die Qualität ist recht unterschiedlich. Oftmals stecken
kommerzielle Anbieter dahinter.
Spezielle Suchdienste:
MESA: http://mesa.rrzn.uni-hannover.de/ für die Suche nach E-Mail-Adressen
Weitere spezielle Suchdienste finden Sie im Suchfibel-Katalog: http://www.suchfibel.de/
(Der Katalog der Suchfibel ist ein durchsuchbares Verzeichnis spezieller deutschsprachiger
Suchmaschinen, Kataloge,Verzeichnisse und Linksammlungen) oder bei http://www.klugsuchen.de/ .
Fachbezogene Suchdienste:
Es gibt auch einige fachbezogene Suchdienste, die die Volltexte der Internet-Dokumente
nach professionellen Methoden erschließen. Sie wenden sich speziell an wissenschaftliche
Informationssuchende. Der Verzeichnisstruktur liegt meist ein Klassifikationssystem oder
ein Thesaurus zugrunde. Sie durchsuchen oft Server von Universitäten oder anderen
wissenschaftlichen Einrichtungen.
Vorteil von speziellen Suchdiensten:
Durch die Einschränkung auf bestimmte Themen, Fächer usw. ist bereits eine gewisse
Vorauswahl getroffen. Die Treffermenge bleibt entsprechend überschaubar. Die
fachbezogenen Suchdienste, denen eine Klassifikation zugrunde liegt, eignen sich
hervorragend zur Suche nach wissenschaftlichen Internetquellen. Oftmals arbeiten spezielle
Suchdienste nach dem "Mischprinzip", d.h. sie haben einen katalogbasierten Index mit
zusätzlicher Suche nach Stichwörtern. Oftmals werden die Suchergebnisse kommentiert.
Eine Übersicht über fachbezogene Suchdienste finden Sie unter http://www.ub.ruhr-unibochum.de/DigiBib/fachinfo.htm .
Informationen über Suchdienste:
Übersichten über Suchdienste
Es gibt viele Webseiten, die einen Überblick über die Suchmaschinen im Internet bieten z.B.:
Die Suchfibel : Alles zum Thema Suchen im Netz / von Stefan Karzauninkat
http://www.suchfibel.de/index.htm
Umfassende und stets aktuelle Darstellung über die "Kunst des Suchens". Links und
Beschreibungen von über 1400 Suchdiensten.
LLEK
http://www.wissenschaftliche-suchmaschinen.de/index.html
Eine Fundgrube rund um Suchmaschinen, die besonders wegen ihres Schwerpunkts auf
wissenschaftliche Suchmaschinen erwähnenswert ist. Hinzu kommen viele hilfreiche Links
auf regionale, meist ausländische Suchmaschinen, aber auch ausländische Newsserver und
Webseiten. Links zu Auskunftsdiensten und Nachschlagewerken ergänzen diese Seite.
Linklisten
Hochschulbibliothekszentrum NRW: Bibliographischer Werkezugkasten – Suchdienste:
http://www.hbz-nrw.de/produkte_dienstl/toolbox/index.html
Umfangreiche Sammlung (Allgemeines über Suchmaschinen u. Sammlungen, Internationale
Suchmaschinen, Meta-Suchmaschinen, Nationale Suchmaschinen)
Die Düsseldorfer Virtuelle Bibliothek : Internet-Suchmaschinen und systematische
Verzeichnisse
http://www.uni-duesseldorf.de/ulb/intsucha.html
Informationen zur Suche im Internet, Links zu Online-Tutorials, Links zu Suchmaschinen
Bibliothek der Universität Bielefeld: Suchdienste im Internet - Übersicht
http://www.ub.uni-bielefeld.de/biblio/search/index.htm
Informationen über das Suchen sowie Suchdienste mit Beschreibungen
@-web - Suchmaschinen aktuell
http://www.at-web.de/
Umfassender Report zu Suchdiensten im Internet, neben Beschreibungen auch sehr viel
Hintergrundwissen und täglich aktuelle News über einzelne Suchdienste.
Bibliotheksservice-Zentrum Baden-Württemberg: Suchdienste im Internet
http://www.bsz-bw.de/links/suchfind.html
Umfangreiche Linksammlung
Search Engine Watch
http://www.searchenginewatch.com/
Das amerikanische Pendant von @-web – Suchmaschinen aktuell. Da viele Suchmaschinen in
den USA beheimatet sind, werden News hier häufig etwas früher bekannt gegeben.
Suchstrategie
Was suche ich?
Bevor Sie mit der Recherche beginnen, betrachten Sie Ihr Thema unter folgenden
Gesichtspunkten:
-
gibt es besonders typische, gängige Wörter oder Phrasen
gibt es nur allgemeine Begriffe, die eine Unzahl von Treffern erzeugen
ist das Thema sehr speziell, werden Oberbegriffe gebraucht
ist das Thema sehr umfangreich, werden speziellere Begriffe gebraucht
gibt es zum Suchbegriff Synonyme, Äquivalente oder sind verschiedene
Schreibweisen möglich
Schreiben Sie alle Begriffe auf, sie sind Basis Ihrer Suche.
Welche Art von Suchdienst verwende ich?
Wenn Sie eine umfangreiche Recherche durchführen möchten, empfiehlt es sich, einen
stichwortbasierten Suchdienst mit umfangreichen und komfortablen Retrievalmöglichkeiten,
oder einen Einstieg über einen Meta-Suchdienst zu wählen. Zusätzlich kann dann noch ein
spezialisierter, kleiner Suchdienst genutzt werden.
Wenn Sie sich nur einen thematischen Überblick verschaffen möchten, sind manuell
erstellte Kataloge/Verzeichnisse zu bevorzugen.
Auswahl der richtigen Suchbegriffe:
Bei der Suche über Stichworte, also hauptsächlich bei Suchmaschinen, ist die geeignete
Auswahl der Suchbegriffe entscheidend. Grundsätzlich gilt:
•
•
•
mit speziellen Suchbegriffen beginnen
a. zu wenige Treffer à Allgemeinere Suchbegriffe wählen
b. zu viele Treffer(Regelfall) à Schrittweise Verfeinerung der Suche, z.B.
Verknüpfung mehrerer Suchbegriffe (komplexe Suchanfrage) bzw. feldbezogene
Suche durchführen. Der häufigste Fehler ist es bei einer erfolglosen Suche den
Suchdienst zu wechseln, anstatt die Suchanfrage zu optimieren.
die angebotenen Suchmethoden und -operatoren der jeweiligen Suchdienste
erkundschaften und einen sinnvollen Einsatz überlegen
die von nahezu allen Suchdiensten angebotene Phrasensuche , bei der nach der
exakten Reihenfolge der Begriffe in der angegebenen Suchanfrage gesucht wird,
eignet sich am besten, um einen ersten Eindruck der zu erwartenden Treffermenge und
-qualität zu bekommen. Es kann auch durchaus interessant sein eine Frage als Phrase
zur Suche zu verwenden, weil häufig kurze Abhandlungen zu einem Thema eine Frage
als Überschrift nutzen (z.B. Was ist Kryptographie? oder die diversen Rubriken von
F(requently) A(sked) Q(uestions)).
Die Suche:
Nachdem eine Liste der Suchbegriffe erstellt und ein Suchdienst ausgewählt worden ist, geht
es an die eigentliche Suche. Jede Suchmaschine hat Hilfe-Seiten, wo nachzulesen ist, welche
Suchmöglichkeiten der Suchdienst bietet. Da diese Möglichkeiten zwischen den einzelnen
Suchdiensten sehr variieren, ist es empfehlenswert, diese Seiten zuerst zu lesen.
Einfache / Erweiterte Suche:
Viele Suchdienste bieten zwei verschiedene Suchmöglichkeiten an.
Während man bei der Einfachen Suche nur ein oder mehrere Stichwörter in eine Zeile
eintragen kann, enthält die Erweitere Suche in der Regel die Möglichkeit die Stichwörter
verschiedenen Bereichen zuzuordnen.
Schreibweisen:
Groß- und Kleinschreibung wird weitestgehend ignoriert.
Umlaute und ß werden nur nicht immer umgewandelt, deswegen sollte man diese Umlaute,
besonders bei der Verwendung von Meta-Suchmaschinen, immer auflösen.
Suchhilfen:
Trunkierung:
Mit Trunkierung bezeichnet man die Suche nach verschieden Wortvariationen, z.B. wenn es
verschiedene Schreibweisen eines Wortes gibt. Je nach Suchmaschine können mit einem
Trunkierungszeichen einer oder mehrere Buchstaben ersetzt werden.
Manche Suchmaschinen trunkieren automatisch, d.h. es werden auch alle Stichwörter
gefunden, die mit der von Ihnen eingegebenen Zeichenfolge beginnen.
Die meisten Suchmaschinen trunkieren nur bei der Eingabe eines Trunkierungszeichens.
Die häufigsten Trunkierungszeichen sind *, $ und ?
Einige Suchmaschinen beherrschen keinerlei Trunkierung. Es werden nur jene Zeichenfolgen
gefunden, die Sie tatsächlich angefragt haben.
Logische Verknüpfungen:
Die logische Verknüpfung von Stichwörtern mittels „Boole’scher Operatoren ist eine sehr
hilfreiche Methode eine große Anzahl von Treffern zu verkleinern und spezieller zu machen.
Folgende Verknüpfungen sind üblich:
Boole'scher Operator
UND
ODER
NICHT /
UND NICHT
NEAR
als PHRASE
Zeichen Bedeutung
Alle Begriffe müssen
AND
+, & gemeinsam im Dokument
vorkommen
Einer der Begriffe muß
OR
|
enthalten sein
NOT
Ein Begriff darf nicht
!
AND NOT
enthalten sein
Begriffe müssen
gemeinsam im Dokument
NEAR
~
in einem bestimmten
Abstand zueinander
vorkommen
ADJ
Begriffe müssen in genau
""
(funktioniert
der Reihenfolge der
aber selten!)
Eingabe gefunden werden
Viele Suchmaschinen bieten die Möglichkeit über Optionsfelder die Verknüpfung
auszuwählen. Typische Auswahlmöglichkeiten sind:
'Alle Wörter' (UND-Verknüpfung)
'Ein Wort' (ODER-Verknüpfung)
'Als Phrase'
Einschränkung auf bestimmte Suchfelder:
Manche Suchdienste bieten die Möglichkeit, die Suche auf bestimmte Suchfelder
einzuschränken:
title: "informationssuche im
internet"
domain:de
url:bochum
link:"www.ub.ruhr-unibochum.de"
image:magritte
sucht nach Dokumenten mit dem Titel
"Informationssuche im Internet"
sucht nach Dokumenten mit der Domain-Endung "de"
(de = Deutschland)
sucht nach Dokumenten mit "bochum" in der URL
sucht nach Dokumenten mit einem Hyperlink zum
Suchwort
sucht nach Dokumenten mit Graphiken, in deren
Dateinamen "magritte" vorkommt
Suchergebnisse:
Trefferanzeige:
Roboterbasierte Suchdienste:
Die Treffer werden in Form einer Liste angezeigt. Bei jedem Suchdienst werden zumindest
die URLs und Dokumenttitel angezeigt. Die meisten Dienste präsentieren zusätzlich
Ausschnitte aus dem Volltext des Dokumentes, Kommentare oder Zusammenfassungen aus
den Originaldokumenten sowie zusätzliche Angaben wie Erstellungsdatum, Größe usw.
Meta-Suchdienste:
Auch hier werden die Treffer in Form einer Liste angezeigt. Zusätzlich zu den bereits
erwähnten Angaben (URL, Titel, Ausschnitte aus dem Volltext usw.) wird angezeigt, von
welchem Suchdienst der Treffer gefunden wurde. Außerdem werden die einzelnen
Suchdienste, die durchsucht worden sind sowie die jeweilige Trefferzahl angezeigt. Da
Verknüpfungen bei der Suche mittels eines Meta-Suchdienstes nicht optimal funktionieren,
sollte man für detailliertere Suchanfragen direkt einen einzelnen Suchdienst nutzen, bevorzugt
den, der bei der gestellten Suchanfrage die meisten Treffer geliefert hat.
Kataloge:
Kataloge zeigen die Katalog-Hierarchie der einzelnen Treffer an, wenn man sich durch die
einzelnen Kategorien klickt. Bei einer Stichwortsuche werden die Hierarchien nicht immer
angegeben.
Durch Anklicken des gewünschten Treffers gelangen Sie jeweils auf das Dokument, das auf
einem Server irgendwo im Internet liegt. Nicht selten kommt es vor, dass die Links "tot" sind,
d.h. die Dokumente existieren gar nicht mehr im Internet oder haben ihre Internet-Adresse
geändert.
Beurteilung der Treffer:
Qualität der Treffer:
URL "lesen" (Dienstart, Ländercode, Domainname, Verzeichnispfad):
Da sehr viele verschiedene Anbieter von Webseiten gibt, kann man teilweise aus der URL
bereits eine Tendenz herauslesen, inwieweit der Treffer für die Suchanfrage von Relevanz ist.
Bei einer Suche nach einer Information über eine Behörde, wird man z.B. zuerst nach einem
Link suchen, in dem die Behörde als Domainname auftaucht.
Ist die Liste der Treffer sehr lang, sollte man die Suche verfeinern, um eine überschaubare
Treffermenge zu bekommen. Es ist wichtig alle Treffer durchzusehen, da die Reihenfolge der
Auflistung der Treffer von den Prioritäten der Suchmaschine abhängt, und nicht von der
tatsächlichen Bedeutung, die der jeweilige Treffer für ihre individuelle Suchanfrage hat.
Relevante Suchergebnisse:
Als relevant eingestufte Treffer sollten sofort als Bookmark markiert werden, am besten in
einem eigens bezüglich der Suchanfrage eingerichteten Bookmark-Ordner. Bei stark
temporären Web-Seiten, z.B. Zeitungsartikel usw., sollten die HTML-Dokumente gleich auf
die eigene Festplatte gespeichert werden, da diese oft nur ein paar Tage im WWW gehalten
werden.
Bevorzugte Suchdienste:
Wie beurteile ich die Qualität des Suchdienstes?
- Größe der Datenbank (Anzahl der URLs, die erfasst sind)
- Aktualität, Anzahl der "toten" Links
- Art und Umfang der Trefferinformation
- Antwortzeiten des Suchdienstes
Informationen z.B. über die Größe der Datenbank finden Sie in der Regel bei den
Suchmaschinen selbst.
Tests und Vergleiche von Suchdiensten
Im Oktober 2002 wurde erhoben, welche Marktanteile einzelne Suchdienste zur Zeit haben:
1
2
3
4
5
6
7
8
9
10
Google
Yahoo
MSN
T-Online
Terra Lycos
Fireball
Web.de
Metager
AOL
AltaVista
60 %
10 %
9%
5%
5%
4%
3%
3%
2%
2%
Suchmaschine; Google, ODP
Portal; Yahoo, Google
Portal; Allesklar.de, Inktomi
Portal; Overture, Fast
Portal; Fast
Suchmaschine; Fireball
Portal; Web.de, Google
Meta-Suchmaschine; Fast. Yahoo, Tricus u.a.
Portal; Google
Suchmaschine; Altavista
Bei einem Vergleich der Relevanz der Treffer der Suchmaschinen AltaVista.de, Fireball.de,
Google.de und Lycos.de ging ebenfalls Google als deutlicher Sieger hervor.
Aktualisierung:
Laut einer Erhebung aus dem Mai 2002 liefern Google, HotBot und MSN teilweise
tagesaktuelle Ergebnisse, während bei AltaVista die Treffer mindestens 12 Tage alt waren,
bei AllTheWeb 16 Tage.
Gespeicherte Webseiten werden aus der jeweiligen Datenbank des Suchdienstes ebenfalls in
unterschiedlichen Abständen gelöscht. Dies geschieht bei AltaVista nach 51 Tagen, bei
Google nach 68 Tagen, bei MSN nach 80 Tagen und bei AllTheWeb nach 191 Tagen.
Beschreibungen der einzelnen Suchdienste finden Sie unter:
http://www.ub.ruhr-uni-bochum.de/digibib/Schulung/EinzelneSuchdienste-Uebersicht.html