Web-2015-12-10-PowerSearch

Transcription

Web-2015-12-10-PowerSearch
Online-Recherche: Web-Recherche
WS 2015/2016
8. Veranstaltung – 10. Dezember 2015
Philipp Schaer - [email protected]
Philipp Mayr - [email protected]
GESIS – Leibniz-Institut für Sozialwissenschaften
2
Themen der heutigen Veranstaltung
• Ein wilder Ritt durch die Themen von Datenbank-Recherche
und Web-Recherche
• Power-Search: Handfeste Tipps für die Suche
– Google-Operatoren
– Spezialsuchmaschinen
– „Schmutzige Tricks“
3
Es war einmal: Einordnung Online-Recherche
• Erlernen der Funktionsweise von Datenbanken und
Suchdiensten
• Methoden, Verfahren und Instrumente der DatenbankRecherche
• Spezielle Arbeitstechniken und Suchstrategien
• Selbstständige Lern- und Entdeckungsprozesse in der OnlineRecherche
aus Modulhandbuch 2011
4
Gegenüberstellung Web- und DB-Recherche
Web-Recherche
Datenbank-Recherche
Sprachen
Viele
Oft einheitliche Indexierungssprache
Formate
Viele
Oft ein Format
Länge
Unterschiedlich
Bibliograph. DB: in etwa gleich
Teile
Unterschiedlich (Bilder, Anker…)
Genau ein Datensatz
Verlinkung
Hyperlinks
Ggf. Referenzen & Zitationen
Spam
Ja
Nein
Struktur
Schwach
Feldstruktur
Inhalt
Heterogen
Homogen
I. Dokumente
Nach Lewandowski, D. (2005): Web Information Retrieval. Technologien zur Informationssuche im Internet. Frankfurt: DGI:
5
Gegenüberstellung Web- und DB-Recherche
Web-Recherche
Datenbank-Recherche
Größe
Unbekannt
(in etwa) bekannt
Abdeckung
Nicht messbar
(in etwa) messbar
Duplikate
Ja
Nein
Zielgruppe
Alle Web-User
i.d.R. Fachexperten
Bedarf
Unterschiedlich
Fachbezogen
Kenntnisse
Gering
Hoch – sehr hoch
Interface
Einfach
Oft (sehr) komplex
Funktionalität
Gering
Hoch
Ranking
Ja
Nein (ggf. zusätzlich)
II. Grundgesamtheit
III. Nutzer
IV. Retrieval-System
5
6
Web-Recherche: So nicht!
http://www.googlehupf.org/wp-content/uploads/2007/12/_mg_4932.JPG
7
Power-Searching
• Eine Sammlung handfester Tricks, die im Alltag viel bringen!
– http://www.powersearchingwithgoogle.com
• Übersichten über Tricks gibt es viele...
– https://support.google.com/websearch/answer/2466433?rd=1
– http://bueltge.de/wp-content/download/wk/GoogleCheatSheet_de.pdf
– http://www.googleguide.com/print/adv_op_ref.pdf
– http://lifehacker.com/top-10-clever-google-search-tricks-1450186165
• Ich habe Ihnen ein paar Tricks zusammengestellt und zeige,
was damit alles machbar ist…
8
Einsatz von Filtern/Operatoren
• Einschränkung auf bestimmte Domains
– site:.de
– site:bundestag.de
– site:.gov
Nur auf .de-Domains suchen
Nur auf der Domain bundestag.de suchen
Nur US-Amerikanische Regierungsquellen
• Einschränkung auf bestimmte Dateitypen
– filetype:pdf
– filetype:ppt
– filetype:csv
– filetype:kml
– filetype:log
– …
PDF-Dateien
PowerPoint-Dateien
Datentabellen
Geodaten -> Input für Google Earth
Logdateien
9
- / OR / ““ / intext / intitle / inurl
• Entfernung bestimmter Untermengen
– Michelangelo –Künstler
– Jaguar –Tier
• Aufnahme weiterer Alternativen
– "Philipp Schaer" OR "Ph. Schaer" OR "Schaer, Ph."
• Suche nach exakten Phrasen
– "Dieser Satz soll genauso erscheinen"
• Suche in bestimmten Teilen der Seite
– "Philipp Schaer" intitle:academic
– "Philipp Schaer" intext:academic
– "Philipp Schaer" inurl:academic
10
Was kann man damit tun?
• Durchsuchen, in wie vielen Protokollen des Bundestages der
Weihnachtsmann erwähnt wurde...
– site:bundestag.de weihnachtsmann protokolle filetype:pdf
• Was hat der Weihnachtsmann auf Twitter zum FC zu sagen...
– site:twitter.com weihnachtsmann #effzeh
• Sich selbst ein Geschenk machen: Passwörter finden
– filetype:log inurl:password
• Noch mehr Geschenke: „Kostenlose“ E-Books finden
– -inurl:htm -inurl:html intitle:"index of" epub
11
Umgehen von Paywalls/Länderbeschränkungen
• Sie kennen das…
• Probieren Sie doch einmal die gleiche Seite über Google
Translate aufzurufen (sprich, über einen Proxy…)
12
Zaubern mit der inversen Bildsuche
• Die Google-Bildsuche erlaubt es, die Quelle von Bildern zu
finden
• Kann auch für andere Zwecke gebraucht werden, z.B.
–
–
–
–
Namen zu Personen herausfinden
Kochrezepte finden
Hersteller von Produkten identifizieren
Faktencheck für Twitter-Posts (wurde ein bestimmtes Bild ggf. schon
einmal gepostet, in einem anderen Kontext?)
– Werden eigenen Bilder entgegen der Bildrechte extern eingesetzt?
– … uvm.
13
Recherche mit Google Street View
• Wo wohnt der Weihnachtsmann in Köln?
14
Braucht man alles nicht… Das macht Google!
15
Online-Tutorial: Power Searching with Google
16
Zusammenfassung Online-Recherche
• Denken Sie daran, dass es mehr als Google gibt.
– Yahoo, Bing etc.; Fachdatenbanken; Foren; Buchsuche, Kataloge,
Bildersuche, Social Media, Social Bookmarking etc.
• Hinterfragen Sie warum Dinge unter den Top10 landen.
– Textbasiertes Ranking, PageRank, mehr als 200 Faktoren!
• Bedenken Sie immer: Sie durchsuchen nur einen Index!
• Verifizieren Sie Informationen/Glaubwürdigkeit von Quellen
• Kombinieren Sie verschiedene
– Quellen, Operatoren (insite, Phrasensuche, Minus-Operator)
– und Herangehensweisen (Known-Item-Search, Berry-Picking)
• Seien Sie kreativ in der Art und Weise, wie Sie suchen!
17
Literaturhinweise
•
•
•
•
•
•
•
•
•
•
•
•
•
Ferber, R.: Information Retrieval. Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das
Web. Heidelberg 2003
Erlhofer, S.: Suchmaschinen-Optimierung. 4. Aufl. Bonn 2008.
Glöggler, M.: Suchmaschinen im Internet. Funktionsweisen, Ranking, Methoden. 2. Aufl. Berlin 2008.
Lehmann, K. / Schetsche, M. (Hg.): Die Google-Gesellschaft. Bielefeld 2005
Lewandowski, D.: „Suchmaschinenforschung im Kontext einer zukünftigen Webwissenschaft“, in Scherfer,
K. (Hg.): Webwissenschaft - Eine Einführung. Münster 2008, S. 268-282
Lewandowski, D (Hg.): Handbuch Internet-Suchmaschinen. Heidelberg 2009.
Mandl, Th.: Die automatische Bewertung der Qualität von Internet- Seiten im Information Retrieval.
Universität Hildesheim 2006.
Machill, M. / Beiler, M. (Hg.): Die Macht der Suchmaschinen. Köln 2007.
Wimmeroth, U. / Brochhagen,Th.: Google. Dirty Tricks. Düsseldorf 2003
Meier, K.: „Grundlagen journalistischer Recherche im Internet“, in Meier, K.: Internet-Journalismus.
Konstanz. 3. Aufl. 2002, S. 297-357.
Regionales Rechenzentrum für Niedersachsen: Suchen und Finden im Internet. Hannover 6, 2001
www-Suchseiten der Informationswissenschafthttp://www.inf-wiss.uni-konstanz.de/suche/selfhtml
http://selfhtml.teamone.de/html/kopfdaten/meta.htm
18
Kontakt
• Dr. Philipp Mayr
GESIS - Leibniz-Institute for the Social Sciences
Unter Sachsenhausen 6-8, 50667 Köln
Tel: + 49 (0) 221 / 47694-533
[email protected]
• Dr. Philipp Schaer
GESIS - Leibniz-Institute for the Social Sciences
Unter Sachsenhausen 6-8, 50667 Köln
Tel: + 49 (0) 221 / 47694-521
[email protected]
• http://www.schaer.de/teaching/web-recherche-ws-1415