Web-2015-12-10-PowerSearch
Transcription
Web-2015-12-10-PowerSearch
Online-Recherche: Web-Recherche WS 2015/2016 8. Veranstaltung – 10. Dezember 2015 Philipp Schaer - [email protected] Philipp Mayr - [email protected] GESIS – Leibniz-Institut für Sozialwissenschaften 2 Themen der heutigen Veranstaltung • Ein wilder Ritt durch die Themen von Datenbank-Recherche und Web-Recherche • Power-Search: Handfeste Tipps für die Suche – Google-Operatoren – Spezialsuchmaschinen – „Schmutzige Tricks“ 3 Es war einmal: Einordnung Online-Recherche • Erlernen der Funktionsweise von Datenbanken und Suchdiensten • Methoden, Verfahren und Instrumente der DatenbankRecherche • Spezielle Arbeitstechniken und Suchstrategien • Selbstständige Lern- und Entdeckungsprozesse in der OnlineRecherche aus Modulhandbuch 2011 4 Gegenüberstellung Web- und DB-Recherche Web-Recherche Datenbank-Recherche Sprachen Viele Oft einheitliche Indexierungssprache Formate Viele Oft ein Format Länge Unterschiedlich Bibliograph. DB: in etwa gleich Teile Unterschiedlich (Bilder, Anker…) Genau ein Datensatz Verlinkung Hyperlinks Ggf. Referenzen & Zitationen Spam Ja Nein Struktur Schwach Feldstruktur Inhalt Heterogen Homogen I. Dokumente Nach Lewandowski, D. (2005): Web Information Retrieval. Technologien zur Informationssuche im Internet. Frankfurt: DGI: 5 Gegenüberstellung Web- und DB-Recherche Web-Recherche Datenbank-Recherche Größe Unbekannt (in etwa) bekannt Abdeckung Nicht messbar (in etwa) messbar Duplikate Ja Nein Zielgruppe Alle Web-User i.d.R. Fachexperten Bedarf Unterschiedlich Fachbezogen Kenntnisse Gering Hoch – sehr hoch Interface Einfach Oft (sehr) komplex Funktionalität Gering Hoch Ranking Ja Nein (ggf. zusätzlich) II. Grundgesamtheit III. Nutzer IV. Retrieval-System 5 6 Web-Recherche: So nicht! http://www.googlehupf.org/wp-content/uploads/2007/12/_mg_4932.JPG 7 Power-Searching • Eine Sammlung handfester Tricks, die im Alltag viel bringen! – http://www.powersearchingwithgoogle.com • Übersichten über Tricks gibt es viele... – https://support.google.com/websearch/answer/2466433?rd=1 – http://bueltge.de/wp-content/download/wk/GoogleCheatSheet_de.pdf – http://www.googleguide.com/print/adv_op_ref.pdf – http://lifehacker.com/top-10-clever-google-search-tricks-1450186165 • Ich habe Ihnen ein paar Tricks zusammengestellt und zeige, was damit alles machbar ist… 8 Einsatz von Filtern/Operatoren • Einschränkung auf bestimmte Domains – site:.de – site:bundestag.de – site:.gov Nur auf .de-Domains suchen Nur auf der Domain bundestag.de suchen Nur US-Amerikanische Regierungsquellen • Einschränkung auf bestimmte Dateitypen – filetype:pdf – filetype:ppt – filetype:csv – filetype:kml – filetype:log – … PDF-Dateien PowerPoint-Dateien Datentabellen Geodaten -> Input für Google Earth Logdateien 9 - / OR / ““ / intext / intitle / inurl • Entfernung bestimmter Untermengen – Michelangelo –Künstler – Jaguar –Tier • Aufnahme weiterer Alternativen – "Philipp Schaer" OR "Ph. Schaer" OR "Schaer, Ph." • Suche nach exakten Phrasen – "Dieser Satz soll genauso erscheinen" • Suche in bestimmten Teilen der Seite – "Philipp Schaer" intitle:academic – "Philipp Schaer" intext:academic – "Philipp Schaer" inurl:academic 10 Was kann man damit tun? • Durchsuchen, in wie vielen Protokollen des Bundestages der Weihnachtsmann erwähnt wurde... – site:bundestag.de weihnachtsmann protokolle filetype:pdf • Was hat der Weihnachtsmann auf Twitter zum FC zu sagen... – site:twitter.com weihnachtsmann #effzeh • Sich selbst ein Geschenk machen: Passwörter finden – filetype:log inurl:password • Noch mehr Geschenke: „Kostenlose“ E-Books finden – -inurl:htm -inurl:html intitle:"index of" epub 11 Umgehen von Paywalls/Länderbeschränkungen • Sie kennen das… • Probieren Sie doch einmal die gleiche Seite über Google Translate aufzurufen (sprich, über einen Proxy…) 12 Zaubern mit der inversen Bildsuche • Die Google-Bildsuche erlaubt es, die Quelle von Bildern zu finden • Kann auch für andere Zwecke gebraucht werden, z.B. – – – – Namen zu Personen herausfinden Kochrezepte finden Hersteller von Produkten identifizieren Faktencheck für Twitter-Posts (wurde ein bestimmtes Bild ggf. schon einmal gepostet, in einem anderen Kontext?) – Werden eigenen Bilder entgegen der Bildrechte extern eingesetzt? – … uvm. 13 Recherche mit Google Street View • Wo wohnt der Weihnachtsmann in Köln? 14 Braucht man alles nicht… Das macht Google! 15 Online-Tutorial: Power Searching with Google 16 Zusammenfassung Online-Recherche • Denken Sie daran, dass es mehr als Google gibt. – Yahoo, Bing etc.; Fachdatenbanken; Foren; Buchsuche, Kataloge, Bildersuche, Social Media, Social Bookmarking etc. • Hinterfragen Sie warum Dinge unter den Top10 landen. – Textbasiertes Ranking, PageRank, mehr als 200 Faktoren! • Bedenken Sie immer: Sie durchsuchen nur einen Index! • Verifizieren Sie Informationen/Glaubwürdigkeit von Quellen • Kombinieren Sie verschiedene – Quellen, Operatoren (insite, Phrasensuche, Minus-Operator) – und Herangehensweisen (Known-Item-Search, Berry-Picking) • Seien Sie kreativ in der Art und Weise, wie Sie suchen! 17 Literaturhinweise • • • • • • • • • • • • • Ferber, R.: Information Retrieval. Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web. Heidelberg 2003 Erlhofer, S.: Suchmaschinen-Optimierung. 4. Aufl. Bonn 2008. Glöggler, M.: Suchmaschinen im Internet. Funktionsweisen, Ranking, Methoden. 2. Aufl. Berlin 2008. Lehmann, K. / Schetsche, M. (Hg.): Die Google-Gesellschaft. Bielefeld 2005 Lewandowski, D.: „Suchmaschinenforschung im Kontext einer zukünftigen Webwissenschaft“, in Scherfer, K. (Hg.): Webwissenschaft - Eine Einführung. Münster 2008, S. 268-282 Lewandowski, D (Hg.): Handbuch Internet-Suchmaschinen. Heidelberg 2009. Mandl, Th.: Die automatische Bewertung der Qualität von Internet- Seiten im Information Retrieval. Universität Hildesheim 2006. Machill, M. / Beiler, M. (Hg.): Die Macht der Suchmaschinen. Köln 2007. Wimmeroth, U. / Brochhagen,Th.: Google. Dirty Tricks. Düsseldorf 2003 Meier, K.: „Grundlagen journalistischer Recherche im Internet“, in Meier, K.: Internet-Journalismus. Konstanz. 3. Aufl. 2002, S. 297-357. Regionales Rechenzentrum für Niedersachsen: Suchen und Finden im Internet. Hannover 6, 2001 www-Suchseiten der Informationswissenschafthttp://www.inf-wiss.uni-konstanz.de/suche/selfhtml http://selfhtml.teamone.de/html/kopfdaten/meta.htm 18 Kontakt • Dr. Philipp Mayr GESIS - Leibniz-Institute for the Social Sciences Unter Sachsenhausen 6-8, 50667 Köln Tel: + 49 (0) 221 / 47694-533 [email protected] • Dr. Philipp Schaer GESIS - Leibniz-Institute for the Social Sciences Unter Sachsenhausen 6-8, 50667 Köln Tel: + 49 (0) 221 / 47694-521 [email protected] • http://www.schaer.de/teaching/web-recherche-ws-1415