Folien
Transcription
Folien
Datenmanagement in Sensornetzen Seminar Sommersemester 2007 Ulf Leser, Timo Mika Gläßer Wissensmanagement in der Bioinformatik Wireless Sensor Networks •4Mhz, 8 bit Atmel RISC uProc •40 kbit Radio •4 K RAM, 128 K program Flash, 512 K data flash •AA battery pack •special OS e.g. TinyOS •sensors: weather, temperature, light, air pressure, humidity, acceleration, ... Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 ... some projects using WSNs • Great Duck Island & Redwood, University of California, Berkeley => SNDB • GlacsWeb, University of Southampton => h.-b. • Volcano Tungurahua, Harvard University => h.-b. • GeoNet, CENS, LA => h.-b. • ... GeoNet, Peru ... there still are some more! • Fence Monitoring, Freie Universität Berlin => h.-b. • Mexico Experiment, CENS, LA => h.-b. ... • Safer, HumboldtUniversität zu Berlin => h.-b. • ... Datamanagement in WSN • sensors generate data that needs to be • transported • different strategies for routing • processed • different query languages and paradigms • different optimization techniques • stored • alternative storage devices • new indexing strategies Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Voraussetzungen • Voraussetzung • Vordiplom (je nach Studienordnung) • Halbkurs Datenbanken I • Englische Originalveröffentlichungen lesen Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Ablauf • Heute: Themenvorstellung und Themenvergabe • Besprechung der Themen bis zum 31.5.2007 • Mit dem jeweiligen Betreuer – individuelle Termine machen • Besprechung der Folien bis zum 30.6.2007 • Mit dem jeweiligen Betreuer – individuelle Termine machen • Blockseminar: tba (1-2 Tage am Semesterende) • Seminararbeiten: Abgabe bis 30.8.2007 • Frühzeitig Termine machen – – – – Ulf Leser IV.103, 2093 – 3902 Timo Gläser IV.104, 2093 – 3904 Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Ablauf • Themen • Maximal 2 Studenten pro Thema • Vorbesprechung des Themas: Nicht freiwillig • Vortrag • Blockseminar mit Anwesenheitspflicht • Ca. 40 min plus Diskussion • Besprechung der Folien: Nicht freiwillig • Seminararbeit • Schriftliche Ausarbeitung zum Thema (10-20 Seiten) • Abgabe bis zum 31.8.2007: Nicht freiwillig Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Fragen meinerseits • Fragen? • Diplominformatiker? • Semester? • Datenbanken? • Besondere Gründe? Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Themengebiete Routing Directed Diffusion (TG) Semantic Gossiping (UL) Content-based Routing(TG) Middleware FACTS (TG) REGIMENT (TG) Datenmanagement TinyDB (UL) Cougar (UL) SwissQM () PubSub TelegraphCQ (TG) Cayuga (UL) Model-Driven MauveDB (UL) Presto (UL) Indexing MicroHash (TG) DIFS (TG) Evt. PROTO Ev. sdlib Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Directed Diffusion (TG) • routing for data-centric networks (nodes are not important) • publish/subscibr • sinks „diffuse“ interests through the network • various implementations Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Gossiping (UL) • Context: Large-scale P2P and PDMS • Old-style: Napster • New-stlye: Fully decentralized •PDBMS: Schemas and Mappings •Queries routed along mappings –Loss in accuracy: gossiping •How can we assess the quality of a return result? •Key idea: Use cycles Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Contend-Based Routing (TG) • routing algorithm for streambased systems • observation: data from different nodes in a network has different value distributions • idea: save „costs“ in evaluating the operators of the query execution tree in a different order depending on the data Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 FACTS (TG) • rule-based programming language for sensor networks • user doesn‘t have to care about memory, pointers etc. Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Regiment (TG) • functional approach to programming sensor networks • functions provide high-level abstraction for manipulation of program state and can be optimized during compile and run-time Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 TinyDB (UL) • Acquisitional query processing • Obtaining data in a node is not free • Optimize for minimal sensor activity (and communication cost) • “Stream-style” queries – query is fixed, data changes, periodical reprocessing • Full-blown (functional?) system Quelle: http://www.uio.no/studier/emner/matnat/ifi/INF5100/h06/undervisningsmateriale/handouts/TinyDB.pdf Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Cougar (UL) • „The network is the database“ • Sensors are modeled as abstract data types • Model of in-network query optimization • Merge packets to save communication cost • Use probabilistic guarantees for accuracy of data • Especially in-network aggregation – Who? Where? When? Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 TelegraphCQ (TG) • „continous data flow processing for an uncertain world“ • turns „database“ upside down • queries are long-running • need to be shared efficiently Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Cayuga (UL) • Network does not answer queries, but detects events • Specified as queries • Nodes register many queries and receive many base events • Need to compute and send notifications very efficiently Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 MauveDB (UL) • Idea: usually, temperature doesn‘t change abruptly • But following a regular pattern over days and seasons • Build a model of the distribution of measurements • Only query sensors when model and data diverge • Upon query, pull some (few) sensors • When measurements follow model, predict other measures • Here is the saving! • Otherwise, ask all sensors and update model Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Presto (UL) • Like Mauve-DB, but PUSH-based • Two types of nodes: Sensors and proxies • Both store model of their measurement distribution • Only when model and data diverge, new data is pushed to the proxy • Proxies answer queries • Savings: • Push: One communication • Pull: Two communications Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 MicroHash (TG) • hash-based index for sensor nodes • data may be stored on flash • cheap in terms of energy, large capacity • different characteristics for reading/writing pages need to be considered e.g. failure after 10.000 - 100.000 writes, slow etc. Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 DIFS (TG) • distributed hash-index similiar to GHT • data is hashed to coordinates and stored at the node closest to the coordinates • supports efficient search in many dimensions e.g. name, values, location • supports range queries Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Themenvergabe Routing Middleware Datenmanagement PubSub Model-Driven Indexing Directed Diffusion (TG) Semmler Semantic Gossiping (UL) Gebhardt Content-based Routing(TG) Dießler FACTS (TG) Buerschaper REGIMENT (TG) Heimes TinyDB (UL) Ganzer Cougar (UL) Pfeiffer SWISSQM (TG) Wagner TelegraphCQ (TG) Hertlein Cayuga (UL) Radünz MauveDB (UL) Hellwig Presto (UL) Wenzlaff MicroHash (TG) Zahn DIFS (TG) Knebel Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Allgemeine Hinweise • Dozenten sind ansprechbar! • Vorbesprechung des Themas • Folien durchgehen • Abgrenzung der Ausarbeitung • Diskussion erwünscht • Keine Angst vor Fragen: Fragen sind keine Kritik • Eine Frage nicht beantworten können ist in Ordnung – dazu ist Diskussion da • Tiefe, nicht Breite • Lieber das Thema einengen und dafür Details darstellen • Bezug nehmen • Einordnung der Arbeit im Seminarthema vornehmen • Vergleich zu anderen Arbeiten im Seminar Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Allgemeine Hinweise • Werten und bewerten • Keine Angst vor nicht ganz zutreffenden Aussagen – solange gute Gründe vorhanden sind • Begründen und argumentieren • Kritikloses Abschreiben ist fehl am Platz • Literaturrecherche ist erwünscht • Die ausgegebenen Arbeiten sind Anker • Weiterführende Arbeiten müssen herangezogen werden • Auch Grundlagen nachlesen • Wir schicken eine Abhackliste rum Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Hinweise zum Vortrag • • • • • • • Ca. 40 Minuten plus Diskussion Klare Gliederung Ab und an Hinweise geben, wo man sich befindet Bilder und Grafiken; Beispiele Font: mind. 16pt Keine Sätze: Stichwörter Vorträge können auch unterhaltend sein • Gimmicks, Gags, Rhythmuswechsel, Einbeziehen der Zuhörer, etc. • Adressat sind alle Seminarteilnehmer, nicht nur die Betreuer • Technik: Laptop? Powerpoint? Disketten? Pointer? Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Hinweise zur Ausarbeitung • • • • Eine gedruckte Version abgeben Selbständigkeitserklärung unterschreiben Eine elektronische schicken (für‘s WWW) Referenzen • Alle verwendeten und nur die • Im Text referenzieren • Liste am Schluss • Korrekt zitieren • Vorsicht vor Übernahme von Textpassagen, wenn, dann deutlich kennzeichnen • Aussagen mit Evidenz oder Verweis auf Literatur versehen • Verwendung von Arbeiten im Netz • Möglich, aber VORSICHT!!!! • Eventuell Themenschwerpunkt verschieben – Betreuer fragen Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Format • • • • • Benutzung unserer Latex-Vorlage Nur ein Font, wenig Wechsel in Schriftgröße und –stärke Inhaltsverzeichnis Bilder: Nummerieren und darauf verweisen Referenzen nummerieren oder • [YYH04] Yan, X., Yu, P. S. and Han, J. (2004). "Graph Indexing: A Frequent Structure-Based Approach". SIGMOD, Paris, France. Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 Hinweise zur Ausarbeitung –2• Gezielt und sachlich schreiben • Ausführungen zur Philosophie des Abendlandes und zu bioethische Konsequenzen schneller Graphalgorithmen möglichst kurz halten • Füllwörter vermeiden (dabei, hierbei, dann, …) • Knappe Darlegung, präzise Sprache • Eine gute Gliederung ist die halbe Miete • Die Welt ist das Publikum, nicht der Dozent • Kommen Sie zu Aussagen • Vorteile, Nachteile, verwandte Arbeiten, mögliche Erweiterungen, Anwendbarkeit, eigene Erfahrungen, … Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08 • Fragen ? Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08