Folien

Transcription

Folien
Datenmanagement in
Sensornetzen
Seminar
Sommersemester 2007
Ulf Leser, Timo Mika Gläßer
Wissensmanagement in der Bioinformatik
Wireless Sensor Networks
•4Mhz, 8 bit Atmel RISC uProc
•40 kbit Radio
•4 K RAM, 128 K program Flash, 512 K
data flash
•AA battery pack
•special OS e.g. TinyOS
•sensors: weather, temperature, light, air
pressure, humidity, acceleration, ...
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
... some projects using WSNs
• Great Duck Island & Redwood,
University of California, Berkeley
=> SNDB
• GlacsWeb, University of
Southampton => h.-b.
• Volcano Tungurahua, Harvard
University => h.-b.
• GeoNet, CENS, LA => h.-b.
• ...
GeoNet, Peru
... there still are some more!
• Fence Monitoring, Freie
Universität Berlin => h.-b.
• Mexico Experiment,
CENS, LA => h.-b.
...
• Safer, HumboldtUniversität zu Berlin =>
h.-b.
• ...
Datamanagement in WSN
• sensors generate data that needs to be
• transported
• different strategies for routing
• processed
• different query languages and paradigms
• different optimization techniques
• stored
• alternative storage devices
• new indexing strategies
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Voraussetzungen
• Voraussetzung
• Vordiplom (je nach Studienordnung)
• Halbkurs Datenbanken I
• Englische Originalveröffentlichungen lesen
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Ablauf
• Heute: Themenvorstellung und Themenvergabe
• Besprechung der Themen bis zum 31.5.2007
• Mit dem jeweiligen Betreuer – individuelle Termine machen
• Besprechung der Folien bis zum 30.6.2007
• Mit dem jeweiligen Betreuer – individuelle Termine machen
• Blockseminar: tba (1-2 Tage am Semesterende)
• Seminararbeiten: Abgabe bis 30.8.2007
• Frühzeitig Termine machen
–
–
–
–
Ulf Leser
IV.103, 2093 – 3902
Timo Gläser
IV.104, 2093 – 3904
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Ablauf
• Themen
• Maximal 2 Studenten pro Thema
• Vorbesprechung des Themas: Nicht freiwillig
• Vortrag
• Blockseminar mit Anwesenheitspflicht
• Ca. 40 min plus Diskussion
• Besprechung der Folien: Nicht freiwillig
• Seminararbeit
• Schriftliche Ausarbeitung zum Thema (10-20 Seiten)
• Abgabe bis zum 31.8.2007: Nicht freiwillig
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Fragen meinerseits
• Fragen?
• Diplominformatiker?
• Semester?
• Datenbanken?
• Besondere Gründe?
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Themengebiete
Routing
Directed Diffusion (TG)
Semantic Gossiping (UL)
Content-based Routing(TG)
Middleware
FACTS (TG)
REGIMENT (TG)
Datenmanagement
TinyDB (UL)
Cougar (UL)
SwissQM ()
PubSub
TelegraphCQ (TG)
Cayuga (UL)
Model-Driven
MauveDB (UL)
Presto (UL)
Indexing
MicroHash (TG)
DIFS (TG)
Evt. PROTO
Ev. sdlib
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Directed Diffusion (TG)
• routing for data-centric networks (nodes are not
important)
• publish/subscibr
• sinks „diffuse“ interests through the network
• various implementations
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Gossiping (UL)
• Context: Large-scale P2P
and PDMS
• Old-style: Napster
• New-stlye: Fully
decentralized
•PDBMS: Schemas and Mappings
•Queries routed along mappings
–Loss in accuracy: gossiping
•How can we assess the quality of a
return result?
•Key idea: Use cycles
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Contend-Based Routing (TG)
• routing algorithm for streambased systems
• observation: data from different
nodes in a network has different
value distributions
• idea: save „costs“ in evaluating
the operators of the query
execution tree in a different
order depending on the data
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
FACTS (TG)
• rule-based programming language for
sensor networks
• user doesn‘t have to care about
memory, pointers etc.
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Regiment (TG)
• functional approach to
programming sensor
networks
• functions provide high-level
abstraction for manipulation
of program state and can be
optimized during compile and
run-time
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
TinyDB (UL)
•
Acquisitional query processing
•
Obtaining data in a node is not free
•
Optimize for minimal sensor activity (and communication cost)
•
“Stream-style” queries – query is fixed, data changes, periodical
reprocessing
•
Full-blown (functional?) system
Quelle: http://www.uio.no/studier/emner/matnat/ifi/INF5100/h06/undervisningsmateriale/handouts/TinyDB.pdf
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Cougar (UL)
• „The network is the database“
• Sensors are modeled as abstract data types
• Model of in-network query optimization
• Merge packets to save communication cost
• Use probabilistic guarantees for accuracy of data
• Especially in-network aggregation – Who? Where? When?
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
TelegraphCQ (TG)
• „continous data flow processing
for an uncertain world“
• turns „database“ upside down
• queries are long-running
• need to be shared efficiently
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Cayuga (UL)
• Network does not answer queries, but detects events
• Specified as queries
• Nodes register many queries and receive many base
events
• Need to compute and send notifications very efficiently
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
MauveDB (UL)
• Idea: usually, temperature
doesn‘t change abruptly
•
But following a regular pattern over
days and seasons
• Build a model of the
distribution of
measurements
• Only query sensors when
model and data diverge
•
Upon query, pull some (few)
sensors
•
When measurements follow model,
predict other measures
• Here is the saving!
•
Otherwise, ask all sensors and
update model
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Presto (UL)
• Like Mauve-DB, but PUSH-based
• Two types of nodes: Sensors and proxies
• Both store model of their measurement distribution
• Only when model and data diverge, new data is pushed to the
proxy
• Proxies answer queries
• Savings:
• Push: One communication
• Pull: Two communications
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
MicroHash (TG)
• hash-based index for sensor nodes
• data may be stored on flash
• cheap in terms of energy, large capacity
• different characteristics for reading/writing pages need to
be considered e.g. failure after 10.000 - 100.000 writes,
slow etc.
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
DIFS (TG)
• distributed hash-index similiar to
GHT
• data is hashed to coordinates
and stored at the node closest
to the coordinates
• supports efficient search in
many dimensions e.g. name,
values, location
• supports range queries
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Themenvergabe
Routing
Middleware
Datenmanagement
PubSub
Model-Driven
Indexing
Directed Diffusion (TG)
Semmler
Semantic Gossiping (UL)
Gebhardt
Content-based Routing(TG)
Dießler
FACTS (TG)
Buerschaper
REGIMENT (TG)
Heimes
TinyDB (UL)
Ganzer
Cougar (UL)
Pfeiffer
SWISSQM (TG)
Wagner
TelegraphCQ (TG)
Hertlein
Cayuga (UL)
Radünz
MauveDB (UL)
Hellwig
Presto (UL)
Wenzlaff
MicroHash (TG)
Zahn
DIFS (TG)
Knebel
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Allgemeine Hinweise
• Dozenten sind ansprechbar!
• Vorbesprechung des Themas
• Folien durchgehen
• Abgrenzung der Ausarbeitung
• Diskussion erwünscht
• Keine Angst vor Fragen: Fragen sind keine Kritik
• Eine Frage nicht beantworten können ist in Ordnung – dazu ist
Diskussion da
• Tiefe, nicht Breite
• Lieber das Thema einengen und dafür Details darstellen
• Bezug nehmen
• Einordnung der Arbeit im Seminarthema vornehmen
• Vergleich zu anderen Arbeiten im Seminar
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Allgemeine Hinweise
• Werten und bewerten
• Keine Angst vor nicht ganz zutreffenden Aussagen – solange gute
Gründe vorhanden sind
• Begründen und argumentieren
• Kritikloses Abschreiben ist fehl am Platz
• Literaturrecherche ist erwünscht
• Die ausgegebenen Arbeiten sind Anker
• Weiterführende Arbeiten müssen herangezogen werden
• Auch Grundlagen nachlesen
• Wir schicken eine Abhackliste rum
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Hinweise zum Vortrag
•
•
•
•
•
•
•
Ca. 40 Minuten plus Diskussion
Klare Gliederung
Ab und an Hinweise geben, wo man sich befindet
Bilder und Grafiken; Beispiele
Font: mind. 16pt
Keine Sätze: Stichwörter
Vorträge können auch unterhaltend sein
• Gimmicks, Gags, Rhythmuswechsel, Einbeziehen der Zuhörer, etc.
• Adressat sind alle Seminarteilnehmer, nicht nur die
Betreuer
• Technik: Laptop? Powerpoint? Disketten? Pointer?
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Hinweise zur Ausarbeitung
•
•
•
•
Eine gedruckte Version abgeben
Selbständigkeitserklärung unterschreiben
Eine elektronische schicken (für‘s WWW)
Referenzen
• Alle verwendeten und nur die
• Im Text referenzieren
• Liste am Schluss
• Korrekt zitieren
• Vorsicht vor Übernahme von Textpassagen, wenn, dann deutlich
kennzeichnen
• Aussagen mit Evidenz oder Verweis auf Literatur versehen
• Verwendung von Arbeiten im Netz
• Möglich, aber VORSICHT!!!!
• Eventuell Themenschwerpunkt verschieben – Betreuer fragen
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Format
•
•
•
•
•
Benutzung unserer Latex-Vorlage
Nur ein Font, wenig Wechsel in Schriftgröße und –stärke
Inhaltsverzeichnis
Bilder: Nummerieren und darauf verweisen
Referenzen nummerieren oder
• [YYH04] Yan, X., Yu, P. S. and Han, J. (2004). "Graph Indexing: A
Frequent Structure-Based Approach". SIGMOD, Paris, France.
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
Hinweise zur Ausarbeitung –2• Gezielt und sachlich schreiben
• Ausführungen zur Philosophie des Abendlandes und zu bioethische
Konsequenzen schneller Graphalgorithmen möglichst kurz halten
• Füllwörter vermeiden (dabei, hierbei, dann, …)
• Knappe Darlegung, präzise Sprache
• Eine gute Gliederung ist die halbe Miete
• Die Welt ist das Publikum, nicht der Dozent
• Kommen Sie zu Aussagen
• Vorteile, Nachteile, verwandte Arbeiten, mögliche Erweiterungen,
Anwendbarkeit, eigene Erfahrungen, …
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08
• Fragen ?
Ulf Leser, Timo Mika Gläßer, Datenmanagement in Sensornetzen, WS 07/08