mp3 - Electrosuisse

Transcription

mp3 - Electrosuisse
mp3:
Ein Algorithmus erobert die Welt
Prof. Dr.-Ing. Karlheinz Brandenburg
TU Ilmenau, Institut für Medientechnik
Fraunhofer Institut für Digitale Medientechnologie
November 2005
Prof. Karlheinz Brandenburg, [email protected]
Page 1
Überblick
• Einführung: Träume werden manchmal war
• Die Anfänge
– Eine Idee, die als unmöglich gilt
– Erste Erfolge
• Grundlagenforschung, Standardisierung und
mehr
• Der Weg in den Markt
• Was kommt als Nächstes ?
Prof. Karlheinz Brandenburg, [email protected]
Page 2
mp3 überall ?
• „mp3“ = Musik im Internet !?
• Status 2005:
– Mehr als 500 Mio. Software-Player
– DVD-Spieler, Autoradios, CD-Spieler: alle mit mp3
– für viele gilt: digitale Musik = .mp3
• Befreiung der Musik vom physikalischen
Trägermedium
• Speicherung / Übertragung um Faktor 12 (oder
mehr) billiger
• Was steckt dahinter ?
Prof. Karlheinz Brandenburg, [email protected]
Page 3
Träume 1983
• Es gab Datenreduktion für Bilder, Video,
Sprache, nicht für Musik
• Musikaufzeichnung sollte besser gehen als nur
mit CC
• Digitaler Hörrundfunk soll viel besser klingen
• Kann man denn nicht Musik über das Telefon
auch in guter Qualität übertragen ?
Prof. Seitzer: welche Qualität ist möglich ?
-> Doktorand K. Brandenburg
Prof. Karlheinz Brandenburg, [email protected]
Page 4
Was ist Audiocodierung
• Datenreduzierte Speicherung / Übertragung von
Audiosignalen hoher Qualität
– im Normalfall nicht verlustfrei (Verringerung von
irrelevanten Anteilen)
– Qualitätskriterium ist der subjektive Unterschied
zum Original
• Grundidee gehörangepaßte Codierung
– Die Signalsenke ist das Kriterium: das
menschliche Gehör
– Das Ohr ist ein feines Instrument, aber
• wir hören nicht alles
• laute Töne verdecken leisere
Prof. Karlheinz Brandenburg, [email protected]
Page 5
Schlüsseltechnologie Audiocodierung
• Audiocodierung ermöglicht Speicherung der
vielfachen Musikmenge
• Gehörangepaßte Codierung verändert die
Audioqualität nicht oder kaum
• Wo überall Speicherkapazität oder Bandbreite
Geld kostet, ist Audiocodierung von Vorteil:
– digitales Radio
– Übertragung zum Sender / Studio
– Speicherung großer Musikmengen (Archive)
– Speicherung am Computer
– Übertragung über das Internet
– Audioabspieler ohne Mechanik
Prof. Karlheinz Brandenburg, [email protected]
Page 6
Grundlagenforschung:
• Ende der 70’er Jahre
– Prof. Seitzer: Idee von Musik über ISDN
– erste gehörangepaßte Verfahren:
• MIT Lincoln Labs (Codierung)
• AT&T Bell Laboratories (Messung)
• Anfang der 80’er Jahre
– Beginn der Arbeiten in Erlangen (und Duisburg)
– Echtzeitrealisierung aufbauend auf Arbeiten von
Zelinski/Noll (HHI)
– erste Ergebnisse und Veröffentlichungen
• “kann ja nicht funktionieren”
• “wird nicht gebraucht”
• 1986: technisch der Durchbruch (OCF)
Prof. Karlheinz Brandenburg, [email protected]
Page 7
Grundlagen: Psychoakustik (z.B. nach Zwicker)
80
dB
f m =0,25
60
LT
f m =4kHz
f m =1kHz
40
20
0
0,02
Ruhehörschwelle
0,05
0,1
0,2
0,5
1
2
Maskierer
Prof. Karlheinz Brandenburg, [email protected]
Page 8
5
10
fT
20 kHz
Demo: Das "13 dB-miracle” (Johnston/Brandenburg 1989)
• Original-Signal
• Original + weißes Rauschen, S/N = 13,6 dB
• Original + Rauschen an der Hörschwelle,
S/N = 13,6 dB
• Differenzsignal (moduliertes Rauschen)
• Differenzsignal (gefärbtes Rauschen, an der
Hörschwelle)
Prof. Karlheinz Brandenburg, [email protected]
Page 9
Gehörangepaßte Audiocodierung:
Digital
Audio
Input
Bit or Noise
Allocation
Filter Bank
Signal to
Mask Ratio
Psychoacoustic
Model
Prof. Karlheinz Brandenburg, [email protected]
Page 10
Quantized
Samples
Bitstream
Formatting
Encoded
Bitstream
Erste Kontakte mit deutscher Industrie
• 1983, (damals) großer deutscher
Unterhaltungselektronik-Hersteller:
– Wird nicht funktionieren
– Wer braucht das ?
• 1986, erste Konferenzveröffentlichungen:
– Wird nicht funktionieren
– Wer braucht das ?
• 1988
– Das Patent ist nichts wert
– Wir haben uns schon für andere Technik
entschieden
Prof. Karlheinz Brandenburg, [email protected]
Page 11
Das Team
1987
Prof. Karlheinz Brandenburg, [email protected]
Page 12
Standardisierung: Der Weg in MPEG
• Dezember 1988: erstes Treffen von MPEG Audio
– alle bekannten Forschungsgruppen nehmen teil
– Fraunhofer stellt OCF-Echtzeitsystem vor
• Die Anforderungen an MPEG-Audio spiegeln
deutlich den Einfluß von DAB wieder
• MPEG erzwingt Zusammenarbeit, unser Cluster
– Fraunhofer / Universität Erlangen-Nürnberg
– AT&T Bell Laboratories
– Deutsche Thomson-Brandt (jetzt Thomson)
– CNET
• Die “bayrischen” Vorschläge sind am Ende an
der Spitze
Prof. Karlheinz Brandenburg, [email protected]
Page 13
Was ist "mp3"
• Die Bezeichnung für den Standard
ISO/IEC JTC1/WG11 MPEG-1 IS 11172-3 Layer-3
• MPEG: Moving Pictures Experts Group
• MPEG-1: Ein Standard für Bewegtbilder (Video
in VHS-Qualität) und Begleitton
• entwickelt für
– Begleitton für Video
– digitalen Rundfunk
• Layer-3 ist einer von drei Modi im Standard
Prof. Karlheinz Brandenburg, [email protected]
Page 14
Block-Diagramm Layer-3
Prof. Karlheinz Brandenburg, [email protected]
Page 15
Welche MPEG-Standards gibt es ?
• MPEG-1: Dez. 1992, VCD
• MPEG-2: ab 1994, digitales Fernsehen
– mit MPEG-2 Advanced Audio Coding (AAC)
• MPEG-4: ab 1999, Multimedia, Streaming
• kein MPEG-3 (war mal geplant, durch MPEG-2
überholt)
• MPEG-7: ab 2001, Multimedia Content
Description
• MPEG-21: ab 2003, Multimedia Framework
Prof. Karlheinz Brandenburg, [email protected]
Page 16
Status 1992:
• Professionelle Anwendungen:
– MPEG Layer-2 (Jingle-Abspieler, ISDN)
– MPEG Layer-3 (nur einzelne Geräte)
– Dolby AC-2 und andere
• Consumeranwendungen:
– MPEG Layer-1 (DCC)
– MPEG Layer-2
• DAB
• CD-I (mit Video)
– Dolby AC-2
– kein MPEG Layer-3
Prof. Karlheinz Brandenburg, [email protected]
Page 17
FhG-Strategie 1993
• Setzen auf den Markt für Profigeräte
• Beginn der Zusammenarbeit mit Micronas
(damals Intermetall)
• Telos Systems setzt auf Layer-3:
– kleine amerikanische Firma
– eigene Kapazität zur Entwicklung von Hardware
– sehr gutes Marketing im Rundfunkbereich
– wichtigste Person: Steve Church
• Dialog-4 (Ludwigsburg) setzt auf Layer-3
• Juli 1993: Gründung der Abteilung AMM
• AES New York 1993: Stimmungsumschwung
Prof. Karlheinz Brandenburg, [email protected]
Page 18
1994 / 1995:
• FAQ (Harald Popp), Internet als Vertriebsweg
• Shareware als Marketinginstrument:
gute Encoder/Decoder zum Testen für alle
• Erste Pläne zu Echtzeitdecodierung auf PC’s
• weitere Anwender im Profibereich, Telos
erreicht erheblichen Marktanteil
• MPEG-2 Audio LSF-Erweiterungen werden
fertiggestellt
• Der erste MASC - Layer-3 - Decoderchip läuft
Prof. Karlheinz Brandenburg, [email protected]
Page 19
1995: Die Strategie funktioniert
• Worldspace entscheidet sich für Layer-3,
erste Consumeranwendung
• PC's werden schnell genug für Echtzeitdecodierung
– erster WinPlay
• Erste Kontakte zur Musikindustrie und
Rechteorganisationen (über ein EU-gefördertes
Projekt)
• Ricki Adar will gesichterten Musikvertrieb mit
MP3 und Kopierschutz starten
• Bewusstes Setzen auf das Internet als
Marketing-Instrument
• Erste Kopierschutzsysteme aus Erlangen
Prof. Karlheinz Brandenburg, [email protected]
Page 20
Der Weg in den Markt:
MP3 und das Internet
Oder: vom Aussenseiterdasein zum Erfolg
Wie mp3 sich im Internet durchsetzte:
• 1995:
– Winplay3 als Demo, Name mp3 (14.7.95)
• Registriercodes bald im Netz verfügbar
– l3enc / l3dec eigentlich nur für Profinutzer oder
Bastler, Encoder sind teuer
– IUMA mit Musik im Layer-2-Format
– Macromedia lizensiert Layer-3
• 1996:
– andere Decoder werden geschrieben
– erste Lizenz an Microsoft
• 1997:
– ein Windows-Encoder wird gestohlen
– mp3.com startet
Prof. Karlheinz Brandenburg, [email protected]
Page 22
Probleme der Musikindustrie mit mp3:
• Folgendes wurde plötzlich um den Faktor 12
(die typische Kompressionsrate) billiger:
– Kosten der Speicherung von Musik am PC
– Kosten des Transfers von Musik über CD-ROM
– Kosten der Übertragung von Musik über Internet
• Beginnend mit amerikanischen Studenten,
wurde der Austausch von mp3-Musik zum
Volkssport
• Analoge Kassetten erlauben keine Kopie der
Kopie, mp3's behalten ihre Qualität (solange
nicht zwischendurch decodiert/encodiert wird)
• die Herkunft von mp3's ist nicht feststellbar
(anonymes Veröffentlichen ist möglich)
Prof. Karlheinz Brandenburg, [email protected]
Page 23
Reaktionen der Musikindustrie
• zunächst: "geht uns nichts an"
• ab 1997: langsames Verstehen der Situation,
Versuch durch Schließung von Web-Sites .mp3
zu verbannen
• Bis vor kurzem war es schwierig, legale
elektronische Vertriebsrechte zu bekommen:
– wer soll in Zukunft das Geschäft betreiben ?
– oft ist die Rechtslage völlig unklar
• seit Ende 1997 Entstehen einer "alternativen"
Musikverlagsbranche:
– elektronischer Vertrieb ohne Sicherheitssysteme
• seit 1999: Peer-to-Peer - Systeme
• gesicherte Systeme haben es bis jetzt doppelt
schwer: kein Content, Konkurrenz zu .mp3
Prof. Karlheinz Brandenburg, [email protected]
Page 24
Piraten und die Musikindustrie
• erste mp3-Websites Ende 1996 / Anfang 1997
• Sommer 1997: Gerichtsbeschlüsse,
Bekanntmachung in USA Today
– Reaktion: mehr Piraten
• Rio PMP300 (erster mp3-Player in den Läden) im
Sommer 1998 angekündigt
• Herbst 1998: Gerichtsverfahren gegen Diamond
• Die RIAA verliert das Gerichtsverfahren
– Reaktion: mehr Piraten
Prof. Karlheinz Brandenburg, [email protected]
• Ende 1999: Napster tritt auf ...
• 2001: viele der neuen Firmen werden aufgekauft
• 2003: die Musikindustrie kündigt wieder einmal
neue Services an, Apple ist erfolgreich
Page 25
Musik früher, heute und in Zukunft
• Musik wurde schon immer kopiert
– aber: Tonbandkopien sind immer schlechter als
die Schallplatte
– die Kopie von der Kopie ist nicht mehr anhörbar
• Wo wird für Musik gezahlt, wo nicht ?
– Schallplatte / CD: zahlen
– Radio: nur Grundgebühr (Radiostation zahlt)
– Privatkopie: Lehrkassettenabgabe etc.
– Hintergrundmusik, Restaurants etc: indirekt
• Produktpiraterie:
– Problem durch kommerzielle Anbieter, die nicht
an die Rechteinhaber zahlen
Prof. Karlheinz Brandenburg, [email protected]
Page 26
Szenarien für die Zukunft (1)
• "Musik ist frei"
– Keine Sicherheitssysteme
– Keine Verfolgung des Musikvertriebs durch
Piraten
– Alternative Einnahmequellen für Künstler und
Vertrieb: Konzerte, Werbung, Verkauf nur
physikalischer Medien
– Modell ist sehr unbeliebt bei Künstlern und
Verlagen
• Vertrauensmodell
– keine Sicherheitssysteme, aber der Anspruch auf
Schutz des Copyright bleibt bestehen
– Wer lebt in Wohnungen ohne Türen ?
Prof. Karlheinz Brandenburg, [email protected]
Page 27
Szenarien für die Zukunft (2)
• gesichertes, standardisiertes System:
– mit der Erzeugung von Musik werden Rechte
vergeben und eingebettet ("darf kopiert
werden")
– Standard macht die Benutzung einfach
– schöner Traum, derzeit aber ohne
Realisierungschance
• mehrere Vertriebswege
– die "Großen" (vielleicht weniger Marktanteil)
– mehr unabhängige Firmen, jede/r kann Musik
veröffentlichen und vertreiben
• auf jeden Fall: mehr Musik verfügbar
Prof. Karlheinz Brandenburg, [email protected]
Page 28
Was kommt nach mp3 ?
Fortschritte in der Audiocodierung
Die Stereoanlage der Zukunft
Fortschritte in der Audiocodierung
• 1994: Bessere Nachfolger zu MPEG-Audio
werden gesucht
– Wenn schon Konkurrenz, dann von uns selber
– 1997: MPEG Advanced Audio Coding (AAC)
• 2001: HE-AAC (High Efficiency AAC)
• Verwendung von AAC
– Japanisches Fernsehen/Rundfunk
– Amerikanisches Satellitenradio (XM Radio)
– Apple iTunes music shop
– 3rd generation mobile (Musikdownload)
Prof. Karlheinz Brandenburg, [email protected]
Page 30
Welche Bitrate ist für gute Qualität notwendig ?
• 1990 256 kbit/s ASPEC, MUSICAM
würde heutige Hörtests nicht bestehen
• 1992 192 kbit/s MPEG-1 Layer-3
• 1994 128 kbit/s MPEG-1 Layer-3 (".mp3")
einschließlich “joint stereo”-Techniken
manche Signale klingen fürchterlich
• 1997 96 kbit/s MPEG-2 Advanced Audio Coding
• 2000 64 kbit/s AAC-based MPEG-4
• 2000 48 kbit/s AAC+ (CT enhancements)
gut genug für viele Anwendungen, siehe die Demo
Prof. Karlheinz Brandenburg, [email protected]
Page 31
Demo: Can you hear it (Version 4, 2000) ?
Jedes “?” bezeichnet entweder
O (Original, 1536 kbit/s pro Stereosignal) oder
C (codiert, 48 kbps pro Stereosignal, Faktor 32 !)
(AAC, verbessert von Coding Technologies)
Prof. Karlheinz Brandenburg, [email protected]
Trumpet solo
O
?
?
?
Speech
O
?
?
?
Abba
O
?
?
?
Page 32
Die Stereoanlage der Zukunft (so nicht ☺)
Prof. Karlheinz Brandenburg, [email protected]
Page 33
Die Stereoanlage der Zukunft:
• merkt sich die Musik:
– jede CD nur einmal einlegen, immer wieder
abspielen können
• hilft mir beim Suchen von Musik
– “query by humming”, ich pfeife meiner Anlage
etwas vor
– Suche nach Merkmalen in meiner Musiksammlung
– Suche im Internet
– wo kann ich Neues probehören / kaufen ?
• hilft mir beim Zusammenstellen meiner
Lieblingsmusik
– was klingt ähnlich, ist aber neu ?
– “spiel mir meine Lieblingsmusik für diese Uhrzeit”
Prof. Karlheinz Brandenburg, [email protected]
Page 34
AudioID - Systemüberblick
Prof. Karlheinz Brandenburg, [email protected]
Page 35
AudioID
Prof. Karlheinz Brandenburg, [email protected]
Page 36
Beispiele für die Melodie basierte Suche
Funktionalität
Anwendungen
Prof. Karlheinz Brandenburg, [email protected]
• Suche nach melodischen Phrasen / Motiven in
Datenbanken transkribierter Musik (z.B. MIDI)
– Basierend auf MPEG-7 Metadaten-Beschreibung
– Verfügbarkeit schneller Suchalgorithmen für
nicht-exakte Suche, z.B. angelehnt an
»DNA Sequencing«-Technologien
– Fehlertolerant gegenüber Benutzereingaben
• Musikhandel / Serviceanbieter für
Mobiltelefonnetze
• Themensuche in Musik-Katalogen
• Musik-Wissenschaften
• Karaoke-Systeme / Spiele
• »Query by Humming / Playing / Singing«
Page 37
Query by Humming
im Saturn-Markt
München
Prof. Karlheinz Brandenburg, [email protected]
Page 38
Andere Forschung
• Klangfeldsynthese
– Viel mehr Daten
– Viel besseres Erlebnis
– Klang wird
revolutioniert
Prof. Karlheinz Brandenburg, [email protected]
Page 39
Musik wie im Konzertsaal:
• Stereo ist gut, Surround-Klang ist besser, aber:
– nur solange Anlage und Akustik sehr gut sind
– nur solange ich an der richtigen Stelle sitze
– nur für einzelne Hörer
• “Virtuelle Akustik” bringt den Konzertsaal nach
hause:
– elektronische (Teil-) Korrektur der Akustik
– Klangfeldsynthese (akustische Holographie)
– unscheinbare Flachlautsprecher
– “wir sind jetzt in Reihe 7, Sitz 18 des
Musikvereinssaals in Wien”
– die Sängerin kann virtuell im Raum stehen
Prof. Karlheinz Brandenburg, [email protected]
Page 40
Wellenfeldsynthese
Sekundärquellen
Huygens´sches Prinzip
(1690)
Primärquelle
Prof. Karlheinz Brandenburg, [email protected]
Page 41
© Diemer de Vries,
Rinus Boone (TU Delft, NL)
Wellenfeldsynthese
Zeitverzögerung,
Amplitudenskalierung
Prof. Karlheinz Brandenburg, [email protected]
Page 42
Wellenfeldsynthese
Prof. Karlheinz Brandenburg, [email protected]
Page 43
Das erste Kino mit Klangfeldsynthese
Prof. Karlheinz Brandenburg, [email protected]
Page 44
Bregenzer Festspiele 2005
Prof. Karlheinz Brandenburg, [email protected]
Page 45
Vorstellung: Institut für Medientechnik TU Ilmenau
• Trägt den Studiengang „Medientechnologie“
– Einziger medientechnischer Studiengang an
einer Universität
– 150 - 200 Studenten pro Jahr
• Fachgebiete
– Elektronische Medientechnik
– Audiovisuelle Technik
– Medienproduktion
– Angewandte Mediensysteme
• Verbindungen zu weiteren
Medienstudiengängen in Ilmenau:
– Medienwirtschaft
– Angewandte Medienwissenschaften
Prof. Karlheinz Brandenburg, [email protected]
Page 46
Institut für Digitale Medientechnologie IDMT
Gegründet als FhG IIS/AEMT: 2000
Eigenständiges Institut: 2004
Standorte: Ilmenau
URL: http://www.idmt.fraunhofer.de
Mitarbeiter: 56
Abteilungen:
Technologie der
Unterhaltungselektronik
Metadaten
Audioapplikationen
Prof. Karlheinz Brandenburg, [email protected]
Page 47
Ausblick
• Es gibt weiterhin Spitzenforschung in
Deutschland und Europa
• Der Weg zur Umsetzung ist steinig
– Zitat Max Rauner, die Zeit:
„Vision, Überstunden und Sturheit“
– Gute Ideen haben es in Deutschland immer noch
schwieriger, Unterstützung zu bekommen
• Es gibt viele faszinierende neue Themen
• Das digitale Zeitalter hat erst angefangen
Prof. Karlheinz Brandenburg, [email protected]
Page 48