MP3

MPEG Audioschicht III, allgemeiner verwiesen auf als MP3, ist ein patentiertes Digitalaudioverschlüsselungsformat mit einer Form der lossy Datenkompression. Es ist ein allgemeines Audioformat für den Verbraucher Audiolagerung, sowie ein De-Facto-Standard der Digitalaudiokompression für die Übertragung und das Play-Back der Musik auf Digitalaudiospielern.

MP3 ist ein audiospezifisches Format, das von Moving Picture Experts Group (MPEG) als ein Teil seines MPEG-1 Standards entworfen wurde und sich später im MPEG-2 Standard ausgestreckt hat. Die erste MPEG Untergruppe - Audiogruppe wurde von mehreren Mannschaften von Ingenieuren an Fraunhofer IIS, Universität Hannovers, AT&T-Bell Laboratorien, Thomson-Brandt, CCETT und andere gebildet. MPEG-1 Audio-(MPEG-1 Teil 3), der MPEG-1 Audioschicht I, II und III eingeschlossen hat, wurde als ein Komitee-Entwurf des ISO/IEC Standards 1991 genehmigt, 1992 beendet und 1993 (ISO/IEC 11172-3:1993) veröffentlicht. Umgekehrt wurde vereinbares MPEG-2 Audio (MPEG-2 Teil 3) mit zusätzlichen Bit-Raten und Beispielraten 1995 (ISO/IEC 13818-3:1995) veröffentlicht.

Der Gebrauch in MP3 eines lossy Kompressionsalgorithmus wird entworfen, um die Datenmenge außerordentlich zu reduzieren, die erforderlich ist, die Audioaufnahme zu vertreten und noch einer treuen Fortpflanzung des ursprünglichen unkomprimierten Audios für die meisten Zuhörer ähnlich zu sein. Eine MP3 Datei, die mit der Einstellung von 128 kbit/s geschaffen wird, wird auf eine Datei hinauslaufen, die über 1/11 die Größe der von der ursprünglichen Audioquelle geschaffenen CD-Datei ist. Eine MP3 Datei kann auch an höher oder niedrigere Bit-Raten, mit höher oder niedrigere resultierende Qualität gebaut werden.

Die Kompression arbeitet durch das Reduzieren der Genauigkeit von bestimmten Teilen des Tons, die, wie man betrachtet, außer der Gehörentschlossenheitsfähigkeit von den meisten Menschen sind. Diese Methode wird allgemein perceptual das Codieren genannt. Es verwendet psychoacoustic Modelle, um Präzision von Bestandteilen zu verwerfen oder zu reduzieren, die zum menschlichen Hören weniger hörbar sind, und registriert dann die restliche Information auf eine effiziente Weise.

Geschichte

Entwicklung

Der MP3 lossy Audiodatenkompressionsalgorithmus nutzt eine perceptual Beschränkung des Menschen aus, der hört, hat Gehörmaskierung genannt. 1894 hat Alfred Marshall Mayer berichtet, dass ein Ton unhörbar durch einen anderen Ton der niedrigeren Frequenz gemacht werden konnte. 1959 hat Richard Ehmer einen ganzen Satz von Gehörkurven bezüglich dieses Phänomenes beschrieben. Ernst Terhardt. hat einen Algorithmus geschaffen, der Gehörmaskierung mit der hohen Genauigkeit beschreibt. Diese Arbeit hat zu einer Vielfalt von Berichten von Autoren beigetragen, die auf Fletcher, und auf die Arbeit zurückgehen, die am Anfang kritische Verhältnisse und kritische Bandbreite bestimmt hat.

Der psychoacoustic, der codec maskiert, wurde zuerst 1979 anscheinend unabhängig von Manfred R. Schroeder vorgeschlagen, u. a. von AT&T-Bell Laboratorien in Murray Hill, New Jersey, und M. A. Krasner beide in den Vereinigten Staaten. Krasner war erst, um Hardware für die Rede zu veröffentlichen und zu erzeugen (nicht verwendbar, weil Musik Kompression gebissen hat), aber die Veröffentlichung seiner Ergebnisse als ein relativ dunkles Laboratorium von Lincoln, hat Technischer Bericht die Hauptströmung von psychoacoustic codec Entwicklung nicht sofort beeinflusst. Manfred Schroeder war bereits eine wohl bekannte und verehrte Zahl in der Weltgemeinschaft von akustischen und Elektroingenieuren, aber sein Papier wurde nicht sehr bemerkt, seitdem es negative Ergebnisse wegen der besonderen Natur der Rede und der Gewinn-Gegenwart des geradlinigen prophetischen Codierens (LPC) in der Rede beschrieben hat. Sowohl Krasner als auch nach der Arbeit gebauter Schroeder haben durch Eberhard F. geleistet. Zwicker in den Gebieten der Einstimmung und Maskierung von kritischen Bändern, die der Reihe nach auf die Grundlagenforschung im Gebiet von Glockenlaboratorien von Harvey Fletcher und seinen Mitarbeitern gebaut haben. Ein großes Angebot an (größtenteils perceptual) Audiokompressionsalgorithmen wurde in der Schiedsrichter gewesenen Zeitschrift von IEEE auf Ausgewählten Gebieten in Kommunikationen berichtet. Diese Zeitschrift hat im Februar 1988 über eine breite Reihe von feststehenden, arbeitenden Audiobit-Kompressionstechnologien, einige von ihnen berichtet, Gehörmaskierung als ein Teil ihres grundsätzlichen Designs und mehrere sich zeigende Echtzeithardware-Durchführungen verwendend.

Die unmittelbaren Vorgänger von MP3 waren "Das optimale Codieren im Frequenzgebiet" (OCF), und Perceptual Gestalten das Codieren (PXFM) Um. Diese zwei codecs, zusammen mit Block schaltenden Beiträgen von Thomson-Brandt, wurden in einen codec genannt ASPEC verschmolzen, der MPEG vorgelegt wurde, und der die Qualitätskonkurrenz gewonnen hat, aber das wurde als zu kompliziert irrtümlicherweise zurückgewiesen, um durchzuführen. Die erste praktische Durchführung eines perceptual Audiocodierers (OCF) in der Hardware (war die Hardware von Krasner zu beschwerlich und für den praktischen Gebrauch langsam), war eine Durchführung eines psychoacoustic gestalten Codierer um, der auf Motorola 56000 DSP Chips gestützt ist.

Als ein Doktorstudent an Deutschlands Universität Erlangen-Nürnbergs hat Karlheinz Brandenburg begonnen, an der Digitalmusik-Kompression am Anfang der 1980er Jahre zu arbeiten, sich konzentrierend, wie Leute Musik wahrnehmen. Er hat seine Doktorarbeit 1989 vollendet. MP3 wird von OCF und PXFM direkt hinuntergestiegen, das Ergebnis der Kollaboration Brandenburgs vertretend - als der Postdoktor an AT&T-Bell Laboratorien mit James D. (JJ) Johnston AT&T-Bell Laboratorien - mit Fraunhofer Institut für Einheitliche Stromkreise, Erlangen mit relativ geringen Beiträgen vom MP2 Zweig von psychoacoustic Subband-Codierern arbeitend. 1990 ist Brandenburg ein Helfer-Professor an Erlangen-Nürnberg geworden. Während dort er fortgesetzt hat, an der Musik-Kompression mit Wissenschaftlern an der Fraunhofer Gesellschaft zu arbeiten (1993, hat er sich dem Personal des Fraunhofer-Instituts angeschlossen).

Der Liedtischgast von Tom durch Suzanne Vega war das erste von Karlheinz Brandenburg verwendete Lied, um den MP3 zu entwickeln. Brandenburg hat das Lied angenommen, um Zwecke zu prüfen, ihm zuhörend, immer wieder jedes Mal das Schema raffinierend, sicherstellend, dass es die Subtilität der Stimme von Vega nicht nachteilig betroffen hat.

Standardisierung

1991 gab es nur zwei verfügbare Vorschläge, der für einen MPEG Audiostandard völlig bewertet werden konnte: Musicam (Muster maskierend, hat Universales Subband das Einheitliche Codieren angepasst Und Gleichzeitig zu senden), und ASPEC (das Anpassungsfähige Geisterhafte Perceptual Wärmegewicht-Codieren). Die Musicam Technik, wie vorgeschlagen, durch Philips (die Niederlande), CCETT (Frankreich) und Institut für Rundfunktechnik (Deutschland) wurde wegen seiner Einfachheits- und Fehlerrobustheit, sowie seiner niedrigen rechenbetonten mit der Verschlüsselung der hohen Qualität vereinigten Macht gewählt, hat Audio-zusammengepresst. Das Musicam-Format, das auf dem Subband-Codieren gestützt ist, war die Basis des MPEG Audiokompressionsformats (Raten, Struktur von Rahmen, Kopfbällen, Zahl von Proben pro Rahmen probierend).

Viel von seiner Technologie und Ideen wurde in die Definition von ISO MPEG Audioschicht I und Schicht II und die Filterbank vereinigt, die in die Schicht III (MP3) Format als ein Teil der rechenbetont ineffizienten hybriden Filterbank allein ist. Unter dem Vorsitz von Professor Musmann (Universität Hannovers) wurde das Redigieren des Standards unter den Verantwortungen von Leon van de Kerkhof (Schicht I) und Gerhard Stoll (Schicht II) gemacht.

ASPEC war der gemeinsame Vorschlag AT&T Glockenlaboratorien, Thomson Consumer Electronics, Fraunhofer Gesellschaft und CNET. Es hat die höchste Codierleistungsfähigkeit zur Verfügung gestellt.

Eine Arbeitsgruppe, die aus Leon van de Kerkhof (Die Niederlande), Gerhard Stoll (Deutschland), Leonardo Chiariglione (Italien), Yves-François Dehery (Frankreich), Karlheinz Brandenburg (Deutschland) und James D. Johnston (die USA) besteht, hat Ideen von ASPEC genommen, hat die Filterbank von der Schicht 2 integriert, hat einige ihrer eigenen Ideen hinzugefügt und hat MP3 geschaffen, der entworfen wurde, um dieselbe Qualität an 128 kbit/s wie MP2 an 192 kbit/s zu erreichen.

Alle Algorithmen für die MPEG-1 Audioschicht I, II und III wurden 1991 genehmigt und 1992 als ein Teil von MPEG-1, dem ersten Standardgefolge durch MPEG beendet, der auf den internationalen normalen ISO/IEC 11172-3 hinausgelaufen ist (a.k.a. MPEG-1 MPEG-1 oder Audioteil 3), veröffentlicht 1993. Die weitere Arbeit am MPEG Audio wurde 1994 als ein Teil des zweiten Gefolges von MPEG Standards, MPEG-2 beendet, der mehr formell als internationaler normaler ISO/IEC 13818-3 bekannt ist (a.k.a. MPEG-2 Teil 3 oder umgekehrt vereinbares MPEG-2 MPEG-2 oder Audioaudio v. Chr.), ursprünglich veröffentlicht 1995. MPEG-2 Teil 3 (ISO/IEC 13818-3) hat zusätzliche Bit-Raten und Beispielquoten für die MPEG-1 Audioschicht I, II und III definiert. Die neuen ausfallenden Raten sind genau halb mehr als das von denjenigen, die ursprünglich für das MPEG-1 Audio definiert sind. MPEG-2 Teil 3 hat auch das Audio von MPEG-1 durch das Erlauben des Codierens von Audioprogrammen mit mehr als zwei Kanälen, bis zu 5.1 Mehrkanal-erhöht. Es gibt auch MPEG-2.5 Audio-, eine inoffizielle Eigentumserweiterung, die durch Fraunhofer IIS entwickelt ist. Es ermöglicht MP3, hinreichend an sehr niedrigem bitrates und hinzugefügt tiefer ausfallende Frequenzen zu arbeiten. MPEG-2.5 wurde durch MPEG nicht entwickelt und wurde als ein internationaler Standard nie genehmigt.

Zeichen: Der ISO normale ISO/IEC 11172-3 (a.k.a. MPEG-1 Audio-) hat drei Formate definiert: die MPEG-1 Audioschicht I, Schicht II und Schicht III. Der ISO normale ISO/IEC 13818-3 (a.k.a. MPEG-2 Audio-) definiert hat Version des MPEG-1 Audios - MPEG-2 Audioschicht I, Schicht II und Schicht III erweitert. MPEG-2 Audio-(MPEG-2 Teil 3) sollte mit MPEG-2 AAC (MPEG-2 Teil 7 - ISO/IEC 13818-7) nicht verwirrt sein.

Die Kompressionsleistungsfähigkeit von encoders wird normalerweise durch die Bit-Rate definiert, weil Kompressionsverhältnis von der Bit-Tiefe und ausfallenden Rate des Eingangssignals abhängt. Dennoch werden Kompressionsverhältnisse häufig veröffentlicht. Sie können die Rahmen der CD (CD) als Verweisungen (44.1 Kilohertz, 2 Kanäle an 16 Bit pro Kanal oder 2×16 Bit), oder manchmal Digital Audio Tape (DAT) SP Rahmen (48 Kilohertz, 2×16 Bit) verwenden. Kompressionsverhältnisse mit dieser letzten Verweisung sind höher, der das Problem mit dem Gebrauch des Begriff-Kompressionsverhältnisses für lossy encoders demonstriert.

Karlheinz Brandenburg hat eine CD-Aufnahme des Liedes von Suzanne Vega "der Tischgast von Tom" verwendet, um den MP3 Kompressionsalgorithmus zu bewerten und zu raffinieren. Dieses Lied wurde wegen seiner fast monoakustischen Natur und breiten geisterhaften Inhalts gewählt, es leichter machend, Schönheitsfehler im Kompressionsformat während Play-Back zu hören. Einige kennzeichnen scherzend Suzanne Vega als "Die Mutter von MP3". Einige kritischere Audioexzerpte (Glockenspiel, Dreieck, Akkordeon, usw.) wurden von der Europäischen Rundfunkorganisation V3/SQAM Bezugs-CD genommen und sind von Berufstontechnikern verwendet worden, um die subjektive Qualität der MPEG Audioformate zu bewerten. Diese besondere Spur hat ein interessantes Eigentum, in dem die zwei Kanäle fast, aber nicht völlig, dasselbe sind, zu einem Fall führend, wo Binaural Maskierung der Niveau-Depression verursacht das Raumdemaskieren von Geräuschkunsterzeugnissen, wenn der encoder richtig die Situation nicht anerkennt und Korrekturen anwendet, die denjenigen ähnlich sind, die im MPEG-2 AAC psychoacoustic Modell ausführlich berichtet sind.

In eine Aktiengesellschaft umgewandelt zu werden

Eine Bezugssimulierungssoftwaredurchführung, die in der c Sprache geschrieben ist und später als ISO 11172-5 bekannt ist, wurde (in 1991-1996) von den Mitgliedern des ISO MPEG Audiokomitee entwickelt, um Bit entgegenkommende MPEG Audiodateien (Schicht 1, Schicht 2, Schicht 3) zu erzeugen. Es wurde als ein Komitee-Entwurf des ISO/IEC technischen Berichts im März 1994 genehmigt und hat als Dokumenten-CD 11172-5 im April 1994 gedruckt. Es wurde als ein Entwurf technischer Bericht (DTR/DIS) im November 1994 genehmigt, hat 1996 beendet und hat als internationaler Standard ISO/IEC TR 11172-5:1998 1998 veröffentlicht. Die Bezugssoftware auf c Sprache wurde später als ein frei verfügbarer ISO Standard veröffentlicht. In der Nichtechtzeit an mehreren Betriebssystemen arbeitend, ist es im Stande gewesen, die erste Echtzeithardware-Entzifferung (DSP gestützt) des komprimierten Audios zu demonstrieren. Eine andere Echtzeitdurchführung von MPEG Audioencoders war zum Zweck der Digitalrundfunkübertragung (Radio-TUPFER, Fernseh-DVB) zu Verbraucherempfängern verfügbar und hat Spitzenkästen gesetzt.

Am 7. Juli 1994 hat die Fraunhofer Gesellschaft die erste Software MP3 encoder veröffentlicht hat l3enc genannt. Das Dateiformat.mp3 wurde von der Mannschaft von Fraunhofer am 14. Juli 1995 gewählt (vorher, die Dateien waren.bit genannt worden). Mit der ersten Echtzeitsoftware MP3 Spieler Winplay3 (veröffentlicht am 9. September 1995) sind viele Menschen im Stande gewesen, MP3 Dateien auf ihren PCs zu verschlüsseln und abzuspielen. Wegen der relativ kleinen Festplatten zurück in dieser Zeit (~ 500-1000 Mb) lossy Kompression war notwendig, um gestütztes Nichtinstrument zu versorgen (sieh Spurenleser und MIDI) die Musik für

Play-Back auf dem Computer.

Internet

In der zweiten Hälfte von 1994 haben MP3 Dateien begonnen, sich im Internet auszubreiten. Die Beliebtheit von MP3s hat begonnen, sich schnell mit dem Advent des Audiospielers von Nullsoft Winamp, befreit 1997 zu erheben. 1998 wurde der erste tragbare feste Zustand Digitalaudiospieler, wurde MPMan, der durch Informationssysteme von SaeHan entwickelt ist, der Hauptsitz in Seoul, Südkorea hat, veröffentlicht und Rio PMP300, später trotz gesetzlicher Unterdrückungsanstrengungen durch den RIAA verkauft.

Im November 1997 bot die Website mp3.com Tausende von MP3s an, der von unabhängigen Künstlern umsonst geschaffen ist. Die kleine Größe von MP3 Dateien hat das weit verbreitete Gleicher-zu-Gleicher-Dateiteilen der Musik ermöglicht, die von CDs gerissen ist, die vorher fast unmöglich gewesen wären. Das erste große Gleicher-zu-Gleicher-filesharing Netz, Napster, wurde 1999 gestartet.

Die Bequemlichkeit des Schaffens und Teilens MP3s ist auf weit verbreitete Urheberrechtsverletzung hinausgelaufen. Hauptrekordgesellschaften haben behauptet, dass dieses freie Teilen der Musik Verkäufe reduziert hat, und sie "illegale Musik-Vervielfältigung" genannt hat. Sie haben reagiert, indem sie Rechtssachen gegen Napster verfolgt haben (der schließlich geschlossen wurde und später verkauft hat), und gegen individuelle Benutzer, die sich mit dem Dateiteilen beschäftigt haben.

Trotz der Beliebtheit des MP3-Formats verwenden Online-Musik-Einzelhändler häufig andere Eigentumsformate, die encrypted oder verfinstert sind, um es schwierig zu machen, gekaufte Musik-Dateien auf Weisen zu verwenden, die nicht spezifisch von den Rekordgesellschaften autorisiert sind. Der Versuch, den Gebrauch von Dateien zu kontrollieren, ist auf diese Weise als Digitalrecht-Management bekannt. Rekordgesellschaften behaupten, dass das notwendig ist, um die Dateien davon abzuhalten, in Gleicher-zu-Gleicher-Dateiteilen-Netzen bereitgestellt zu werden. Das hat andere Nebenwirkungen aber wie das Hindern von Benutzer, ihre gekaufte Musik auf verschiedenen Typen von Geräten abzuspielen. Jedoch kann der Audioinhalt dieser Dateien gewöhnlich in ein Unencrypted-Format umgewandelt werden. Zum Beispiel wird Benutzern häufig erlaubt, Dateien zur Audio-CD zu verbrennen, die Konvertierung zu einem unencrypted Audioformat verlangt.

Unerlaubte MP3 Datei, die sich teilt, setzt folgende Generation Gleicher-zu-Gleicher-Netze fort. Einige autorisierte Dienstleistungen, wie Beatport, Piepton, Juno Records, eMusic, Zune Marktplatz, Walmart.com, Rhapsodie, die gesetzliche Verkörperung von Napster, und verkaufen Amazon.com uneingeschränkte Musik im MP3-Format.

Audio-Verschlüsselung

Der MPEG-1 Standard schließt keine genaue Spezifizierung für einen MP3 encoder ein, aber stellt wirklich Beispiel psychoacoustic Modelle, Rate-Schleife und ähnlich im nichtnormativen Teil des ursprünglichen Standards zur Verfügung. Zurzeit wird auf diese angedeuteten Durchführungen ganz datiert. Implementers des Standards haben ihre eigenen Algorithmen ausdenken sollen, die passend sind, um Teile der Information vom Audioeingang zu entfernen. Infolgedessen gibt es viele verschiedene MP3 encoders verfügbar, jedes Produzieren Dateien der sich unterscheidenden Qualität. Vergleiche sind weit verfügbar, so ist es für einen zukünftigen Benutzer eines encoder leicht, die beste Wahl zu erforschen. Es muss beachtet werden, dass ein encoder, der bei der Verschlüsselung an höheren Bit-Raten tüchtig ist (solch so LAHM) nicht notwendigerweise ist wie gut in niedrigeren Bit-Raten.

Während der Verschlüsselung werden 576 Zeitabschnitt-Proben genommen und werden in 576 Frequenzgebiet-Proben umgestaltet. Wenn es einen Übergangsprozeß gibt, werden 192 Proben statt 576 genommen. Das wird getan, um die zeitliche Ausbreitung des quantization Geräusches zu beschränken, das den Übergangsprozeß begleitet. (Sieh psychoacoustics.)

Audio-Entzifferung

Die Entzifferung wird andererseits im Standard sorgfältig definiert. Die meisten Decoder sind "bitstream entgegenkommend", was bedeutet, dass die dekomprimierte Produktion - dass sie von einer gegebenen MP3 Datei erzeugen - dasselbe innerhalb eines angegebenen Grads sein wird, Toleranz, als die Produktion angegeben mathematisch im ISO/IEC Dokument des hohen Standards (ISO/IEC 11172-3) rund zu machen. Deshalb basiert der Vergleich von Decodern gewöhnlich darauf, wie rechenbetont effizient sie sind (d. h., wie viel Gedächtnis oder Zentraleinheitszeit sie im Entzifferungsprozess verwenden).

Audioqualität

Wenn

es lossy Audioverschlüsselung, wie das Schaffen einer MP3 Datei durchführt, gibt es einen Umtausch zwischen der verfügbaren Fläche verwendet und der gesunden Qualität des Ergebnisses. Gewöhnlich wird dem Schöpfer erlaubt, wenig Rate zu setzen, die angibt, wie viele Kilobits die Datei pro Sekunde des Audios verwenden kann. Je höher die Bit-Rate, desto größer die komprimierte Datei, und, allgemein, das nähere sein wird, das es zur ursprünglichen Datei erklingen lassen wird.

Mit zu niedrig wenig Rate können Kompressionskunsterzeugnisse (d. h., Töne, die in der Uraufschreibung nicht da gewesen sind) in der Fortpflanzung hörbar sein. Ein Audio ist zur Kompresse wegen seiner Zufälligkeit und scharfer Angriffe hart. Wenn dieser Typ des Audios zusammengepresst wird, werden Kunsterzeugnisse wie das Klingeln oder Vorecho gewöhnlich gehört. Eine Probe des mit einer relativ niedrigen Bit-Rate zusammengepressten Beifalls stellt ein gutes Beispiel von Kompressionskunsterzeugnissen zur Verfügung.

Außer der Bit-Rate eines verschlüsselten Stückes des Audios hängt die Qualität von MP3 Dateien auch von der Qualität des encoder selbst und der Schwierigkeit des Signals ab, das wird verschlüsselt. Da der MP3 Standard ziemlich wenig Freiheit mit der Verschlüsselung von Algorithmen erlaubt, kann verschiedener encoders ziemlich verschiedene Qualität sogar mit identischen Bit-Raten zeigen. Als ein Beispiel, in einem öffentlichen hörenden Test, der zwei verschiedene MP3 encoders an ungefähr 128 kbit/s zeigt, hat man 3.66 auf einer 1-5 Skala, während anderes eingekerbtes nur 2.22 gezählt.

Qualität ist von der Wahl von encoder und Verschlüsselungsrahmen abhängig.

Der einfachste Typ der MP3 Datei verwendet Ein-Bit-Quote für die komplette Datei — das ist als Verschlüsselung von Constant Bit Rate (CBR) bekannt. Das Verwenden einer unveränderlichen Bit-Rate macht Verschlüsselung einfacher und schneller. Jedoch ist es auch möglich, Dateien zu schaffen, wo sich die Bit-Rate überall in der Datei ändert. Diese sind als Dateien von Variable Bit Rate (VBR) bekannt. Die Idee dahinter besteht darin, dass, in jedem Stück des Audios, einige Teile zur Kompresse, wie Schweigen oder Musik viel leichter sein werden, die nur einige Instrumente enthält, während andere zur Kompresse schwieriger sein werden. Also, die gesamte Qualität der Datei kann durch das Verwenden einer niedrigeren Bit-Quote für die weniger komplizierten Durchgänge und einen höheren für die komplizierteren Teile vergrößert werden. Mit einem encoders ist es möglich, eine gegebene Qualität anzugeben, und der encoder wird die Bit-Rate entsprechend ändern. Benutzer, die eine besondere "Qualität wissen, die untergeht", der zu ihren Ohren durchsichtig ist, können diesen Wert verwenden, wenn sie ganze ihre Musik verschlüsseln, und im Allgemeinen nicht müssen sich über das Durchführen persönlicher hörender Tests auf jedem Musikstück sorgen, um die richtige Bit-Rate zu bestimmen.

Wahrgenommene Qualität kann unter Einfluss der hörenden Umgebung (Umgebungsgeräusch), Zuhörer-Aufmerksamkeit und Zuhörer-Ausbildung und in den meisten Fällen durch den Zuhörer Audioausrüstung (wie gesunde Karten, Sprecher und Kopfhörer) sein.

Ein Test, der neuen Studenten durch die Universität von Stanford Musik-Professor Jonathan Berger gegeben ist, hat gezeigt, dass sich die Studentenvorliebe für die MP3 Qualitätsmusik jedes Jahr erhoben hat. Berger hat gesagt, dass die Studenten scheinen, die 'Zischen'-Töne zu bevorzugen, die MP3s zur Musik bringen.

Bit-Rate

Mehrer-Bit-Raten werden in der MPEG-1 Audioschicht III Standard angegeben: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, sind 256 und 320 kbit/s und die verfügbaren ausfallenden Frequenzen 32, 44.1 und 48 Kilohertz. Zusätzliche Erweiterungen wurden in der MPEG-2 Audioschicht III definiert: Bit-Raten 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbit/s und ausfallende Frequenzen 16, 22.05 und 24 Kilohertz.

Eine Beispielrate von 44.1 Kilohertz wird fast immer verwendet, weil das auch für die CD Audio-, die Hauptquelle verwendet wird, die verwendet ist, um MP3 Dateien zu schaffen. Eine größere Vielfalt von Bit-Raten wird im Internet verwendet. Die Rate von 128 kbit/s, wird an einem Kompressionsverhältnis 11:1 allgemein verwendet, entsprechende Audioqualität in einem relativ kleinen Raum anbietend. Da Internetbandbreite-Verfügbarkeit und Festplatte-Größen, höhere Bit-Raten zugenommen haben, sind bis zu 320 kbit/s weit verbreitet.

Unkomprimiertes Audio, wie versorgt, auf einer audio-CD hat wenig Rate von 1,411.2 kbit/s, so der bitrates 128, 160 und 192 kbit/s vertreten Kompressionsverhältnisse ungefähr 11:1, 9:1 und 7:1 beziehungsweise.

Sonderbit-Raten bis zu 640 kbit/s können mit dem LAHMEN encoder und der freeformat Auswahl erreicht werden, obwohl wenige MP3 Spieler jene Dateien spielen können. Gemäß dem ISO Standard sind Decoder nur erforderlich im Stande zu sein, Ströme bis zu 320 kbit/s zu decodieren.

VBR

Audio-MPEG kann Variable bitrate (VBR), vollbracht über das Bitrate-Einschalten einer Basis pro Rahmen verwenden, aber nur Schicht III Decoder muss es unterstützen. VBR wird verwendet, wenn die Absicht ist, ein festes Niveau der Qualität zu erreichen. Die Enddateigröße einer VBR-Verschlüsselung ist weniger voraussagbar als mit unveränderlichem bitrate. Durchschnitt bitrate ist VBR durchgeführt als ein Kompromiss zwischen den zwei - dem bitrate wird erlaubt, sich für die konsequentere Qualität zu ändern, aber wird kontrolliert, um in der Nähe von einem durchschnittlichen Wert zu bleiben, der vom Benutzer für voraussagbare Dateigrößen gewählt ist. Obwohl ein MP3 Decoder VBR unterstützen muss, um entgegenkommende Standards zu sein, historisch haben einige Decoder Programmfehler mit der VBR-Entzifferung besonders, bevor VBR encoders weit verbreitet geworden ist.

Schicht III Audio kann auch ein "Bit-Reservoir", eine Fähigkeit eines teilweise vollen Rahmens verwenden, einen Teil der Audiodaten des folgenden Rahmens zu halten, vorläufige Änderungen in wirksamem bitrate sogar in einem unveränderlichen bitrate Strom erlaubend.

Dateistruktur

Eine MP3 Datei wird aus vielfachen MP3-Rahmen zusammengesetzt, die aus einem Kopfball und einem Datenblock bestehen. Diese Folge von Rahmen wird einen elementaren Strom genannt. Rahmen sind ziemlich abhängige Sachen ("Byte-Reservoir") und können deshalb an willkürlichen Rahmengrenzen nicht herausgezogen werden. Die MP3 Datenblöcke enthalten die (komprimierte) Audioinformation in Bezug auf Frequenzen und Umfänge. Das Diagramm zeigt, dass der MP3 Kopfball aus einem synchronisierten Wort besteht, das verwendet wird, um den Anfang eines gültigen Rahmens zu identifizieren. Dem wird gefolgt, indem es ein bisschen angezeigt wird, dass das der MPEG Standard und zwei Bit ist, die anzeigen, dass Schicht 3 verwendet wird; folglich MPEG-1 Audioschicht 3 oder MP3. Danach werden sich die Werte abhängig von der MP3 Datei unterscheiden. ISO/IEC 11172-3 definiert den Wertbereich für jede Abteilung des Kopfballs zusammen mit der Spezifizierung des Kopfballs. Die meisten MP3 Dateien enthalten heute ID3 metadata, der vorangeht oder den MP3-Rahmen folgt; wie bemerkt, im Diagramm.

Designbeschränkungen

Es gibt mehrere Beschränkungen, die zum MP3-Format innewohnend sind, das durch keinen MP3 encoder überwunden werden kann.

Neuere Audiokompressionsformate wie AAC, WMA Pro und Vorbis sind von mehreren diesen Beschränkungen allgemein leer.

In Fachbegriffen schließen einige Beschränkungen ein:

  • Zeitentschlossenheit kann für hoch vergängliche Signale zu niedrig sein und kann das Schmieren von Schlagtönen verursachen.
  • Wegen der Baumstruktur der Filterbank werden Vorecho-Probleme schlechter gemacht, wie die vereinigte Impuls-Antwort der zwei Filterbanken nicht tut, und nicht kann, eine optimale Lösung in der Entschlossenheit der Zeit/Frequenz zur Verfügung stellen.
  • Das Kombinieren der zwei Filterbankproduktionen schafft aliasing Probleme, die teilweise durch "aliasing Entschädigung" Bühne behandelt werden müssen; jedoch schafft das Überenergie, im Frequenzgebiet codiert zu werden, dadurch das Codieren der Leistungsfähigkeit vermindernd.
  • Frequenzentschlossenheit wird durch die kleine lange Block-Fenstergröße beschränkt, die Codierleistungsfähigkeit vermindert.
  • Es gibt kein Einteilungsfaktor-Band für Frequenzen über dem 15.5/15.8 Kilohertz.
  • Gemeinsames Stereo wird nur auf einer Rahmen-zu-Rahmen-Basis getan.
  • Das innere Berühren der Bit-Reservoir-Zunahmen, die Verzögerung verschlüsseln.
  • Encoder/decoder gesamte Verzögerung wird nicht definiert, was bedeutet, gibt es keine offizielle Bestimmung für das blocklückenlose Play-Back. Jedoch kann ein encoders solcher als LAHM zusätzlichen metadata beifügen, der Spielern erlauben wird, die es behandeln können, um nahtloses Play-Back zu liefern.
  • Der Datenstrom kann eine fakultative Kontrollsumme enthalten, aber die Kontrollsumme schützt nur die Kopfdaten, nicht die Audiodaten.

ID3 und andere Anhängsel

:Main-Artikel: ID3 und APEv2 Anhängsel

Ein "Anhängsel" in einer Audiodatei ist eine Abteilung der Datei, die metadata wie der Titel, der Künstler, das Album, die Spur-Zahl oder die andere Information über den Inhalt der Datei enthält. Die MP3 Standards definieren Anhängsel-Formate für MP3 Dateien nicht, noch es gibt ein Standardbehälterformat, das metadata unterstützen und das Bedürfnis nach Anhängseln begegnen würde.

Jedoch bestehen mehrere De-Facto-Standards für Anhängsel-Formate. Bezüglich 2010 sind die weit verbreitetsten ID3v1 und ID3v2 und der mehr kürzlich eingeführte APEv2. Diese Anhängsel werden normalerweise am Anfang oder Ende von MP3 Dateien eingebettet, die von den wirklichen MP3-Rahmendaten getrennt sind. MP3 Decoder normalerweise behandelt entweder das gelesene Info von den Anhängseln, oder sie gerade als ignorable, non-MP3 Trödel-Daten.

Das Spielen & das Redigieren der Software enthalten häufig Anhängsel-Redigieren-Funktionalität, aber es gibt auch Anhängsel-Redakteur dem Zweck gewidmete Anwendungen.

Beiseite von metadata, der dem Audioinhalt gehört, können Anhängsel auch für DRM verwendet werden.

Volumen-Normalisierung

Da sich Volumen-Niveaus von verschiedenen Audioquellen außerordentlich, wegen des Lautheitskrieges und der anderen Faktoren ändern können, ist es manchmal wünschenswert, das Play-Back-Volumen von solchen Audiodateien anzupassen, dass eine konsequente durchschnittliche Lautheit wahrgenommen wird. Diese Normalisierung, während ähnlich, im Zweck, ist von der dynamischen Reihe-Kompression verschieden.

ReplayGain ist ein Standard, um die Lautheit einer MP3 Datei in seinem metadata Anhängsel zu messen und zu versorgen, einem ReplayGain-entgegenkommenden Spieler ermöglichend, das gesamte Play-Back-Volumen für jede Datei automatisch anzupassen. MP3Gain kann verwendet werden, um auf Maßen von ReplayGain gestützte Dateien umkehrbar zu modifizieren, so dass angepasstes Play-Back auf Spielern ohne Fähigkeit von ReplayGain erreicht werden kann.

Das Genehmigen und offene Probleme

Viele Organisationen haben Eigentumsrecht von Patenten gefordert, die mit der MP3-Entzifferung oder Verschlüsselung verbunden sind. Diese Ansprüche haben zu mehreren gesetzlichen Drohungen und Handlungen von einer Vielfalt von Quellen geführt, auf Unklarheit hinauslaufend, über die Patente lizenziert werden müssen, um MP3 Produkte zu schaffen, ohne Patentverletzung in Ländern zu begehen, die Softwarepatente erlauben.

Die verschiedenen MP3-zusammenhängenden Patente laufen an Daten im Intervall von 2007 bis 2017 in den Vereinigten Staaten ab. Der anfängliche nah-ganze MPEG-1 Standard (Teile 1, 2 und 3) war am 6. Dezember 1991 als ISO CD 11172 öffentlich verfügbar. In den Vereinigten Staaten können Patente nicht Erfindungen fordern, die bereits mehr als ein Jahr vor dem Antragsdatum, aber für Patente öffentlich bekannt gegeben wurden, die vor am 8. Juni 1995 abgelegt sind, haben Unterseebootpatente es möglich gemacht, die wirksame Lebenszeit eines Patents durch Anwendungserweiterungen zu erweitern. Patente, die für irgendetwas bekannt Gegebenes in der ISO CD 11172 pro Jahr oder mehr nach seiner Veröffentlichung abgelegt sind, sind zweifelhaft; wenn nur die bekannten vor dem Dezember 1992 abgelegten MP3-Patente betrachtet werden, dann kann MP3-Entzifferung frei in den Vereinigten Staaten vor dem September 2015 sein offen, wenn abläuft, der einen PCT hatte, der im Okt 1992 ablegt.

Farbfilm (hat früher Thomson Consumer Electronics genannt), behauptet, das MP3-Genehmigen der Schicht 3 Patente in vielen Ländern, einschließlich der Vereinigten Staaten, Japans, Kanadas und EU-Länder zu kontrollieren. Farbfilm hat diese Patente aktiv geltend gemacht.

MP3 Lizenzeinnahmen haben ungefähr € 100 Millionen für die Fraunhofer Gesellschaft 2005 erzeugt.

Im September 1998 hat das Institut von Fraunhofer einen Brief mehreren Entwicklern der MP3 Software gesandt feststellend, dass eine Lizenz erforderlich war, Decoder und/oder encoders "zu verteilen und/oder zu verkaufen". Der Brief hat behauptet, dass Produkte ohne Lizenz "die offenen Rechte auf Fraunhofer und Thomson brechen. Um zu machen, verkaufen Sie und/oder verteilen Sie Produkte mit [MPEG Schicht 3] Standard und so unsere Patente, Sie müssen eine Lizenz unter diesen Patenten von uns erhalten."

Jedoch dort bestehen Sie sowohl freie als auch Eigentumsalternativen, mit freien Formaten wie Vorbis, FLAC und andere. Der Gebrauch des Microsofts seines eigenen Eigentumswindows-Mediaformats erlaubt ihm zu vermeiden, mit diesen Patenten vereinigte Probleme durch das Vermeiden des Gebrauchs des MP3-Formats völlig zu lizenzieren. Bis die Schlüsselpatente ablaufen, konnten encoders ohne Lizenz und Spieler in Ländern eingreifen, wo die Patente gültig sind.

Trotz der offenen Beschränkungen geht die Verewigung des MP3-Formats weiter. Die Gründe dafür scheinen, die Netzeffekten zu sein, die verursacht sind durch:

  • Vertrautheit mit dem Format
  • die große Menge der im MP3 jetzt verfügbaren Musik formatiert
  • das große Angebot an der vorhandenen Software und Hardware, die die Datei ausnutzt, formatiert, und unterstützt die Alternativen nicht
  • der Mangel an DRM Beschränkungen, der MP3 Dateien leicht macht zu editieren, kopiert und spielt in verschiedenen tragbaren Digitalspielern (Apfel, Kreativ, Samsung, usw.)
  • die Mehrheit von Hausbenutzern, die nicht wissen oder sich über die Existenz der Patente nicht sorgen und häufig solche gesetzlichen Probleme nicht in Betracht ziehen, wenn sie, ihre Musik wählt, formatiert für den persönlichen Gebrauch

Patentieren Sie zusätzlich Halter, die geneigt sind, um Lizenzgebühren bei freien und offenen Quelldecodern geltend zu machen, der vielen freien MP3 Decodern erlaubt sich zu entwickeln.

Sisvel S.p. A. und seine amerikanische Tochtergesellschaft Audio MPEG, Inc. hat vorher Thomson auf die Patentverletzung auf der MP3 Technologie verklagt, aber jene Streite wurden im November 2005 mit Sisvel aufgelöst, der Thomson eine Lizenz zu ihren Patenten gewährt. Motorola hat auch kürzlich mit Audio-MPEG unterzeichnet, MP3-zusammenhängende Patente zu lizenzieren.

Im September 2006 haben deutsche Beamte MP3 Spieler von der Kabine von SanDisk auf der IFA-Show in Berlin gegriffen, nachdem ein italienisches Patent-Unternehmen eine einstweilige Verfügung im Auftrag Sisvel gegen SanDisk in einem Streit über das Genehmigen von Rechten gewonnen hat. Die einstweilige Verfügung wurde später von einem Berliner Richter umgekehrt, aber diese Umkehrung wurde der Reihe nach derselbe Tag von einem anderen Richter von demselben Gericht blockiert, "den Offenen Wilden Westen nach Deutschland" in den Wörtern eines Kommentators bringend.

Im Februar 2007 hat Texas MP3 Technologies Apfel, Samsung Electronics und Sandisk im Ostbundesgerichtshof von Texas verklagt, behauptend, dass der Verstoß eines tragbaren MP3 Spielers dieses Texas patentiert, hat MP3 gesagt, dass es zugeteilt worden war. Apple und Sandisk beide haben die Ansprüche gegen sie im Januar 2009 gesetzt. Samsung hat sich ebenso niedergelassen.

Alcatel-Lucent hat mehrere MP3-Codier- und Kompressionspatente behauptet, die angeblich von AT&T-Bell Laboratorien in der Streitigkeit seines eigenen geerbt sind. Im November 2006, vor der Fusion der Gesellschaften, hat Alcatel Microsoft darauf verklagt, sieben Patente angeblich zu brechen. Am 23. Februar 2007 hat eine San Diego Jury die Alcatel-Lucent Vereinigten Staaten $ 1.52 Milliarden in Schäden für den Verstoß von zwei von ihnen zuerkannt. Das Gericht hat nachher den Preis geworfen jedoch findend, dass ein Patent nicht gebrochen worden war, und dass der andere nicht sogar von Alcatel-Lucent im Besitz gewesen ist; es war co-owned durch AT&T und Fraunhofer, der es Microsoft lizenziert hatte, hat der Richter geherrscht. Dieses Verteidigungsurteil wurde auf der Bitte 2008 hochgehalten. Sieh Alcatel-Lucent v. Microsoft für mehr Information.

Alternative Technologien

Viele andere lossy und lossless Audiocodecs bestehen. Unter diesen sind mp3PRO, AAC und MP2 alle Mitglieder derselben technologischen Familie wie MP3 und hängen grob von ähnlichen psychoacoustic Modellen ab. Der Fraunhofer Gesellschaft besitzt viele der grundlegenden Patente, die diesen codecs ebenso, mit anderen unterliegen, die von Dolby-Laboratorien, Sony, Thomson Consumer Electronics, und AT&T gehalten sind. Außerdem gibt es auch das offene Quelldateiformat Vorbis, der kostenlos zur Verfügung gestanden hat und ohne irgendwelche bekannten offenen Beschränkungen.

Siehe auch

Referenzen

Links


Am 28. Mai / Am 15. Mai
Impressum & Datenschutz