Modifizierter getrennter Kosinus verwandelt sich

Der modifizierte getrennte Kosinus verwandelt sich (MDCT) ist ein Fourier-zusammenhängender verwandeln sich gestützt auf dem Typ-IV, den getrennter Kosinus (DCT-IV) mit dem zusätzlichen Eigentum davon umgestaltet, gewickelt zu werden: Es wird entworfen, um auf Konsekutivblöcken eines größeren dataset, durchgeführt zu werden

wo auf nachfolgende Blöcke so dass übergegriffen wird

die letzte Hälfte eines Blocks fällt mit der ersten Hälfte des folgenden Blocks zusammen.

Diese Überschneidung, zusätzlich zu den Energie-Compaction Qualitäten des DCT, macht das MDCT besonders attraktive für Signalkompressionsanwendungen, da es hilft, Kunsterzeugnisse zu vermeiden, die von den Block-Grenzen stammen. Infolge dieser Vorteile wird der MDCT in den meisten modernen lossy Audioformaten, einschließlich MP3, AC-3, Vorbis, Windows-Medien Audio-, ATRAC, Koch und AAC verwendet.

Der MDCT wurde von Princen, Johnson und Bradley 1987, im Anschluss an früher (1986) Arbeit von Princen und Bradley vorgeschlagen, um den zu Grunde liegenden Grundsatz des MDCT des Zeitabschnittes aliasing Annullierung (TDAC) zu entwickeln, der unten beschrieben ist. (Dort auch besteht ein analoger verwandelt sich, die MDST, die auf dem getrennten Sinus gestützt sind, verwandeln sich, sowie anderer, selten verwendet, Formen des MDCT, der auf verschiedenen Typen von DCT oder DCT/DST Kombinationen gestützt ist.)

In MP3 wird der MDCT auf das Audiosignal direkt, aber eher auf die Produktion einer 32-bändigen Bank des Polyphase-Quadratur-Filters (PQF) nicht angewandt. Die Produktion dieses MDCT wird durch eine Deckname-Verminderungsformel postbearbeitet, um den typischen aliasing der PQF Filterbank zu reduzieren. Solch eine Kombination einer Filterbank mit einem MDCT wird eine hybride Filterbank oder eine Subband MDCT genannt. AAC verwendet andererseits normalerweise einen reinen MDCT; nur (selten verwendet) MPEG-4 AAC-SSR Variante (durch Sony) verwendet eine vierbändige PQF von einem MDCT gefolgte Bank. Ähnlich MP3 ATRAC Gebrauch sind aufgeschoberte Quadratur-Spiegelfilter (QMF) durch einen MDCT gefolgt.

Definition

Als ein geläppter verwandeln sich, der MDCT ist ein bisschen im Vergleich zu anderem Fourier-zusammenhängendem ungewöhnlich verwandelt sich, in dem er halb so viel Produktionen hat wie Eingänge (statt derselben Zahl). Insbesondere es ist eine geradlinige Funktion (wo R den Satz von reellen Zahlen anzeigt). 2N werden reelle Zahlen x..., x in die N reellen Zahlen X..., X gemäß der Formel umgestaltet:

:

(Der Normalisierungskoeffizient davor verwandelt sich, hier Einheit, ist eine willkürliche Tagung und unterscheidet sich zwischen Behandlungen. Nur das Produkt der Normalisierungen des MDCT und des IMDCT wird unten beschränkt.)

Gegenteil verwandelt sich

Der umgekehrte MDCT ist als der IMDCT bekannt. Weil es verschiedene Zahlen von Eingängen und Produktionen gibt, auf den ersten Blick könnte es scheinen, dass der MDCT invertible nicht sein sollte. Jedoch wird vollkommener invertibility durch das Hinzufügen des übergegriffenen IMDCTs von nachfolgenden überlappenden Blöcken, das Verursachen der Fehler erreicht sich aufzuheben und die ursprünglichen wiederzubekommenden Daten; diese Technik ist als Zeitabschnitt aliasing Annullierung (TDAC) bekannt.

Der IMDCT gestaltet N reelle Zahlen X..., X in 2N reelle Zahlen y..., y gemäß der Formel um:

:

(Wie für den DCT-IV verwandelt sich ein orthogonaler, das Gegenteil hat dieselbe Form, wie sich die nachschicken verwandeln.)

Im Fall von einem mit Fenster versehenen MDCT mit der üblichen Fensternormalisierung (sieh unten) sollte der Normalisierungskoeffizient vor dem IMDCT mit 2 multipliziert werden (d. h., 2/N werdend).

Berechnung

Obwohl die direkte Anwendung der MDCT Formel O (N) Operationen verlangen würde, ist es möglich zu rechnen dasselbe Ding mit nur O (N loggen N) die Kompliziertheit durch das rekursive Faktorisieren der Berechnung, als im schnellen Fourier verwandelt sich (FFT). Man kann auch rechnen MDCTs über anderen verwandelt sich, normalerweise ein DFT (FFT) oder ein DCT, der mit O (N) prä- und in einer Prozession postgehende Schritte verbunden ist. Außerdem wie beschrieben, unten stellt jeder Algorithmus für den DCT-IV sofort eine Methode zur Verfügung, den MDCT und IMDCT sogar der Größe zu schätzen.

Fensterfunktionen

In typischen Signalkompressionsanwendungen werden die umgestalten Eigenschaften weiter durch das Verwenden einer Fensterfunktion w verbessert (n = 0..., 2N-1), der mit x und y im MDCT und den IMDCT Formeln oben multipliziert wird, um Diskontinuitäten am n = 0 und 2N Grenzen zu vermeiden, indem er die Funktion glatt zur Null an jenen Punkten gehen lässt. (D. h. wir Fenster die Daten vor dem MDCT und nach dem IMDCT.) Im Prinzip konnte x und y verschiedene Fensterfunktionen haben, und die Fensterfunktion konnte sich auch von einem Block bis das folgende ändern (besonders für den Fall, wo Datenblöcke verschiedener Größen verbunden werden), aber für die Einfachheit ziehen wir den allgemeinen Fall von identischen Fensterfunktionen für gleich-große Blöcke in Betracht.

Das Umgestalten bleibt invertible (d. h. TDAC Arbeiten), für ein symmetrisches Fenster w = w, nicht weniger als w befriedigt die Bedingung von Princen-Bradley:

:.

verschiedene Fensterfunktionen sind z.B üblich.

:

für MP3 und MPEG-2 AAC und

:

für Vorbis. AC-3 verwendet ein Fenster Kaiser-Bessel derived (KBD), und MPEG-4 AAC kann auch ein Fenster KBD verwenden.

Bemerken Sie, dass auf den MDCT angewandte Fenster von für andere Typen der Signalanalyse verwendeten Fenstern verschieden sind, da sie die Bedingung von Princen-Bradley erfüllen müssen. Einer der Gründe für diesen Unterschied ist, dass Fenster MDCT zweimal, sowohl für den MDCT (Analyse) als auch für den IMDCT (Synthese) angewandt werden.

Beziehung zu DCT-IV und Ursprung von TDAC

Wie durch die Inspektion der Definitionen gesehen werden kann, für sogar N der MDCT ist zu einem DCT-IV im Wesentlichen gleichwertig, wohin der Eingang durch N/2 ausgewechselt wird und zwei N-Datenblocks sofort umgestaltet werden. Durch das Überprüfen dieser Gleichwertigkeit sorgfältiger können wichtige Eigenschaften wie TDAC leicht abgeleitet werden.

Um die genaue Beziehung zum DCT-IV zu definieren, muss man begreifen, dass der DCT-IV dem Wechseln gleicher/seltsamer Grenzbedingungen entspricht: sogar an seiner linken Grenze (um n =-1/2), seltsam an seiner richtigen Grenze (ringsherum n=N-1/2), und so weiter (statt periodischer Grenzen bezüglich eines DFT). Das folgt aus der Identität und. So, wenn seine Eingänge eine Reihe x der Länge N sind, können wir uns vorstellen, diese Reihe zu (x,-x,-x, x...) und so weiter zu erweitern, wo x x in umgekehrter Reihenfolge anzeigt.

Denken Sie einen MDCT mit 2N Eingänge und N Produktionen, wo wir die Eingänge in vier Blöcke (a, b, c, d) jede der Größe N/2 teilen. Wenn wir diese durch N/2 auswechseln (vom +N/2-Begriff in der MDCT Definition), dann (b, c, d) erweitern vorbei am Ende des N DCT-IV Eingänge, so müssen wir sie zurück gemäß den Grenzbedingungen "falten", die oben beschrieben sind.

:Thus, der MDCT 2N Eingänge (a, b, c, d) sind zu einem DCT-IV der N-Eingänge genau gleichwertig: (-c-d, a-b), wo R Umkehrung als oben anzeigt.

(Auf diese Weise kann jeder Algorithmus, um den DCT-IV zu schätzen, auf den MDCT trivial angewandt werden.)

Ähnlich ist die IMDCT Formel oben genau 1/2 vom DCT-IV (der sein eigenes Gegenteil ist), wohin die Produktion durch N/2 ausgewechselt und (über die Grenzbedingungen) zu einer Länge 2N erweitert wird. Der umgekehrte DCT-IV würde einfach die Eingänge (-c-d, a-b) von oben zurückgeben. Wenn das ausgewechselt und über die Grenzbedingungen erweitert wird, herrscht man vor:

:IMDCT (MDCT (a, b, c, d)) = (a-b, b-a, c+d, d+c) / 2.

Die Hälfte der IMDCT Produktionen ist so, als b-a = - (a-b), und ebenfalls für die letzten zwei Begriffe überflüssig.

Man kann jetzt verstehen, wie TDAC arbeitet. Nehmen Sie an, dass man den MDCT des nachfolgenden, 50 % übergegriffen, 2N Block (c, d, e, f) schätzt. Der IMDCT wird dann, analog dem obengenannten tragen: (c-d, d-c, e+f, e+f) / 2. Wenn das mit dem vorherigen IMDCT hinzugefügt wird, laufen auf die überlappende Hälfte hinaus, die umgekehrten Begriffe annullieren, und man herrscht einfach (c, d) vor, die ursprünglichen Daten wieder erlangend.

Ursprung von TDAC

Der Ursprung des Begriffes "Zeitabschnitt aliasing Annullierung" ist jetzt klar. Der Gebrauch von Eingangsdaten, die sich außer den Grenzen des logischen DCT-IV ausstrecken, veranlasst die Daten, aliased auf genau dieselbe Weise zu sein, wie Frequenzen außer der Frequenz von Nyquist aliased sind, um Frequenzen zu senken, außer dass dieser aliasing im Zeitabschnitt statt des Frequenzgebiets vorkommt. Folglich bestätigen die Kombinationen c-d und so weiter, die genau das Recht haben, die Kombinationen, um zu annullieren, wenn sie hinzugefügt werden.

Für sonderbaren N (die in der Praxis selten verwendet werden) ist N/2 nicht eine ganze Zahl, so ist der MDCT nicht einfach eine Verschiebungsversetzung eines DCT-IV. In diesem Fall die zusätzliche Verschiebung anderthalbmal bedeutet eine Probe, dass der MDCT/IMDCT gleichwertig zum DCT-III/II wird, und die Analyse dem obengenannten analog ist.

TDAC für den mit Fenster versehenen MDCT

Oben wurde das TDAC Eigentum für den gewöhnlichen MDCT bewiesen, zeigend, dass das Hinzufügen von IMDCTs von nachfolgenden Blöcken in ihrer überlappenden Hälfte die ursprünglichen Daten wieder erlangt. Die Abstammung dieses umgekehrten Eigentums für den mit Fenster versehenen MDCT ist nur ein bisschen mehr kompliziert.

Rufen Sie vom obengenannten zurück, dass, wenn und MDCTed, IMDCTed sind, und in ihrer überlappenden Hälfte beigetragen hat, herrschen wir, die ursprünglichen Daten vor.

Jetzt nehmen wir an, dass wir sowohl die MDCT-Eingänge als auch die IMDCT Produktionen nach einer Fensterfunktion der Länge 2N multiplizieren. Als oben nehmen wir eine symmetrische Fensterfunktion an, die deshalb der Form ist, wo w und z length-N/2 Vektoren sind und R Umkehrung wie zuvor anzeigt. Dann kann die Bedingung von Princen-Bradley geschrieben werden: mit den Multiplikationen und Hinzufügungen hat elementwise, oder gleichwertig durchgeführt (w und z umkehrend).

Deshalb, statt MDCTing, wir jetzt MDCT (mit allen Multiplikationen hat elementwise durchgeführt). Wenn das IMDCTed und multipliziert wieder (elementwise) durch die Fensterfunktion ist, wird die letzte-N Hälfte:

:.

(Bemerken Sie, dass wir nicht mehr die Multiplikation durch 1/2 haben, weil sich die IMDCT Normalisierung durch einen Faktor 2 im mit Fenster versehenen Fall unterscheidet.)

Ähnlich der mit Fenster versehene MDCT und IMDCT von Erträgen, in seiner ersten-N Hälfte:

:.

Wenn wir diese zwei Hälften zusammen hinzufügen, herrschen wir vor:

:

::

die Besserung der ursprünglichen Daten.

Siehe auch

Anderer überlappender mit Fenster versehener Fourier verwandelt sich schließen Sie ein:

  • Kurzarbeit Fourier gestaltet um
  • Die Methode von Walisern
  • Henrique S. Malvar, Signal, das mit dem Geläppten In einer Prozession geht, verwandelt Sich (Artech Haus: Norwood MA, 1992).
  • John P. Princen und Alan B. Bradley, "Hat Filterbankdesign der Analyse/Synthese auf dem Zeitabschnitt aliasing Annullierung," IEEE Trans gestützt. Acoust. Rede Sig. Proc. ASSP-34 (5), 1153-1161 (1986). (Beschrieben ein Vorgänger zum MDCT verwandelt sich das Verwenden einer Kombination des getrennten Kosinus und Sinus.)
  • J. P. Princen und A. W. Johnson und A. B. Bradley, "Subvereinigen das Codieren mit Filterbankdesigns/umgestalten, die auf dem Zeitabschnitt aliasing Annullierung," IEEE Proc gestützt sind. Intl. Conf. auf der Akustik, der Rede und dem Signal, das (ICASSP) 12, 2161-2164 (1987) Bearbeitet. (Anfängliche Beschreibung dessen, was jetzt den MDCT genannt wird.)
  • A. W. Johnson und A. B. Bradley, "Anpassungsfähig gestalten Codierverbinden-Zeitabschnitt aliasing Annullierung," Rede Comm um. 6, 299-308 (1987).
  • Für Algorithmen, sieh z.B:
  • Chi-minutiger Liu und Wen-Chieh Lee, "Hat ein vereinigter schneller Algorithmus für den Kosinus filterbanks in aktuellen Audiostandards", J abgestimmt. Audiotechnik 47 (12), 1061-1075 (1999).
  • V. Britanak und K. R. Rao, "Ein neuer schneller Algorithmus für die vereinigte fortgeschrittene und umgekehrte MDCT/MDST Berechnung," Signal, das 82, 433-459 (2002) In einer Prozession geht
  • Vladimir Nikolajevic und Gerhard Fettweis, "Berechnung von fortgeschrittenem und umgekehrtem MDCT die Wiederauftreten-Formel von verwendendem Clenshaw," IEEE Trans. Sig. Proc. 51 (5), 1439-1444 (2003)
  • Che-Hong Chen, Bin-Da Liu und Jar-Ferr Yang, "Haben rekursive Architekturen, um zu begreifen, getrennten Kosinus modifiziert, verwandeln sich und sein Gegenteil," IEEE Trans. Stromkreis-System. II: Analogon Gräbt. Sig. Proc. 50 (1), 38-45 (2003)
  • ... und Verweisungen davon.

Bauchnabel / Thomas Edward Brown
Impressum & Datenschutz