Das Rede-Codieren

Das Rede-Codieren ist die Anwendung der Datenkompression von Digitalaudiosignalen, die Rede enthalten. Rede, die Gebrauch mit der Rede spezifische Parameter-Bewertung mit Audiosignalverarbeitungstechniken codiert, um das Rede-Signal zu modellieren, hat sich mit allgemeinen Datenkompressionsalgorithmen verbunden, um die resultierenden modellierten Rahmen in einem kompakten bitstream zu vertreten.

Die zwei wichtigsten Anwendungen des Rede-Codierens sind Mobilfunk und Begleitkommentar IP.

Die im Rede-Codieren verwendeten Techniken sind dem in der Audiodatenkompression und dem Audiocodieren ähnlich, wo Kenntnisse in psychoacoustics verwendet werden, um nur Daten zu übersenden, der für das menschliche Gehörsystem wichtig ist. Zum Beispiel, im voiceband Rede-Codieren, nur Information im Frequenzband werden 400 Hz bis 3500 Hz übersandt, aber das wieder aufgebaute Signal ist noch für die Verständlichkeit entsprechend.

Das Rede-Codieren unterscheidet sich von anderen Formen des Audiocodierens in dieser Rede ist ein viel einfacheres Signal als die meisten anderen Audiosignale, und viel mehr statistische Information ist über die Eigenschaften der Rede verfügbar. Infolgedessen kann etwas Gehörinformation, die im Audiocodieren wichtig ist, in der Rede unnötig sein, die Zusammenhang codiert. Im Rede-Codieren ist das wichtigste Kriterium Bewahrung der Verständlichkeit und "Gemütlichkeit" der Rede mit einem gezwungenen Betrag von übersandten Daten.

Die Verständlichkeit der Rede, schließt außer dem wirklichen wörtlichen Inhalt, auch Sprecher-Identität, Gefühle, Tongebung, Timbre usw. ein, die alle für die vollkommene Verständlichkeit wichtig sind. Das abstraktere Konzept der Gemütlichkeit der erniedrigten Rede ist ein verschiedenes Eigentum als Verständlichkeit, da es möglich ist, dass erniedrigte Rede völlig verständlich, aber dem Zuhörer subjektiv ärgerlich ist.

Außerdem verlangen die meisten Rede-Anwendungen niedrig codierende Verzögerung, weil lange codierende Verzögerungen Rede-Wechselwirkung stören.

Probe companding angesehen als eine Form des Rede-Codierens

Aus diesem Gesichtspunkt können das A-Gesetz und die μ-law Algorithmen in der traditionellen PCM Digitaltelefonie verwendeter (G.711) als ein sehr früher Vorgänger der Rede-Verschlüsselung, des Verlangens von nur 8 Bit pro Probe, aber des Gebens effektiv 12 Bit der Entschlossenheit gesehen werden. Obwohl das unannehmbare Verzerrung in einem Musik-Signal, der peaky Natur von Rede-Wellenformen erzeugen würde, die mit der einfachen Frequenzstruktur der Rede als eine periodische Wellenform verbunden sind, die eine einzelne grundsätzliche Frequenz mit gelegentlichen zusätzlichen Geräuschbrüchen hat, diese sehr einfachen sofortigen Kompressionsalgorithmen zu machen, annehmbar für die Rede.

Ein großes Angebot an anderen Algorithmen wurde zurzeit, größtenteils Varianten auf der Delta-Modulation versucht, aber nach der reiflichen Überlegung A-law/μ-law wurden Algorithmen von den Entwerfern der frühen Digitaltelefonie-Systeme gewählt. Zur Zeit ihres Designs hat ihre 33-%-Bandbreite-Verminderung für eine sehr niedrige Kompliziertheit sie einen ausgezeichneten Technikkompromiss gemacht. Ihre Audioleistung bleibt annehmbar, und es hat kein Bedürfnis gegeben, sie im stationären Telefonnetz zu ersetzen.

2008 wurde G.711.1 codec, der eine ersteigbare Struktur hat, durch ITU-T standardisiert. Die Eingangsstichprobenerhebungsrate ist 16 Kilohertz.

Moderne Rede-Kompression

Viel von der späteren Arbeit in der Rede-Kompression wurde durch die militärische Forschung in Digitalkommunikationen für sichere militärische Radios motiviert, wo sehr niedrige Datenraten erforderlich waren, wirksame Operation in einer feindlichen Radioumgebung zu erlauben. Zur gleichen Zeit war viel mehr in einer Prozession gehende Macht in der Form von integrierten Stromkreisen von VLSI verfügbar, als für frühere Kompressionstechniken verfügbar war. Infolgedessen konnten moderne Rede-Kompressionsalgorithmen viel kompliziertere Techniken verwenden, als in den 1960er Jahren verfügbar war, um viel höhere Kompressionsverhältnisse zu erreichen.

Diese Techniken waren durch die offene für Zivilanwendungen zu verwendende Forschungsliteratur verfügbar, die Entwicklung von Digitalmobiltelefonnetzen mit wesentlich höheren Kanalkapazitäten erlaubend, als die analogen Systeme, die ihnen vorangegangen sind.

Der grösste Teil der Umgangssprache, die Schema codiert, ist das Codieren von Code Excited Linear Prediction (CELP), das zum Beispiel im GSM Standard verwendet wird. In CELP wird das Modellieren in zwei Stufen, eine geradlinige prophetische Bühne geteilt, die den geisterhaften Umschlag und das Codebuch gestütztes Modell des restlichen vom geradlinigen prophetischen Modell modelliert.

Zusätzlich zum wirklichen Rede-Codieren des Signals ist es häufig notwendig, das Kanalcodieren für die Übertragung zu verwenden, Verluste wegen Übertragungsfehler zu vermeiden. Gewöhnlich müssen das Rede-Codieren und die Kanalcodiermethoden in Paaren mit den wichtigeren Bit im durch das robustere Kanalcodieren geschützten Rede-Datenstrom gewählt werden, um die besten gesamten Codierergebnisse zu bekommen.

Das Speex-Projekt ist ein Versuch, einen Rede-Codierer der kostenlosen Software zu schaffen, der durch offene Beschränkungen unbelastet ist.

Hauptteilfelder:

  • Breitbandrede, die codiert
  • AMR-WB für WCDMA Netze
  • VMR-WB für CDMA2000 Netze
  • G.722, G.722.1, Speex und andere für VoIP und Videokonferenzführung
  • Engbandige Rede, die codiert
  • FNBDT für militärische Anwendungen
  • SMV für CDMA Netze
  • Normaltarif, Hälfte der Rate, EFR, AMR für GSM Netze
  • G.723.1, G.726, G.728, G.729, iLBC und andere für VoIP oder Videokonferenzführung

Siehe auch


Freiheitsstatue / Schwefelemissionsverminderungsprotokoll
Impressum & Datenschutz