Das geradlinige prophetische Codieren

Geradlinige prophetische Codieren (LPC) ist ein Werkzeug verwendet größtenteils in der Audiosignalverarbeitung und Rede, die in einer Prozession geht, für den geisterhaften Umschlag eines Digitalsignals der Rede in der komprimierten Form mit der Information eines geradlinigen prophetischen Modells zu vertreten. Es ist eine der stärksten Rede-Analyse-Techniken und eine der nützlichsten Methoden, um gute Qualitätsrede an einer niedrigen Bit-Rate zu verschlüsseln, und stellt äußerst genaue Schätzungen von Rede-Rahmen zur Verfügung.

Übersicht

LPC fängt an in der Annahme, dass ein Rede-Signal durch einen Summer am Ende einer Tube (geäußerte Töne), mit dem gelegentlichen zusätzlichen Zischen und Knallen von Tönen (Zischlaute und Verschlusslaut-Töne) erzeugt wird. Obwohl anscheinend grob, ist dieses Modell wirklich eine nahe Annäherung der Wirklichkeit der Rede-Produktion. Die Stimmritze (der Raum zwischen den stimmlichen Falten) erzeugt das Summen, das durch seine Intensität (Lautheit) und Frequenz (Wurf) charakterisiert wird. Die stimmliche Fläche (der Hals und Mund) bildet die Tube, die durch seine Klangfülle charakterisiert wird, die formants oder erhöhte Frequenzbänder im erzeugten Ton verursacht. Zischen und Knalle werden durch die Handlung der Zunge, der Lippen und des Halses während Zischlaute und Verschlusslaute erzeugt.

LPC analysiert das Rede-Signal durch das Schätzen des formants, das Entfernen ihrer Effekten vom Rede-Signal und das Schätzen der Intensität und Frequenz des restlichen Summens. Der Prozess, den formants zu entfernen, wird umgekehrte Entstörung und das restliche Signal genannt, nachdem die Subtraktion des gefilterten modellierten Signals den Rückstand genannt wird.

Die Zahlen, die die Intensität und Frequenz des Summens, des formants und des Rückstand-Signals beschreiben, können versorgt oder sonst wohin übersandt werden. LPC synthetisiert das Rede-Signal durch das Umkehren des Prozesses: Verwenden Sie die Summen-Rahmen und den Rückstand, um ein Quellsignal zu schaffen, den formants zu verwenden, um einen Filter zu schaffen (der die Tube vertritt), und führen Sie die Quelle durch den Filter, auf Rede hinauslaufend.

Weil sich Rede-Signale mit der Zeit ändern, wird dieser Prozess auf kurzen Klötzen des Rede-Signals getan, die Rahmen genannt werden; allgemein geben 30 bis 50 Rahmen pro Sekunde verständliche Rede mit der guten Kompression.

Frühe Geschichte von LPC

Gemäß Robert M. Gray von Universität von Stanford haben die ersten Ideen, die zu LPC führen, 1966 angefangen, als S. Saito und F. Itakura von NTT eine Annäherung an das automatische Phonem-Urteilsvermögen beschrieben haben, das die erste maximale Wahrscheinlichkeitsannäherung an das Rede-Codieren eingeschlossen hat. 1967 hat John Burg die maximale Wärmegewicht-Annäherung entworfen. 1969 haben Itakura und Saito teilweise Korrelation, Mai eingeführt Glen Culler hat Echtzeitrede-Verschlüsselung vorgeschlagen, und B. S. Atal hat einen LPC Rede-Codierer an der Jahresversammlung der Akustischen Gesellschaft Amerikas präsentiert. 1971 wurde schritthaltender LPC das Verwenden der LPC 16-Bit-Hardware von Philco-Ford demonstriert; vier Einheiten wurden verkauft.

1972 Bob Kahn von ARPA, mit Jim Forgie (Laboratorium von Lincoln, LL) und Dave Walden (BBN Technologies), hat die ersten Entwicklungen in der packetized Rede angefangen, die schließlich zu Begleitkommentar IP Technologie führen würde. 1973, gemäß dem Laboratorium von Lincoln informelle Geschichte, wurden die ersten schritthaltenden 2400 bit/s LPC von Ed Hofstetter durchgeführt. 1974 wurde die erste LPC Echtzeitzweiwegepaket-Rede-Kommunikation über den ARPANET an 3500 bit/s zwischen Culler-Harrison und Lincoln Laboratories vollbracht. 1976 hat die erste LPC Konferenz über den ARPANET das Verwenden des Netzstimmenprotokolls, zwischen Culler-Harrison, ISI, SRI und LL an 3500 bit/s stattgefunden. Und schließlich 1978, Vishwanath u. a. BBN hat die erste variable Rate LPC Algorithmus entwickelt.

LPC mitwirkende Darstellungen

LPC wird oft verwendet, um geisterhafte Umschlag-Information zu übersenden, und als solcher muss es von Übertragungsfehlern tolerant sein. Die Übertragung der Filterkoeffizienten direkt (sieh geradlinige Vorhersage für die Definition von Koeffizienten), ist unerwünscht, da sie zu Fehlern sehr empfindlich sind. Mit anderen Worten kann ein sehr kleiner Fehler das ganze Spektrum, oder schlechter verdrehen, ein kleiner Fehler könnte den Vorhersagefilter nicht stabil machen.

Es gibt fortgeschrittenere Darstellungen wie Log Area Ratios (LAR), Zergliederung der Linie geisterhaften Paare (LSP) und Reflexionskoeffizienten. Dieser besonders hat LSP Zergliederung Beliebtheit gewonnen, da es Stabilität des Propheten sichert, und geisterhafte Fehler für kleine mitwirkende Abweichungen lokal sind.

Anwendungen

LPC wird allgemein für die Rede-Analyse und Wiedersynthese verwendet. Es wird als eine Form der Stimmenkompression von Telefongesellschaften zum Beispiel im GSM Standard verwendet. Es wird auch für das sichere Radio verwendet, wo Stimme, encrypted digitalisiert und über einen schmalen Stimmenkanal gesandt werden muss; ein frühes Beispiel davon ist der Navaho-Indianer der US-Regierung I.

LPC Synthese kann verwendet werden, um Sprachentschlüsselungsgeräte zu bauen, wo Musikinstrumente als Erregungssignal zum zeitändernden aus einer Rede eines Sängers geschätzten Filter verwendet werden. Das ist in der elektronischen Musik etwas populär.

Paul Lansky hat das wohl bekannte Computermusik-Stück notjustmoreidlechatter das Verwenden geradlinig prophetisch coding.http://www.music.princeton.edu/~paul/liner_notes/morethanidlechatter.html gemacht

Eine 10. Ordnung LPC wurde in den populären 1980er Jahren verwendet, Spricht & Periode Bildungsspielzeug.

Das Wellenform-ROM in einigen beispielbasierten von Yamaha Corporation gemachten Digitalmusik-Synthesizern kann mit dem LPC Algorithmus zusammengepresst werden.

LPC Propheten werden darin verwendet, Werden MPEG-4 ALS, FLAC und anderer lossless Audiocodecs Kürzer.

Siehe auch

  • Das verzogene geradlinige prophetische Codieren
  • Informationskriterium von Akaike
  • Audiokompression
  • Wurf-Bewertung
  • FS-1015
  • FS-1016
  • Geradlinige Vorhersage

Referenzen

Links


Tapfere neue Welt / David (Michelangelo)
Impressum & Datenschutz