MAGIC VOICE Bit Format, der Aufbau der Rahmen

CBM Home Allgemeines
General
Einführung
Introduction
Anschluss
Connection
Anwenden des Moduls
Using the Module
Vokabular
Vocabulary
Tips & Tricks
Tips & Tricks
Ergänzendes
Additional stuff
Demos
Demos
Spiele
Games
Zeitschriften
Magazines
Sprach Downloads
Speech Downloads
Lexikon
Lexicon
Internes
Internal
Hardware
Hardware
Firmware
Firmware
Sprachdaten
Speechdata
Bit-Format
Bit allocation
De-/Codierung
De-/Coding
Nützliches und mehr
Utilities and more
Speech Playtool Magic Game Cart Magic Talkie Magic Voice NT Ersatzteile & Reparatur
Spares & Repair


x.
x.


Ein LPC-Verfahren, das zur Analyse n Parameter (= Koeffizienten) verwendet, wird oft als LPC-Verfahren n-ter Ordnung bezeichnet. Zu den am häufigsten verwendeten LPC Verfahren gehört LPC-10 und LPC-12. Bei LPC-10 werden 10 Parameter für stimmhafte Laute (zum Beispiel "e"), und vier Paramter für stimmlose Laute (zum Beispiel "s") verwendet. Neben der Anzahl der Parameter wird die Qualität der Sprache auch von der Auflösung, also der Anzahl der verwendeten Bits für die einzelnen Parameter bestimmt. Die Summe der Bits für Amplitude (Energy), Frequenz (Pitch) und der Parameter ergibt dann die Rahmenlänge (Framelength), also zum Beispiel 48 Bit pro Rahmen, angegeben in der Einheit "Bits/Frame".

Neben der Unterscheidung zwischen stimmhaften (voiced) und stimmlosen (unvoiced) Rahmen können auch noch Wiederholungsrahmen (repeat) verwendet werden. Hierbei wird nur der Wert für Energy und Pitch neu übertragen, die Koeffizienten gelten dann als unverändert. Einen Sonderfall stellen Rahmen dar, die einfach nur Stille (silence) erzeugen oder das Ende der Sprachausgabe markieren.

In den folgenden Tabellen ist der genaue Aufbau dieser Rahmen ersichtlich.

Rahmen Bit Format - Frame Bit allocation

K1 - K10 = Filter-Koeffizienten

49 Bits/Frame
LPC 10 - Speak & Spell (Texas Instruments, TMS 5100, 5200 and 5220)
MSB LSB
Energy Repeat Bit Pitch K1 K2 K3 K4 K5 K6 K7 K8 K9 K10
FRAME 4 Bit 1 Bit 5 Bit 5 Bit 5 Bit 4 Bit 4 Bit 4 Bit 4 Bit 4 Bit 3 Bit 3 Bit 3 Bit
Voiced xxxx 0 x xxxx x xxxx x xxxx xxxx xxxx xxxx xxxx xxxx xxx xxx xxx
Unvoiced xxxx 0 0 0000 x xxxx x xxxx xxxx xxxx
Repeat xxxx 1 x xxxx
Silent 0000
End of Speech 1111

Energy: Energy = 0: Silence , Energy = 15: End Of Speech
Pitch: Pitch = 0: Unvoiced


48 Bits/Frame
LPC 10 - Magic Voice Speech Module (Toshiba, T6721A)
MSB LSB
??? Bit Energy Pitch K1 K2 K3 K4 K5 K6 K7 K8 K9 K10
FRAME 1 Bit 4 Bit 4 Bit 5 Bit 5 Bit 5 Bit 4 Bit 4 Bit 4 Bit 3 Bit 3 Bit 3 Bit 3 Bit
Voiced 0 xxxx xxxx x xxxx x xxxx x xxxx xxxx xxxx xxxx xxx xxx xxx xxx
Unvoiced 1 xxxx x xxxx x xxxx x xxxx xxxx
Repeat 0 ? ?
Silent x ?1
End of Speech 1 ?

96 Bits/Frame
LPC 10 - Magic Voice Speech Module (Toshiba, T6721A)
MSB LSB
??? Bit Energy Pitch K1 K2 K3 K4 K5 K6 K7 K8 K9 K10
FRAME 0 Bit 7 Bit 7 Bit 10 Bit 10 Bit 10 Bit 8 Bit 8 Bit 8 Bit 7 Bit 7 Bit 7 Bit 7 Bit
Voiced 0 xxx xxxx xxx xxxx xx xxxx xxxx xx xxxx xxxx xx xxxx xxxx xxxx xxxx xxxx xxxx xxxx xxxx xxx xxxx xxx xxxx xxx xxxx xxx xxxx
Unvoiced 0 xxx xxxx 000 0000 xx xxxx xxxx xx xxxx xxxx xx xxxx xxxx xxxx xxxx
Repeat 0 xxx xxxx xxx xxxx
Silent x 000 0001
End of Speech 1 000 0000

Energy: Energy = 0 and ???-Bit = 1: End of Speech
Pitch: Pitch = 0: Unvoiced


Nach oben zum Menü - Go top to menu
Copyright © 2006-2012 Stefan Uhlmann - Aktualisiert: 2. März 2012 - Valid HTML 4.01!