Terhardt, E. (1966). Beitrag zur automatischen Erkennung gesprochener Ziffern. Kybernetik 3, 136-143


Es wird über Untersuchungen der Brauchbarkeit eines einfachen Funktionsmodells des Gehörs bei der automatischen Spracherkennung berichtet. Das Modell wird kurz beschrieben. Mit Hilfe einer einfachen Registrier- und Beurteilungsmethode wird gezeigt, wie die Kanal-Zeit-Muster, welche das Funktionsmodell liefert, von den Charakteristika verschiedener Sprecher abhängen. Als Testmaterial werden die deutschen Ziffern Null bis Neun, gesprochen von 48 Personen, benutzt.


Some experiments concerning the utility of a simple function-model of the human ear for automatic speech recognition are reported. A short description of this function-model which was built by Zwicker, is given. Using a simple recording and evaluation method it is demonstrated how the channel-time patterns obtained from the function- model depend on the properties of different speakers. The German numbers "Null, Eins, Zwo, Drei, Vier, Fünf, Sechs, Sieb, Acht, Neun", spoken by 48 speakers, are used as speech material.


main page