Terhardt, E. (1966). Beitrag zur automatischen Erkennung gesprochener Ziffern. Kybernetik 3, 136-143
Es wird über Untersuchungen der Brauchbarkeit eines einfachen Funktionsmodells des Gehörs bei der automatischen Spracherkennung berichtet. Das Modell wird kurz beschrieben. Mit Hilfe einer einfachen Registrier- und Beurteilungsmethode wird gezeigt, wie die Kanal-Zeit-Muster, welche das Funktionsmodell liefert, von den Charakteristika verschiedener Sprecher abhängen. Als Testmaterial werden die deutschen Ziffern Null bis Neun, gesprochen von 48 Personen, benutzt.
Some experiments concerning the utility of a simple function-model of the human ear for automatic speech recognition are reported. A short description of this function-model which was built by Zwicker, is given. Using a simple recording and evaluation method it is demonstrated how the channel-time patterns obtained from the function- model depend on the properties of different speakers. The German numbers "Null, Eins, Zwo, Drei, Vier, Fünf, Sechs, Sieb, Acht, Neun", spoken by 48 speakers, are used as speech material.