Müller, Matthias

Voce­Vis­ta. End­lich sehen, was ich schon immer hören wollte.

Ein Bericht über computergesteuerte Stimmanalyse im Gesangsunterricht

Rubrik: Aufsatz
erschienen in: üben & musizieren 2/2001 , Seite 16

Der Autor stu­dier­te Diplom­ma­the­ma­tik an der Uni­ver­si­tät und dann Gesang an der Musik­hoch­schu­le in Stutt­gart. Zur­zeit arbei­tet er als Gesangs­leh­rer an der Berufs­fach­schu­le für Musik Krum­bach (Schwa­ben).

Im fol­gen­den Bericht kön­nen Sie nach­le­sen, wie eine Begeg­nung bei den inter­na­tio­na­len Stutt­gar­ter Stimm­ta­gen zu einer Rei­se in ein unge­wöhn­li­ches Stimm­la­bor an der medi­zi­ni­schen Fakul­tät der Uni­ver­si­tät Gro­nin­gen führ­te und bei­des schließ­lich dazu bei­trug, dass ein Gesangs­leh­rer nun einen Com­pu­ter neben dem Kla­vier ste­hen hat… 

Die Aus­gangs­si­tua­ti­on

Ein Gesangs­leh­rer wird stän­dig vor die Auf­ga­be gestellt Gesangs­stim­men zu beur­tei­len. Nicht nur Fra­gen wie: "Kann ich ein Opern­sän­ger wer­den?", "Wer­de ich eine Auf­nah­me­prü­fung an einer Musik­hoch­schu­le schaf­fen?", "Wie gut ist mei­ne Stim­me?" ver­lan­gen immer wie­der die Fähig­keit eine Stim­me beur­tei­len zu kön­nen, son­dern auch im all­täg­li­chen Unter­richt müs­sen stän­dig Gesangs­tö­ne beur­teilt bzw. ana­ly­siert wer­den, um dann eine tech­ni­sche Ver­bes­se­rung oder Ver­voll­komm­nung auf den Weg zu brin­gen. D. h. die Fähig­keit zu einer mög­lichst dif­fe­ren­zier­ten Beur­tei­lung wird immer wie­der auf die Pro­be gestellt. Im Lau­fe der Berufs­jah­re wächst die Fähig­keit zur Beur­tei­lung durch Erfah­run­gen, die man im sän­ge­ri­schen und päd­ago­gi­schen Bereich macht. Die­se "per­sön­li­chen Erfah­run­gen" kön­nen aber nicht allei­ne die Grund­la­ge für eine objek­ti­ve Stimm­be­ur­tei­lung sein, denn für eine objek­ti­ve Beur­tei­lung benö­tigt man objek­ti­ve Kri­te­ri­en. Manch­mal muss man sich sogar von per­sön­li­chen Erfah­run­gen regel­recht frei machen, um die (stimm­li­che) Situa­ti­on eines Schü­lers vor­ur­teils­frei und mög­lichst objek­tiv beur­tei­len zu kön­nen. Für mich ist das Bedürf­nis nach objek­ti­ven Kri­te­ri­en im Lau­fe der Berufs­jah­re immer grö­ßer gewor­den, letzt­lich auch des­halb, weil eine dif­fe­ren­zier­te­re Wahr­neh­mung der Stim­men immer wei­ter­füh­ren­de­re Fra­gen stel­len lässt und ande­rer­seits (das geht zumin­dest mir so) das Bewusst­sein, wie schwie­rig doch eine gute Beur­tei­lung ist und wie groß oft die Ver­ant­wor­tung ist, die man mit der aus der Beur­tei­lung fol­gen­den Bera­tung über­nimmt, immer aus­ge­präg­ter wird. Von dem Bedürf­nis nach Ver­meh­rung der objek­ti­ven Kri­te­ri­en zur Beur­tei­lung von Gesangs­stim­men ange­trie­ben besuch­te ich eine Ver­an­stal­tung, von der ich hier berich­ten will. Um es Lese­rIn­nen mit unter­schied­li­chen Vor­aus­set­zun­gen im stimm­wis­sen­schaft­li­chen Bereich zu ermög­li­chen den Bericht zu lesen und so an einer Begeg­nung teil­zu­ha­ben, die für mich den Ein­tritt in eine neue Dimen­si­on in der Beschäf­ti­gung mit der Gesangs­stim­me bedeu­te­te, wer­de ich zunächst kurz dar­stel­len, was ich in dem Bericht an stimm­wis­sen­schaft­li­chen Grund­la­gen vor­aus­set­zen wer­de. Der Wis­sen­de möge die­se Zei­len "über­flie­gen".

Grund­la­gen

Ein Ton im musi­ka­li­schen Sin­ne ist phy­si­ka­lisch gese­hen ein Klang, d. h. es schwin­gen ein Grund­ton und diver­se Ober­tö­ne. Ein "Ton" wäre genau eine Sinus­schwin­gung, genau eine Ton­hö­he und sonst nichts, kei­ne Far­ben, kein Vibra­to, kein Cha­rak­ter. So etwas kommt glück­li­cher­wei­se sowohl in der Musik als auch in der Natur so gut wie nie vor. Ein musi­ka­li­scher Ton, also ein Klang, dem wir eine Ton­hö­he zuord­nen, besteht aus einem Grund­ton und sei­nen Ober­tö­nen. Die­se schwin­gen mit Fre­quen­zen, die ganz­zah­li­ge Viel­fa­che der Fre­quenz des Grund­tons sind — die­se Ober­tö­ne nennt man auch "Har­mo­ni­sche". Singt ein Tenor ein hohes a, dann ist der Grund­ton H1 = 440 Hz, H2 = 880 Hz, H3 = 1320 Hz, H4 = 4440 Hz usw.; wobei gilt: H1 = ers­te Har­mo­ni­sche, H2 = zwei­te Har­mo­ni­sche usw. (Hz = Hertz, Ein­heit, mit der die Fre­quenz gemes­sen wird: Anzahl der Schwin­gun­gen pro Sekunde). 

Wie stark nun bestimm­te Ober­tö­ne her­vor­tre­ten, ist für den Cha­rak­ter eines Klangs ganz ent­schei­dend. Die Ober­ton­be­rei­che, die einen bestimm­te Klang cha­rak­te­ri­sie­ren, nennt man For­man­ten. Die zwei tiefs­ten For­man­ten (Reso­nan­zen des Ansatz­rohrs) nennt man auch Vokal­for­man­ten, sie bestim­men den Vokal, den wir hören. 

Bei­spiel: Um einen gesun­ge­nen Ton als Vokal "a" zu erken­nen, müs­sen bestimm­te Fre­quenz­be­rei­che eine gewis­se Domi­nanz haben. Der ers­te "For­mant" für den Vokal "a" liegt je nach Geschlecht und Stimm­la­ge etwa zwi­schen 600 Hz und 700 Hz und der zwei­te etwa zwi­schen 1000 Hz und 1200 Hz. 

Ein wei­te­res Bei­spiel für einen wich­ti­gen Fre­quenz­be­reich ist der so genann­te "Sän­ger­for­mant". Durch vie­le Mes­sun­gen hat man her­aus­ge­fun­den, dass die Fre­quen­zen um 3 kHz (3000 Hz) eine ent­schei­den­de Rol­le für die Trag­fä­hig­keit einer Stim­me spie­len. Des­halb nennt man die­sen Fre­quenz­be­reich um 3 kHz "Sän­ger­for­mant". Das heißt, der Sän­ger­for­mant ist gut aus­ge­prägt, wenn in einem gesun­ge­nen Ton die Fre­quen­zen in einem brei­ten Band um 3 kHz (unab­hän­gig vom Grund­ton) eine "rela­ti­ve Stär­ke" haben. 

Zur Ton­pro­duk­ti­on: An den Stimm­lip­pen ent­steht der so genann­te Pri­mär­ton. Im Ansatz­rohr (Rachen, Mund- und Nasen­raum) wer­den bestimm­te Fre­quen­zen her­aus­ge­fil­tert und ver­stärkt. Wel­che Har­mo­ni­schen nun im Ansatz­rohr in wel­chem Maß (mit wel­cher Inten­si­tät) ver­stärkt wer­den, ist für den ent­ste­hen­den Gesangs­ton von ent­schei­den­der Bedeutung. 

So oder ähn­lich hat das fast jeder Gesangs­leh­rer schon ein­mal gele­sen — sehr tro­cken, sehr theo­re­tisch. Voce­Vis­ta, das Com­pu­ter­pro­gramm, über das ich hier berich­ten wer­de, ver­setzt uns in die Lage, vie­les von die­sen Din­gen mit unse­ren Augen an einem Bild­schirm beob­ach­ten zu kön­nen. Dar­über hin­aus kön­nen wir noch viel kom­ple­xe­re Vor­gän­ge wie etwa die Reso­nanz­stra­te­gie eines Tenors in der Höhe nicht nur hörend, son­dern auch sehend ver­glei­chen. Dazu müs­sen wir uns aber zunächst auf den Com­pu­ter und mit ihm auf das Com­pu­ter­pro­gramm Voce­Vis­ta einlassen. 

Die ers­te Begeg­nung mit VoceVista 

Alle zwei Jah­re ver­an­stal­tet die Aka­de­mie für gespro­che­nes Wort an der Stutt­gar­ter Musik­hoch­schu­le die "Inter­na­tio­na­len Stutt­gar­ter Stimm­ta­ge". Im Okto­ber 1998 besuch­te ich die­se Stimm­ta­ge und war einer der weni­gen Zuhö­rer in einem Vor­trag "Feed­back akus­ti­scher Daten im Gesangs­un­ter­richt". Ein ame­ri­ka­ni­scher Sän­ger (Donald G. Mil­ler) und ein Pro­fes­sor für Pho­nia­trie von der medi­zi­ni­schen Fakul­tät der Uni­ver­si­tät Gro­nin­gen (Harm K. Schutte) stell­ten den Zuhö­rern ihr Com­pu­ter­pro­gramm Voce­Vis­ta vor. Der Sän­ger (Bass-Bari­ton) sang in das Mikro­fon, das an den PC ange­schlos­sen war, und auf dem Bild­schirm sah man eine Kur­ve "wackeln"; der Sän­ger drück­te eine Tas­te, wor­auf die Kur­ve erstarr­te. Nun erklär­ten die bei­den, was man mit Hil­fe des Pro­gramms auf dem Bild­schirm alles sehen konnte. 

Mei­ne stimm­wis­sen­schaft­li­che Vor­bil­dung war zu die­sem Zeit­punkt für einen Gesangs­päd­ago­gen nicht mehr als durch­schnitt­lich, also ver­stand ich vie­les, was hier gesagt wur­de, nicht auf Anhieb — aber es wur­de sofort sehr deut­lich, dass es hier um ein abso­lut objek­ti­ves Feed­back zu den gesun­ge­nen Tönen geht und dass man (wenn man über ein gewis­ses Ver­ständ­nis ver­fügt) aus die­ser "Rück­mel­dung" auch Kon­se­quen­zen zie­hen oder zumin­dest ein dif­fe­ren­zier­te­res Bild über die jewei­li­ge Stim­me erstel­len kann. Da ich sehr dar­an inter­es­siert bin, eine mög­lichst brei­te Basis objek­ti­ver Erkennt­nis­se zur Grund­la­ge mei­nes Unter­richts zu machen, war ich trotz man­cher Ver­ständ­nis­schwie­rig­kei­ten sehr begeis­tert und ver­such­te so gut als mög­lich zu folgen. 

Es stell­te sich schnell her­aus, dass unter den weni­gen Zuhö­rern eini­ge Spe­zia­lis­ten waren (u. a. Eugen Rabi­ne), die sehr genau wuss­ten, wel­che Rol­le die Sän­ger­for­man­ten spie­len, wie man eine "real-time spec­tral ana­ly­sis" deu­ten kann oder was der "clo­sed quo­ti­ent" bedeu­tet, den man mit dem Elec­tro­glot­to­graf mes­sen kann. Ich staun­te über die Prä­zi­si­on der ent­ste­hen­den Dis­kus­si­on. Der sym­pa­thi­sche Sän­ger sang immer wie­der in das Mikro­fon, meist in der Über­gangs­la­ge und in der Höhe, hielt dann die Kur­ve auf dem Bild­schirm mit einem Tas­ten­druck fest und erklär­te bei­spiels­wei­se, was einen gedeck­ten (geschlos­se­nen) Ton ober­halb des Pas­sagio-Bereichs (etwa e1)1 von einem unge­deck­ten (offe­nen) Ton unter­schei­det. Der HNO-Pro­fes­sor unter­mau­er­te die Erklä­run­gen mit wis­sen­schaft­li­cher Prä­zi­si­on und ich ahn­te — nein, ich war mir ganz sicher: Hier sind Ant­wor­ten auf vie­le Fra­gen, mit denen ich mich schon lan­ge beschäf­ti­ge, und hier eröff­net sich eine neue Dimen­si­on, was die Mög­lich­keit der objek­ti­ven Beur­tei­lung einer Stim­me anbe­langt. Am Ende die­ser Ver­an­stal­tung hat­te ich also kurz zusam­men­ge­fasst Fol­gen­des gelernt: 

Voce­Vis­ta ist ein PC-Pro­gramm, das zwei Signa­le am Bild­schirm dar­stel­len kann: ers­tens eine "real-time spec­tral analysis"2 von dem in das Mikro­fon ein­ge­sun­ge­nen oder in den Line-in-Ein­gang der Sound­kar­te ein­ge­spiel­ten Ton, zwei­tens eine Dar­stel­lung des mit dem Electroglottografen3 (EGG) gemes­se­nen Stimm­lip­pen­kon­takts. Da ich selbst kein EGG besit­ze, also auch kei­ne eige­nen Erfah­run­gen damit machen konn­te, wer­de ich in die­sem Bericht aus­führ­lich nur auf die Mög­lich­kei­ten der Spek­tral­ana­ly­se in Echt­zeit ein­ge­hen. Der Voll­stän­dig­keit hal­ber sei aber erwähnt, dass die Mes­sung mit dem EGG ein seriö­ses, wis­sen­schaft­lich abge­si­cher­tes Ver­fah­ren ist, das ins­be­son­de­re, wenn man die Mess­ergeb­nis­se zusam­men mit der Spek­tral­ana­ly­se aus­wer­tet, eine sehr fun­dier­te Aus­sa­ge über die Stimm­ge­bung ermög­licht. Beschränkt man sich auf die Mög­lich­kei­ten der Aus­wer­tung der Spek­tral­ana­ly­se in Echt­zeit, hat man eine Aus­sa­ge über "Reso­nanz­stra­te­gie" in Abhän­gig­keit der ver­schie­de­nen For­men des Ansatz­rohrs. Die ver­schie­de­nen Funk­ti­ons­wei­sen der Stimm­lip­pen blei­ben dabei außen vor. 

Zurück nach Stutt­gart: Nach der erwähn­ten Ver­an­stal­tung hat­te ich von der Spek­tral­ana­ly­se in Echt­zeit etwa Fol­gen­des ver­stan­den: Die Spek­tral­ana­ly­se in Echt­zeit zeigt den Ton, den wir in die­sem Moment hören, und zwar auf­ge­schlüs­selt in Grund­ton und die fol­gen­den Ober­tö­ne (Grund­ton = H1, Ober­tö­ne H2, H3 usw.). Die ent­ste­hen­de Kur­ve wird in einem Ach­sen­kreuz gezeigt, in dem ent­lang der x‑Achse die Fre­quen­zen in Hz gemes­sen wer­den und ent­lang der y‑Achse die Inten­si­tät in dB (sie­he Abb. 1). 

Wir sehen also den Grund­ton (H1) und sei­ne Ober­tö­ne H2, H3, H4 usw. Ganz ent­schei­dend ist nun, wel­che Ober­tö­ne rela­tiv zu den ande­ren gese­hen stär­ker her­vor­tre­ten und wel­che schwä­cher — anders for­mu­liert: wel­che Ober­ton­be­rei­che domi­nie­ren. Das heißt, ich kann z. B. die Sän­ger­for­man­ten sehen; sind die Ober­tö­ne im Bereich um 3 kHz stär­ker aus­ge­prägt oder eher schwach? Sind sie stär­ker aus­ge­bil­det, dann sind die so genann­ten Sän­ger­for­man­ten auch gut aus­ge­prägt; sind im Bereich von 3 kHz nur schwa­che Aus­schlä­ge, dann sind die Sän­ger­for­man­ten eben schwä­cher ausgeprägt. 

Mit die­sem Grund­ver­ständ­nis im Kopf, einem Mikro­fon vor dem Mund und einer sich bewe­gen­den Kur­ve vor den Augen begriff ich: Hier ent­steht eine völ­lig neue Dimen­si­on von Rück­mel­dung und in Fol­ge des­sen auch eine völ­lig neue Dimen­si­on des Nach­ma­chens: Ich sin­ge eine Kurve… 

Natür­lich waren zu die­sem Zeit­punkt für mich noch sehr vie­le Fra­gen offen: Wie ist der genaue Zusam­men­hang zwi­schen For­man­ten und der Inten­si­tät der Ober­tö­ne? Wie geschieht die Ver­stär­kung bestimm­ter Ober­tö­ne im Ansatz­rohr genau? Gibt es neben den kon­kre­ten akus­ti­schen Erkennt­nis­sen auch Erkennt­nis­se, was die prak­ti­sche Umset­zung, also die bewuss­te Beein­flus­sung die­ser Vor­gän­ge angeht? Und wie kann ich nun einen "offe­nen" Ton von einem "gedeck­ten" mit den hier sehr prä­zi­se gefass­ten Begriff­lich­kei­ten unter­schei­den? Die bei­den Refe­ren­ten for­mu­lier­ten zu die­sem The­ma einen Satz, der etwa lau­te­te: Offe­nes Sin­gen in der Höhe heißt, dass der ers­te For­mant dem natür­li­chen Drang nach­gibt, der zwei­ten Har­mo­ni­schen zu fol­gen. Ich war sehr fas­zi­niert, denn es war die Ant­wort auf eine Fra­ge, die ich mir schon lan­ge Zeit immer wie­der stellte. 

Eine auf­schluss­rei­che Reise 

Nach­dem ich nun wuss­te, dass es mög­lich war, mit Hil­fe eines PC-Pro­gramms vie­le Vor­gän­ge beim Sin­gen sicht­bar und damit auch ver­ständ­li­cher zu machen, ließ mich die­ses The­ma nicht mehr los. So las ich bei ver­schie­de­nen Autoren noch ein­mal die Grund­la­gen über akus­ti­sche Daten und kauf­te mir schließ­lich das Buch Voice-Tra­di­ti­on and Tech­no­lo­gy von Garyth Nair. Die­ses Buch ent­hält zwei Kapi­tel von Harm K. Schutte und Donald G. Mil­ler, in denen sie die Arbeit mit Voce­Vis­ta beschrei­ben. Außer­dem ent­hält es eine CD-ROM, mit der man am PC Klang­bei­spie­le anhö­ren und mit der Echt­zeit­spek­tral­ana­ly­se ana­ly­sie­ren kann; d. h. man hört einen gesun­ge­nen Ton, sieht die zuge­hö­ri­ge Kur­ve am Bild­schirm, kann sie zu einem belie­bi­gen Zeit­punkt durch einen Tas­ten­druck stop­pen und kann nun mit Hil­fe des Buchs den Ton nach akus­ti­schen Kri­te­ri­en ana­ly­sie­ren. Die Leich­tig­keit, mit der man die­se Bei­spie­le auf einem "ganz nor­ma­len PC"4 abspie­len konn­te, über­zeug­te mich sehr. Also teil­te ich Donald Mil­ler per e‑mail mit (fast ein Jahr nach den Stutt­gar­ter Stimm­ta­gen), dass ich das Pro­gramm Voce­Vis­ta kau­fen wol­le, um mich in das Aben­teu­er com­pu­ter­ge­stütz­ter Stimm­ana­ly­se zu stür­zen. Ich bezahl­te 300 Dol­lar und bekam das Pro­gramm per 

e‑mail geschickt. Es war sehr ein­fach zu instal­lie­ren und brauch­te sehr wenig Spei­cher­platz. Das Mikro­fon wur­de in die Sound­kar­te ein­ge­steckt und nun konn­te es los­ge­hen. Ich spür­te sehr schnell, dass man in das Mikro­fon sin­gend, den Bild­schirm beob­ach­tend intui­tiv auf das opti­sche Vor­bild reagiert. Es kann in einem gewis­sen Rah­men gelin­gen, eine "Wunsch­kur­ve" nach­zu­sin­gen. Aber wie sieht nun die idea­le Wunsch­kur­ve aus? Es ent­stan­den sehr schnell immer mehr Fra­gen — auch gab es in dem Pro­gramm ein paar Ein­stel­lungs­mög­lich­kei­ten, mit denen ich nichts anfan­gen konn­te. Donald Mil­ler teil­te mir mit, dass es ihm wich­tig wäre, dass die Anwen­de­rIn­nen von Voce­Vis­ta auch erfolg­reich mit die­sem Pro­gramm arbei­ten könn­ten, und lud mich nach Gro­nin­gen ein, um in einem "Kom­pakt­se­mi­nar" die Grund­la­gen der com­pu­ter­ge­steu­er­ten Stimm­ana­ly­se mit Voce­Vis­ta zu erar­bei­ten. Also pack­te ich mei­nen PC ein und fuhr für drei Tage nach Gro­nin­gen. Dort ange­kom­men staun­te ich zunächst über die bei­den Räu­me der Uni­ver­si­tät, die das Stimm­la­bor beher­berg­ten: ein krea­ti­ves Cha­os — so stel­le ich mir die Gara­ge vor, in der Bill Gates ange­fan­gen haben soll. Aller­dings ver­fügt er sicher nicht über eine sol­che Biblio­thek: In einem rie­si­gen Regal stand wohl alles, was über Gesang je geschrie­ben wur­de. Für wei­te­res Stau­nen blieb lei­der kei­ne Zeit mehr. Wir wen­de­ten uns der Arbeit zu. Es erwar­te­te mich Sup­port vom Feinsten. 

Die Ein­stel­lungs­mög­lich­kei­ten des Programms 

Wir gin­gen zunächst die Ein­stel­lungs­mög­lich­kei­ten des Pro­gramms Voce­Vis­ta durch; die wich­tigs­ten will ich hier erklä­ren. Durch einen Maus­klick auf "Ana­ly­sis" oder drü­cken der Tas­te "a" erscheint am Bild­schirm die "Ana­ly­sis-Box". Hier kann man u. a. fol­gen­de Ein­stel­lun­gen vornehmen: 

Maß­stab für die Fre­quenz­ach­se: Wahl­wei­se kann die Dar­stel­lung bis 3 kHz, 

5 kHz oder 10 kHz gehen. In Abb. 1 sehen wir die Ein­stel­lung bis 5 kHz. 

Den Bild­schirm tei­len: Der Bild­schirm kann in zwei Hälf­ten geteilt wer­den (sie­he Abb. 2–6). Durch einen Tas­ten­druck kann man die Kur­ve, die man in der obe­ren Bild­schirm­hälf­te gera­de "fest­ge­hal­ten" hat, in die unte­re Hälf­te spei­chern und dann in der obe­ren Hälf­te wei­ter neue Töne anschau­en. Dies ist die idea­le Ein­stel­lung, um Töne mit­ein­an­der zu ver­glei­chen (sie­he Abb. 3, 4 und 6) oder um eine "Ide­al­kur­ve" nachzusingen. 

Die Geschwin­dig­keit des Kur­ven­auf­baus: Es gibt die Mög­lich­keit ein­zu­stel­len, wie schnell sich die Kur­ve auf­baut (ein Vor­gang, den man nicht unbe­dingt ganz genau ver­ste­hen muss). Wählt man für "Spec­trum Average" einen klei­nen Wert, dann baut sich die Kur­ve sehr schnell auf, bei einem grö­ße­ren Wert baut sie sich lang­sa­mer auf. Will man bei­spiels­wei­se aus einer Auf­nah­me einen rela­tiv kur­zen Ton anhal­ten, so soll­te man hier einen klei­nen Wert ein­set­zen. Grund­sätz­lich emp­fiehlt es sich, die Grund­ein­stel­lung beizubehalten. 

Das Audio­fens­ter: Wie schon erwähnt gibt es in Voce­Vis­ta die Mög­lich­keit, den clo­sed quo­ti­ent dar­zu­stel­len. Wählt man bei "Dis­play" die Ein­stel­lung "Glot­to­gram", dann zeigt der Bild­schirm nur die Kur­ve, die das EGG misst. Wählt man die Ein­stel­lung "Audio/Glottogram" zeigt der Bild­schirm in der obe­ren Hälf­te das Audio­fens­ter und in der unte­ren das Glot­to­gram (sie­he Abb. 2). Das Audio­fens­ter zeigt den gesun­ge­nen Ton über einen wähl­ba­ren Zeit­raum. Die x‑Achse gibt die Zeit in Mil­li­se­kun­den an, die y‑Achse (wie in der Echt­zeit­ana­ly­se) die Inten­si­tät in Dezi­bel. Die­ses Fens­ter zeigt also den gesam­ten Klang über einen kur­zen Zeit­ab­schnitt (wähl­bar zwi­schen 5 msec. und 150 msec.). Man beach­te den Unter­schied zur Echt­zeit­ana­ly­se, in der der Klang in dem Moment dar­ge­stellt wird, in dem wir ihn hören — und zwar "auf­ge­schlüs­selt" in Grund­ton und Ober­tö­ne bis maxi­mal 10 kHz. Für mich per­sön­lich war es eine Ver­ständ­nis­hil­fe, den Grund­ton aus der Kur­ve im Audio­fens­ter zu mes­sen. Hier­zu muss man die Periode5 P der Kur­ve bestim­men, dann gilt für den Grund­ton F0 = 1/P. Man kann den Grund­ton natür­lich auch ganz ein­fach im Echt­zeit­fens­ter able­sen (sie­he Abb. 1). 

Noch mehr für Spezialisten 

Es gibt noch wei­te­re Ein­stel­lungs­mög­lich­kei­ten, die aller­dings ein tie­fe­res Ver­ständ­nis für die akus­ti­schen Vor­gän­ge vor­aus­set­zen und teil­wei­se auch nur im Zusam­men­hang mit der Benut­zung des EGG zur Anwen­dung kom­men. Für die hier beschrie­be­nen Anwen­dun­gen kommt man gut zurecht, wenn man die vor­ge­ge­be­nen Grund­ein­stel­lun­gen beibehält. 

Nach­dem nun die grund­le­gen­den Ein­stel­lungs­mög­lich­kei­ten des Pro­gramms erklärt waren, schau­ten und hör­ten wir uns vie­le Töne im Echt­zeit­fens­ter an. Das Ver­ständ­nis für die Kur­ven wur­de von Bei­spiel zu Bei­spiel bes­ser. Es war für mich fas­zi­nie­rend, bei­spiels­wei­se den Unter­schied von Vokal "a" zu Vokal "e" zu sehen (sie­he Abb. 3). Schon oft hat­te ich das The­ma Vokal­for­man­ten im Metho­dik­un­ter­richt erklärt — es blieb immer etwas theo­re­tisch. Jetzt erkann­te ich in Voce­Vis­ta ein Instru­ment, mit dem man u. a. die­ses The­ma auf sehr leben­di­ge wei­se im wahrs­ten Sin­ne des Wor­tes anschau­lich ver­mit­teln konnte. 

Oder der grund­sätz­li­che Unter­schied zwi­schen Män­ner- und Frau­en­stim­men, auch dies ein The­ma, das für den Metho­dik­un­ter­richt wich­tig ist. Es war für mich eben­so fas­zi­nie­rend zu sehen, dass die Frau­en­stim­me im Wesent­li­chen nur halb so viel Har­mo­ni­sche hat, die sie ver­stär­ken kann, wie die Män­ner­stim­me, wäh­rend sich die Mög­lich­kei­ten des Ansatz­rohrs nicht so wesent­lich von denen der Män­ner­stim­me unter­schei­den (sie­he Abb. 4). 

vocal fry — die For­man­ten darstellen 

Als nächs­tes erklär­te Donald Mil­ler einen Trick, mit dem er sei­ne For­man­ten bes­ser sicht­bar machen kann, als man sie aus der Fre­quenz­kur­ve (über die Inter­pre­ta­ti­on der Inten­si­tät der ver­schie­de­nen Har­mo­ni­schen) lesen kann. Er formt mit dem Ansatz­rohr bei­spiels­wei­se den Vokal "a", singt aber kei­nen Ton, son­dern macht inspi­ra­to­risch eine Art Rei­be­ge­räusch. Die­ses "Geräusch" nennt er "vocal fry". Auf dem Bild­schirm erscheint ein "kon­ti­nu­ier­li­ches Spek­trum" (sie­he Abb. 5). Die­ses Bild zeigt ziem­lich genau, wie die Fre­quen­zen des Pri­mär­tons ver­stärkt wer­den. Und das Bild des gesun­ge­nen Tons zeigt sozu­sa­gen das Ergeb­nis die­ser Ver­stär­kung. Natür­lich kann man auch ohne die­sen Trick ein­fach aus der Fre­quenz­kur­ve die For­man­ten und vie­le ande­re Phä­no­me­ne ent­de­cken, aber für das Gesamt­ver­ständ­nis war es wie­der sehr erhel­lend — und da mir die­ses Geräusch auch rela­tiv schnell gelang, mach­te ich eini­ge Expe­ri­men­te damit und hat­te dabei auch inter­es­san­te Erkennt­nis­se (s. u.). 

Ana­ly­se von Aufnahmen 

Ein wich­ti­ges The­ma des Kom­pakt­se­mi­nars in Gro­nin­gen war noch die Ana­ly­se von Auf­nah­men. Man kann mit Voce­Vis­ta zum einen live Ein­ge­sun­ge­nes oder über den line-in-Ein­gang bzw. über CD Ein­ge­spiel­tes direkt anse­hen, zum ande­ren aber auch auf dem­sel­ben Wege Auf­nah­men her­stel­len. Die ent­stan­de­ne Auf­nah­me wird als "vis"-Datei abge­spei­chert. Datei­en mit einem ande­ren For­mat kann Voce­Vis­ta nicht abspielen. 

Wir hör­ten uns in Gro­nin­gen u. a. das hohe b aus der Arie "Celes­te Aida" aus Ver­dis Oper Aida an. Mil­ler ver­glich Dom­in­go mit Pava­rot­ti. Zunächst war für mich sehr inter­es­sant zu sehen, wie es mög­lich ist, die Töne des Sän­gers am Bild­schirm von dem Klang des Orches­ters zu unter­schei­den: Der Blick schärft sich sehr schnell, das Orches­ter ist im Bereich um 3 kHz und dar­über hin­aus nicht mehr so inten­siv. Hat man nun einen eini­ger­ma­ßen expo­nier­ten Ton, so erkennt man den Grund­ton des Sän­gers und kann dann die Har­mo­ni­schen rela­tiv leicht fin­den (es hilft natür­lich, wenn man die Ton­hö­he genau kennt, in unse­rem Bei­spiel b1 = 466 Hz). Man erkennt, dass sich die höhe­ren Har­mo­ni­schen immer deut­li­cher vom Orches­ter abhe­ben (sie­he Abb. 6). Wir sehen, dass Dom­in­gos Klang von einem domi­nan­ten H6 cha­rak­te­ri­siert wird, wäh­rend Pava­rot­ti einen domi­nan­ten H3 benutzt. Wenn man nun weiß, dass die Vokal­for­man­ten für das zu sin­gen­de "o" (sole) unge­fähr um 430 Hz bzw. 780 Hz lie­gen (für ein offe­nes "o" etwa bei 550 Hz bzw. 820 Hz), könn­te man ver­mu­ten, dass im Klang­bild des b1 (H1 = 466, H2 = 932 Hz) auch einer die­ser bei­den Har­mo­ni­schen dominiert. 

Aber die Stra­te­gie der berühm­ten Tenö­re ist offen­sicht­lich eine ande­re. Pava­rot­ti benutzt sei­nen zwei­ten For­man­ten, um H3 = 1398 Hz zu ver­stär­ken, wäh­rend Dom­in­go sei­nen Sän­ger­for­man­ten benutzt, um H6 = 2796 Hz zu ver­stär­ken. Donald Mil­ler hat in Gro­nin­gen noch fest­ge­stellt, dass Caru­so bei die­sem Ton in die­ser Arie die glei­che Reso­nanz­stra­te­gie benutz­te wie Dom­in­go. Wenn man nun noch bedenkt, dass man auch dar­über Aus­sa­gen machen kann, durch wel­che phy­si­sche Ver­än­de­rung des Ansatz­rohrs man sei­ne For­man­ten ver­schie­ben kann, dann wird sehr deut­lich, wie span­nend und lehr­reich sol­che Ana­ly­sen sein können. 

Ich hat­te in den zwei Tagen in Gro­nin­gen sehr viel Neu­es über "Sin­gen" gelernt, dem sym­pa­thi­schen Donald Mil­ler sei auch hier noch ein­mal gedankt. Ver­steht man die­ses "Kom­pakt­se­mi­nar", an dem neben mir noch ein an Voce­Vis­ta inter­es­sier­ter Tenor aus Ham­burg teil­nahm, als Sup­port für das Com­pu­ter­pro­gramm, dann ist das der bes­te Sup­port, den man sich den­ken kann. Da sich für mich nun immer mehr tie­fer ins Detail gehen­de Fra­gen stell­ten, die man teil­wei­se durch Expe­ri­men­tie­ren mit dem Pro­gramm beant­wor­ten kann, habe ich mir noch einen PC gekauft und die­sen so in mein Musik­zim­mer gestellt, dass er einer­seits die Atmo­sphä­re nicht ganz zer­stört (Lap­top wäre unauf­fäl­li­ger — aber wesent­lich teu­rer), ande­rer­seits aber jeder­zeit auch bei der Arbeit mit Schü­lern ein­zu­set­zen ist. Über die wesent­li­chen ers­ten Erfah­run­gen, die ich bei der Arbeit mit Voce­Vis­ta mach­te, möch­te ich im letz­ten Abschnitt berichten. 

Die ers­ten eige­nen Erfahrungen 

Klä­rung der Begrif­fe — Prä­zi­sie­rung der Sprache 

Gesangs­leh­re­rIn­nen dis­ku­tie­ren oft sehr diver­gent. Der eine bei­spiels­wei­se redet aus metho­di­schen Grün­den nur von "Ein­re­gis­ter", die ande­re dif­fe­ren­ziert, gera­de um einen mög­lichst guten Regis­ter­aus­gleich zu errei­chen, die Regis­ter sehr genau, etwa in "Kopf‑, Mit­tel- und Brust­stim­me". Oder der eine schließt in den Begriff "Reso­nanz" Vibra­ti­ons­ge­füh­le im Brust- und Bauch­raum und allen mög­li­chen ande­ren Kör­per­par­tien mit ein, wäh­rend sich eine ande­re sehr genau an einer wis­sen­schaft­li­chen Defi­ni­ti­on des Begriffs ori­en­tiert. Oft­mals lässt sich in einer Dis­kus­si­on nicht ein­mal fest­stel­len, ob die Dis­ku­tie­ren­den nun eine ähn­li­che Ansicht zu einer Fra­ge­stel­lung tei­len oder nicht, weil jeder Begrif­fe wie "Reso­nanz" oder "Regis­ter" in einem ande­ren Sinn (mit einer ande­ren Defi­ni­ti­on) benutzt. Sehr häu­fig wird die Ebe­ne der eige­nen Wahr­neh­mung mit einer "wis­sen­schaft­lich-beschrei­ben­den" ver­mischt. Dies macht eine dif­fe­ren­zier­te Dis­kus­si­on sehr schwie­rig. Die Beschäf­ti­gung mit Voce­Vis­ta erzwingt nun gewis­ser­ma­ßen eine Objek­ti­vie­rung der Begrif­fe und eine Prä­zi­sie­rung der Spra­che. Dies ist ein Effekt der Arbeit mit Voce­Vis­ta, den ich für sehr wert­voll hal­te. Auf den ers­ten Blick wird die­ser Aspekt leicht unter­schätzt, aber ist die Kom­mu­ni­ka­ti­ons­fä­hig­keit nicht eine der wich­tigs­ten Fähig­kei­ten für einen Gesangs­leh­rer? Und zur Ver­bes­se­rung der Kom­mu­ni­ka­ti­ons­fä­hig­keit kann die Prä­zi­sie­rung der Spra­che einen wesent­li­chen Bei­trag leisten. 

Das eige­ne Ansatz­rohr erforschen 

Ver­sucht man nun immer wie­der vocal fry und dann den auf einer bestimm­ten Ton­hö­he gesun­ge­nen zuge­hö­ri­gen Vokal zu ver­glei­chen, fängt man an, sei­ne Stim­me auf eine neue Art und Wei­se zu ent­de­cken. Ich war sehr fas­zi­niert zu sehen, dass es bei­spiels­wei­se hilf­reich sein kann, in bestimm­ten Situa­tio­nen die Zun­ge etwas anzu­he­ben. Durch die­se Maß­nah­me wer­den die For­man­ten ein wenig ver­scho­ben. Die­se "Ver­schie­bung" der For­man­ten konn­te ich auch bei der Umset­zung der Vor­stel­lung "Stau­nen" oder gar "Gäh­nen" (also eine Wei­tung des Ansatz­rohrs, im Wesent­li­chen cha­rak­te­ri­siert durch Anhe­ben des wei­chen Gau­mens und Absen­ken des Kehl­kopfs) beob­ach­ten. Auf der Basis sol­cher Beob­ach­tun­gen kann man nun indi­vi­du­el­le Reso­nanz­stra­te­gien gewis­ser­ma­ßen neu ver­ste­hen. Ich sehe Vor­gän­ge und ver­ste­he nun, war­um mich bis­her eine sän­ge­ri­sche Intui­ti­on zu bestimm­ten Ein­stel­lun­gen führ­te. So kann ich z. B. den Vor­gang des "Abde­ckens" in eine ande­re Spra­che übersetzen,6 weil ich ihn in einem neu­en Zusam­men­hang begrei­fe. Das heißt, ich kann auch die Intui­ti­on von ande­ren Sän­gern bes­ser ver­ste­hen und als Gesangs­leh­rer u. U. sehr dif­fe­ren­ziert in die­sen Pro­zess ein­grei­fen. Der gelern­te Sän­ger wird in der Regel fest­stel­len, dass die so gewon­ne­ne Ein­sicht zur glei­chen Bemü­hung führt, die er schon vor­her über Hören und Spü­ren ver­folg­te — aber jetzt kann er sehen, war­um er es tut. Und in der einen oder ande­ren Situa­ti­on lässt sich viel­leicht doch etwas durch die­sen tie­fe­ren Ein­blick verbessern. 

Eine neue Dimen­si­on des Nachmachens 

Das intui­ti­ve Nach­sin­gen eines gese­he­nen Tons bedeu­tet für mich tat­säch­lich den Ein­tritt in eine neue Dimen­si­on des Stimm­trai­nings. Sehr wich­tig ist, dass wir unter­schei­den zwi­schen dem oben beschrie­be­nen "Erfor­schen" des Ansatz­rohrs (das ist ein sehr ana­ly­ti­scher Vor­gang) und dem intui­ti­ven Nach­sin­gen. Die Erkennt­nis­se aus der Erfor­schung des Ansatz­rohrs wer­den auf einem sehr kogni­ti­ven Weg gefun­den, das intui­ti­ve Nach­sin­gen einer Kur­ve hin­ge­gen erfor­dert nicht die­se kogni­ti­ven Fähig­kei­ten. Es bin­det die sän­ge­ri­schen Sin­ne auf eine neue Art und Wei­se. Ich höre einen gesun­ge­nen Ton von einem nach­ah­mens­wer­ten Sän­ger mei­nes Stimm­fachs ein­mal und dann sehe ich die Kur­ve — ich höre sie nicht immer wie­der, ich sehe sie per­ma­nent, kon­zen­trie­re mich auf tie­fen Atem und die­ses Bild (die­ser Vor­gang lenkt von den Orga­nen ab, die sich jetzt opti­mal auf­ein­an­der abstim­men sol­len) und ver­su­che eine Kur­ve zu sin­gen, die in den wesent­li­chen Eigen­schaf­ten mit denen des Bilds übereinstimmt.7 Das Phä­no­me­na­le an die­ser Art des Nach­ma­chens ist, dass sich der Sän­ger dar­auf beschränkt, ein paar wesent­li­che akus­ti­sche Merk­ma­le eines Klangs nach­zu­emp­fin­den, und nicht der Gefahr aus­ge­setzt ist, einen Gesamt­klang nach­zu­ma­chen, der u. U. mit sei­ner Stim­me auf phy­sio­lo­gisch gesun­de Art und Wei­se gar nicht her­zu­stel­len ist. Für mich per­sön­lich war es fas­zi­nie­rend fest­zu­stel­len, wie die Fähig­keit wächst eine Kur­ve nach­zu­sin­gen. Es ent­steht eine neue Sen­si­bi­li­tät, denn die Anfor­de­run­gen sind von einer ande­ren Qua­li­tät, als wenn man einen Klang nach­singt oder, was bes­ser ist, bestimm­te Eigen­schaf­ten eines Klangs nach­zu­ma­chen versucht. 

Für den Unter­richt sehe ich hier ein brei­tes Feld der Anwen­dungs­mög­lich­kei­ten. Ins­be­son­de­re weil der Schü­ler oder die Schü­le­rin nicht mit dem gan­zen theo­re­ti­schen Hin­ter­grund, den der Leh­rer natür­lich im Blick haben soll­te, kon­fron­tiert wer­den muss. Bei­spiel: Die Schü­le­rin soll sich (mit den Augen) auf ihre Sän­ger­for­man­ten kon­zen­trie­ren und dann auf einem Ton alle Voka­le sin­gen. Das Ziel dabei ist, die Inten­si­tät des Sän­ger­for­man­ten mög­lichst hoch zu hal­ten. Fällt nun bei einem Vokal die Inten­si­tät deut­lich ab, dann sieht die Schü­le­rin sofort, wie die Kur­ve ent­spre­chend ein­fällt. Dazu muss nicht die Gesamt­heit des kom­ple­xen Hin­ter­grunds erklärt werden,8 die Schü­le­rin bleibt auf dem Pfad zur Her­an­bil­dung einer sän­ge­ri­schen Intui­ti­on. Mei­ne ers­ten Erfah­run­gen in die­sem Zusam­men­hang zei­gen, dass die Schü­le­rIn­nen sehr neu­gie­rig und offen auf die Kon­fron­ta­ti­on mit ihrer eige­nen Kur­ve reagie­ren, auch wenn sie sonst kei­ne Freun­de des Com­pu­ters sind. Hier tut sich eben eine neue Dimen­si­on auf. 

Kein Wun­der­mit­tel, aber die Ent­de­ckung einer neu­en Welt 

Die bis­her erwähn­ten Erfah­rungs­be­rei­che oder Anwen­dungs­mög­lich­kei­ten haben eine Gemein­sam­keit: Man lernt stimm­li­che Vor­gän­ge neu zu for­mu­lie­ren, gege­be­nen­falls erar­bei­tet man sich eini­ge Begrif­fe neu, man erkennt neue Zusam­men­hän­ge, man schärft das ana­ly­ti­sche Ohr. Das heißt, durch die Nut­zung der Mög­lich­kei­ten des Pro­gramms lernt man vie­les qua­si neben­her. Lässt man sich durch den Umgang mit der not­wen­di­gen Tech­nik nicht abschre­cken, so kann man die­se wert­vol­len Erkennt­nis­se auf durch­aus spie­le­ri­sche Art und Wei­se gewinnen. 

Voce­Vis­ta ist kein Pro­gramm für "jeder­mann", es ist ein Pro­gramm für Fach­leu­te, denn es ist zwar leicht zu bedie­nen, aber man muss wis­sen, was man tut, wenn man zu qua­li­fi­zier­ten Aus­sa­gen kom­men will. Das for­dert die Aus­ein­an­der­set­zung mit den Fach­be­grif­fen und davon pro­fi­tiert nach mei­ner Mei­nung die gesam­te Gesangspädagogik. 

Der PC hält Ein­zug in vie­le Berei­che unse­res Lebens, in Kin­der­zim­mern und Wohn­zim­mern kann er auch schnell zur Last wer­den und mehr Pro­ble­me schaf­fen, als er löst. Im Gesangs­zim­mer kann er einen Weg in eine neue Welt eröff­nen, nicht um die "alte Welt" in Fra­ge zu stel­len, son­dern um sie dif­fe­ren­zier­ter zu betrachten. 

Anmer­kun­gen

1 Die Ton­hö­hen­an­ga­ben in die­sem Bericht bezie­hen sich auf das in Deutsch­land übli­che Sys­tem a = 220 Hz, a1 = 440 Hz usw. 

2 aus der eng­li­schen Fach­li­te­ra­tur; ins Deut­sche über­tra­gen: "Spek­tral­ana­ly­se in Echtzeit". 

3 Das EGG ist ein klei­nes Gerät bestehend aus zwei Kon­tak­ten, die an den Kehl­kopf ange­legt wer­den. So kann der Kon­takt der Stimm­lip­pen pro Zeit gemes­sen wer­den. Es ent­steht eine Kur­ve, die eine sehr wich­ti­ge Aus­sa­ge über die Art der Stimm­ge­bung macht. Eine noch dif­fe­ren­zier­te­re Aus­sa­ge über die Stimm­ge­bung kann man eben dann machen, wenn man die Dar­stel­lung des Stimm­lip­pen­kon­takts und 

den dar­aus abge­le­se­nen "clo­sed quo­ti­ent" ("Schließ­quo­ti­ent") zusam­men mit dem akus­ti­schen Signal inter­pre­tiert. Die Aus­füh­rung die­ser Mög­lich­kei­ten wür­de hier zu weit führen. 

4 Ich benut­ze einen Pen­ti­um I (166 MHz, MMX), 64 RAM, Win98 als Betriebssystem. 

5 Die Peri­ode P ist die (Zeit)Länge einer Schwin­gung. Für die Grund­fre­quenz F0 der Schwin­gung gilt also F0 = 1/P, sie gibt dann an, wie viel Schwin­gun­gen pro Sekun­de aus­ge­führt wer­den. Zur Mes­sung mit der Maus: Man kann mit der Maus im Audio­fens­ter jedes belie­bi­ge Zeit­in­ter­vall mes­sen. Am gewünsch­ten Anfangs­punkt drückt man die lin­ke Maus­tas­te, dann zieht man die Maus bis zum gewünsch­ten End­punkt und lässt sie los. Der Com­pu­ter gibt dann das so gemes­se­ne Inter­vall in msec an. Wählt man nun Anfangs- und End­punkt so, dass die bei­den Punk­te die Peri­ode der Kur­ve bestim­men, dann erhält man als (Zeit)Intervall genau die (Zeit)Länge der Periode. 

6 vgl. oben: "offe­nes Sin­gen in der Höhe heißt, dass der ers­te For­mant dem natür­li­chen Drang nach­gibt der zwei­ten Har­mo­ni­schen zu fol­gen". Man beach­te, dass dies so nur für Män­ner­stim­men gilt. 

7 In der Unter­richts­si­tua­ti­on soll­te man dar­auf ach­ten, dass man den Bild­schirm höher auf­stellt als übli­cher­wei­se, so dass man in einer ganz natür­li­chen Hal­tung sin­gen kann. 

8 Für man­che Schü­le­rin und man­chen Schü­ler kann natür­lich gera­de eine wis­sen­schaft­lich ori­en­tier­te prä­zi­se Erklä­rung der Vor­gän­ge moti­vie­rend sein. 

Lite­ra­tur

* Donald Gray Mil­ler: Regis­ters In Sin­ging, Roden 2000, zu bezie­hen über: Gro­nin­gen Voice Rese­arch Lab, Depart­ment of Bio­me­di­cal Engi­nee­ring, P. O. Box 196, NL-9700 AD Groningen 

* Garyth Nair: Voice-Tra­di­ti­on and Tech­no­lo­gy, San Die­go 1999, Sin­gu­lar Publi­shing Group, Inc. 

Soft­ware

Voce­Vis­ta, wei­te­re Infos: www.vocevista.com

Kon­takt

Mat­thi­as Mül­ler, Tel. 0711/4793762, Fax 0711/ 4793758, e‑mail: matthias.mueller@stimmkultur.de
Inter­net: www.stimmkultur.de