Müller, Matthias

Voce­Vis­ta. End­lich sehen, was ich schon immer hören wollte

Ein Bericht über computergesteuerte Stimmanalyse im Gesangsunterricht

Rubrik: Aufsatz
erschienen in: üben & musizieren 2/2001 , Seite 16

Im folgenden Bericht können Sie nachlesen, wie eine Begegnung bei den internationalen Stuttgarter Stimmtagen zu einer Reise in ein ungewöhnliches Stimmlabor an der medizinischen Fakultät der Universität Groningen führte und beides schließlich dazu beitrug, dass ein Gesangslehrer nun einen Computer neben dem Klavier stehen hat...

Die Aus­gangs­si­tua­ti­on

Ein Gesangs­leh­rer wird stän­dig vor die Auf­ga­be gestellt Gesangs­stim­men zu beur­tei­len. Nicht nur Fra­gen wie: "Kann ich ein Opern­sän­ger wer­den?", "Wer­de ich eine Auf­nah­me­prü­fung an einer Musik­hoch­schu­le schaf­fen?", "Wie gut ist mei­ne Stim­me?" ver­lan­gen immer wie­der die Fähig­keit eine Stim­me beur­tei­len zu kön­nen, son­dern auch im all­täg­li­chen Unter­richt müs­sen stän­dig Gesangs­tö­ne beur­teilt bzw. ana­ly­siert wer­den, um dann eine tech­ni­sche Ver­bes­se­rung oder Ver­voll­komm­nung auf den Weg zu brin­gen. D. h. die Fähig­keit zu einer mög­lichst dif­fe­ren­zier­ten Beur­tei­lung wird immer wie­der auf die Pro­be gestellt. Im Lau­fe der Berufs­jah­re wächst die Fähig­keit zur Beur­tei­lung durch Erfah­run­gen, die man im sän­ge­ri­schen und päd­ago­gi­schen Bereich macht. Die­se "per­sön­li­chen Erfah­run­gen" kön­nen aber nicht allei­ne die Grund­la­ge für eine objek­ti­ve Stimm­be­ur­tei­lung sein, denn für eine objek­ti­ve Beur­tei­lung benö­tigt man objek­ti­ve Kri­te­ri­en. Manch­mal muss man sich sogar von per­sön­li­chen Erfah­run­gen regel­recht frei machen, um die (stimm­li­che) Situa­ti­on eines Schü­lers vor­ur­teils­frei und mög­lichst objek­tiv beur­tei­len zu kön­nen. Für mich ist das Bedürf­nis nach objek­ti­ven Kri­te­ri­en im Lau­fe der Berufs­jah­re immer grö­ßer gewor­den, letzt­lich auch des­halb, weil eine dif­fe­ren­zier­te­re Wahr­neh­mung der Stim­men immer wei­ter­füh­ren­de­re Fra­gen stel­len lässt und ande­rer­seits (das geht zumin­dest mir so) das Bewusst­sein, wie schwie­rig doch eine gute Beur­tei­lung ist und wie groß oft die Ver­ant­wor­tung ist, die man mit der aus der Beur­tei­lung fol­gen­den Bera­tung über­nimmt, immer aus­ge­präg­ter wird. Von dem Bedürf­nis nach Ver­meh­rung der objek­ti­ven Kri­te­ri­en zur Beur­tei­lung von Gesangs­stim­men ange­trie­ben besuch­te ich eine Ver­an­stal­tung, von der ich hier berich­ten will. Um es Lese­rIn­nen mit unter­schied­li­chen Vor­aus­set­zun­gen im stimm­wis­sen­schaft­li­chen Bereich zu ermög­li­chen den Bericht zu lesen und so an einer Begeg­nung teil­zu­ha­ben, die für mich den Ein­tritt in eine neue Dimen­si­on in der Beschäf­ti­gung mit der Gesangs­stim­me bedeu­te­te, wer­de ich zunächst kurz dar­stel­len, was ich in dem Bericht an stimm­wis­sen­schaft­li­chen Grund­la­gen vor­aus­set­zen wer­de. Der Wis­sen­de möge die­se Zei­len "über­flie­gen".

Grund­la­gen

Ein Ton im musi­ka­li­schen Sin­ne ist phy­si­ka­lisch gese­hen ein Klang, d. h. es schwin­gen ein Grund­ton und diver­se Ober­tö­ne. Ein "Ton" wäre genau eine Sinus­schwin­gung, genau eine Ton­hö­he und sonst nichts, kei­ne Far­ben, kein Vibra­to, kein Cha­rak­ter. So etwas kommt glück­li­cher­wei­se sowohl in der Musik als auch in der Natur so gut wie nie vor. Ein musi­ka­li­scher Ton, also ein Klang, dem wir eine Ton­hö­he zuord­nen, besteht aus einem Grund­ton und sei­nen Ober­tö­nen. Die­se schwin­gen mit Fre­quen­zen, die ganz­zah­li­ge Viel­fa­che der Fre­quenz des Grund­tons sind — die­se Ober­tö­ne nennt man auch "Har­mo­ni­sche". Singt ein Tenor ein hohes a, dann ist der Grund­ton H1 = 440 Hz, H2 = 880 Hz, H3 = 1320 Hz, H4 = 4440 Hz usw.; wobei gilt: H1 = ers­te Har­mo­ni­sche, H2 = zwei­te Har­mo­ni­sche usw. (Hz = Hertz, Ein­heit, mit der die Fre­quenz gemes­sen wird: Anzahl der Schwin­gun­gen pro Sekunde).

Wie stark nun bestimm­te Ober­tö­ne her­vor­tre­ten, ist für den Cha­rak­ter eines Klangs ganz ent­schei­dend. Die Ober­ton­be­rei­che, die einen bestimm­te Klang cha­rak­te­ri­sie­ren, nennt man For­man­ten. Die zwei tiefs­ten For­man­ten (Reso­nan­zen des Ansatz­rohrs) nennt man auch Vokal­for­man­ten, sie bestim­men den Vokal, den wir hören.

Bei­spiel: Um einen gesun­ge­nen Ton als Vokal "a" zu erken­nen, müs­sen bestimm­te Fre­quenz­be­rei­che eine gewis­se Domi­nanz haben. Der ers­te "For­mant" für den Vokal "a" liegt je nach Geschlecht und Stimm­la­ge etwa zwi­schen 600 Hz und 700 Hz und der zwei­te etwa zwi­schen 1000 Hz und 1200 Hz.

Ein wei­te­res Bei­spiel für einen wich­ti­gen Fre­quenz­be­reich ist der so genann­te "Sän­ger­for­mant". Durch vie­le Mes­sun­gen hat man her­aus­ge­fun­den, dass die Fre­quen­zen um 3 kHz (3000 Hz) eine ent­schei­den­de Rol­le für die Trag­fä­hig­keit einer Stim­me spie­len. Des­halb nennt man die­sen Fre­quenz­be­reich um 3 kHz "Sän­ger­for­mant". Das heißt, der Sän­ger­for­mant ist gut aus­ge­prägt, wenn in einem gesun­ge­nen Ton die Fre­quen­zen in einem brei­ten Band um 3 kHz (unab­hän­gig vom Grund­ton) eine "rela­ti­ve Stär­ke" haben.

Zur Ton­pro­duk­ti­on: An den Stimm­lip­pen ent­steht der so genann­te Pri­mär­ton. Im Ansatz­rohr (Rachen, Mund- und Nasen­raum) wer­den bestimm­te Fre­quen­zen her­aus­ge­fil­tert und ver­stärkt. Wel­che Har­mo­ni­schen nun im Ansatz­rohr in wel­chem Maß (mit wel­cher Inten­si­tät) ver­stärkt wer­den, ist für den ent­ste­hen­den Gesangs­ton von ent­schei­den­der Bedeutung.

So oder ähn­lich hat das fast jeder Gesangs­leh­rer schon ein­mal gele­sen — sehr tro­cken, sehr theo­re­tisch. Voce­Vis­ta, das Com­pu­ter­pro­gramm, über das ich hier berich­ten wer­de, ver­setzt uns in die Lage, vie­les von die­sen Din­gen mit unse­ren Augen an einem Bild­schirm beob­ach­ten zu kön­nen. Dar­über hin­aus kön­nen wir noch viel kom­ple­xe­re Vor­gän­ge wie etwa die Reso­nanz­stra­te­gie eines Tenors in der Höhe nicht nur hörend, son­dern auch sehend ver­glei­chen. Dazu müs­sen wir uns aber zunächst auf den Com­pu­ter und mit ihm auf das Com­pu­ter­pro­gramm Voce­Vis­ta einlassen.

Die ers­te Begeg­nung mit VoceVista

Alle zwei Jah­re ver­an­stal­tet die Aka­de­mie für gespro­che­nes Wort an der Stutt­gar­ter Musik­hoch­schu­le die "Inter­na­tio­na­len Stutt­gar­ter Stimm­ta­ge". Im Okto­ber 1998 besuch­te ich die­se Stimm­ta­ge und war einer der weni­gen Zuhö­rer in einem Vor­trag "Feed­back akus­ti­scher Daten im Gesangs­un­ter­richt". Ein ame­ri­ka­ni­scher Sän­ger (Donald G. Mil­ler) und ein Pro­fes­sor für Pho­nia­trie von der medi­zi­ni­schen Fakul­tät der Uni­ver­si­tät Gro­nin­gen (Harm K. Schutte) stell­ten den Zuhö­rern ihr Com­pu­ter­pro­gramm Voce­Vis­ta vor. Der Sän­ger (Bass-Bari­ton) sang in das Mikro­fon, das an den PC ange­schlos­sen war, und auf dem Bild­schirm sah man eine Kur­ve "wackeln"; der Sän­ger drück­te eine Tas­te, wor­auf die Kur­ve erstarr­te. Nun erklär­ten die bei­den, was man mit Hil­fe des Pro­gramms auf dem Bild­schirm alles sehen konnte.

Mei­ne stimm­wis­sen­schaft­li­che Vor­bil­dung war zu die­sem Zeit­punkt für einen Gesangs­päd­ago­gen nicht mehr als durch­schnitt­lich, also ver­stand ich vie­les, was hier gesagt wur­de, nicht auf Anhieb — aber es wur­de sofort sehr deut­lich, dass es hier um ein abso­lut objek­ti­ves Feed­back zu den gesun­ge­nen Tönen geht und dass man (wenn man über ein gewis­ses Ver­ständ­nis ver­fügt) aus die­ser "Rück­mel­dung" auch Kon­se­quen­zen zie­hen oder zumin­dest ein dif­fe­ren­zier­te­res Bild über die jewei­li­ge Stim­me erstel­len kann. Da ich sehr dar­an inter­es­siert bin, eine mög­lichst brei­te Basis objek­ti­ver Erkennt­nis­se zur Grund­la­ge mei­nes Unter­richts zu machen, war ich trotz man­cher Ver­ständ­nis­schwie­rig­kei­ten sehr begeis­tert und ver­such­te so gut als mög­lich zu folgen.

Es stell­te sich schnell her­aus, dass unter den weni­gen Zuhö­rern eini­ge Spe­zia­lis­ten waren (u. a. Eugen Rabi­ne), die sehr genau wuss­ten, wel­che Rol­le die Sän­ger­for­man­ten spie­len, wie man eine "real-time spec­tral ana­ly­sis" deu­ten kann oder was der "clo­sed quo­ti­ent" bedeu­tet, den man mit dem Elec­tro­glot­to­graf mes­sen kann. Ich staun­te über die Prä­zi­si­on der ent­ste­hen­den Dis­kus­si­on. Der sym­pa­thi­sche Sän­ger sang immer wie­der in das Mikro­fon, meist in der Über­gangs­la­ge und in der Höhe, hielt dann die Kur­ve auf dem Bild­schirm mit einem Tas­ten­druck fest und erklär­te bei­spiels­wei­se, was einen gedeck­ten (geschlos­se­nen) Ton ober­halb des Pas­sagio-Bereichs (etwa e1)1 von einem unge­deck­ten (offe­nen) Ton unter­schei­det. Der HNO-Pro­fes­sor unter­mau­er­te die Erklä­run­gen mit wis­sen­schaft­li­cher Prä­zi­si­on und ich ahn­te — nein, ich war mir ganz sicher: Hier sind Ant­wor­ten auf vie­le Fra­gen, mit denen ich mich schon lan­ge beschäf­ti­ge, und hier eröff­net sich eine neue Dimen­si­on, was die Mög­lich­keit der objek­ti­ven Beur­tei­lung einer Stim­me anbe­langt. Am Ende die­ser Ver­an­stal­tung hat­te ich also kurz zusam­men­ge­fasst Fol­gen­des gelernt:

Voce­Vis­ta ist ein PC-Pro­gramm, das zwei Signa­le am Bild­schirm dar­stel­len kann: ers­tens eine "real-time spec­tral analysis"2 von dem in das Mikro­fon ein­ge­sun­ge­nen oder in den Line-in-Ein­gang der Sound­kar­te ein­ge­spiel­ten Ton, zwei­tens eine Dar­stel­lung des mit dem Electroglottografen3 (EGG) gemes­se­nen Stimm­lip­pen­kon­takts. Da ich selbst kein EGG besit­ze, also auch kei­ne eige­nen Erfah­run­gen damit machen konn­te, wer­de ich in die­sem Bericht aus­führ­lich nur auf die Mög­lich­kei­ten der Spek­tral­ana­ly­se in Echt­zeit ein­ge­hen. Der Voll­stän­dig­keit hal­ber sei aber erwähnt, dass die Mes­sung mit dem EGG ein seriö­ses, wis­sen­schaft­lich abge­si­cher­tes Ver­fah­ren ist, das ins­be­son­de­re, wenn man die Mess­ergeb­nis­se zusam­men mit der Spek­tral­ana­ly­se aus­wer­tet, eine sehr fun­dier­te Aus­sa­ge über die Stimm­ge­bung ermög­licht. Beschränkt man sich auf die Mög­lich­kei­ten der Aus­wer­tung der Spek­tral­ana­ly­se in Echt­zeit, hat man eine Aus­sa­ge über "Reso­nanz­stra­te­gie" in Abhän­gig­keit der ver­schie­de­nen For­men des Ansatz­rohrs. Die ver­schie­de­nen Funk­ti­ons­wei­sen der Stimm­lip­pen blei­ben dabei außen vor.

Zurück nach Stutt­gart: Nach der erwähn­ten Ver­an­stal­tung hat­te ich von der Spek­tral­ana­ly­se in Echt­zeit etwa Fol­gen­des ver­stan­den: Die Spek­tral­ana­ly­se in Echt­zeit zeigt den Ton, den wir in die­sem Moment hören, und zwar auf­ge­schlüs­selt in Grund­ton und die fol­gen­den Ober­tö­ne (Grund­ton = H1, Ober­tö­ne H2, H3 usw.). Die ent­ste­hen­de Kur­ve wird in einem Ach­sen­kreuz gezeigt, in dem ent­lang der x‑Achse die Fre­quen­zen in Hz gemes­sen wer­den und ent­lang der y‑Achse die Inten­si­tät in dB (sie­he Abb. 1).

Wir sehen also den Grund­ton (H1) und sei­ne Ober­tö­ne H2, H3, H4 usw. Ganz ent­schei­dend ist nun, wel­che Ober­tö­ne rela­tiv zu den ande­ren gese­hen stär­ker her­vor­tre­ten und wel­che schwä­cher — anders for­mu­liert: wel­che Ober­ton­be­rei­che domi­nie­ren. Das heißt, ich kann z. B. die Sän­ger­for­man­ten sehen; sind die Ober­tö­ne im Bereich um 3 kHz stär­ker aus­ge­prägt oder eher schwach? Sind sie stär­ker aus­ge­bil­det, dann sind die so genann­ten Sän­ger­for­man­ten auch gut aus­ge­prägt; sind im Bereich von 3 kHz nur schwa­che Aus­schlä­ge, dann sind die Sän­ger­for­man­ten eben schwä­cher ausgeprägt.

Mit die­sem Grund­ver­ständ­nis im Kopf, einem Mikro­fon vor dem Mund und einer sich bewe­gen­den Kur­ve vor den Augen begriff ich: Hier ent­steht eine völ­lig neue Dimen­si­on von Rück­mel­dung und in Fol­ge des­sen auch eine völ­lig neue Dimen­si­on des Nach­ma­chens: Ich sin­ge eine Kurve…

Natür­lich waren zu die­sem Zeit­punkt für mich noch sehr vie­le Fra­gen offen: Wie ist der genaue Zusam­men­hang zwi­schen For­man­ten und der Inten­si­tät der Ober­tö­ne? Wie geschieht die Ver­stär­kung bestimm­ter Ober­tö­ne im Ansatz­rohr genau? Gibt es neben den kon­kre­ten akus­ti­schen Erkennt­nis­sen auch Erkennt­nis­se, was die prak­ti­sche Umset­zung, also die bewuss­te Beein­flus­sung die­ser Vor­gän­ge angeht? Und wie kann ich nun einen "offe­nen" Ton von einem "gedeck­ten" mit den hier sehr prä­zi­se gefass­ten Begriff­lich­kei­ten unter­schei­den? Die bei­den Refe­ren­ten for­mu­lier­ten zu die­sem The­ma einen Satz, der etwa lau­te­te: Offe­nes Sin­gen in der Höhe heißt, dass der ers­te For­mant dem natür­li­chen Drang nach­gibt, der zwei­ten Har­mo­ni­schen zu fol­gen. Ich war sehr fas­zi­niert, denn es war die Ant­wort auf eine Fra­ge, die ich mir schon lan­ge Zeit immer wie­der stellte.

Eine auf­schluss­rei­che Reise

Nach­dem ich nun wuss­te, dass es mög­lich war, mit Hil­fe eines PC-Pro­gramms vie­le Vor­gän­ge beim Sin­gen sicht­bar und damit auch ver­ständ­li­cher zu machen, ließ mich die­ses The­ma nicht mehr los. So las ich bei ver­schie­de­nen Autoren noch ein­mal die Grund­la­gen über akus­ti­sche Daten und kauf­te mir schließ­lich das Buch Voice-Tra­di­ti­on and Tech­no­lo­gy von Garyth Nair. Die­ses Buch ent­hält zwei Kapi­tel von Harm K. Schutte und Donald G. Mil­ler, in denen sie die Arbeit mit Voce­Vis­ta beschrei­ben. Außer­dem ent­hält es eine CD-ROM, mit der man am PC Klang­bei­spie­le anhö­ren und mit der Echt­zeit­spek­tral­ana­ly­se ana­ly­sie­ren kann; d. h. man hört einen gesun­ge­nen Ton, sieht die zuge­hö­ri­ge Kur­ve am Bild­schirm, kann sie zu einem belie­bi­gen Zeit­punkt durch einen Tas­ten­druck stop­pen und kann nun mit Hil­fe des Buchs den Ton nach akus­ti­schen Kri­te­ri­en ana­ly­sie­ren. Die Leich­tig­keit, mit der man die­se Bei­spie­le auf einem "ganz nor­ma­len PC"4 abspie­len konn­te, über­zeug­te mich sehr. Also teil­te ich Donald Mil­ler per e‑mail mit (fast ein Jahr nach den Stutt­gar­ter Stimm­ta­gen), dass ich das Pro­gramm Voce­Vis­ta kau­fen wol­le, um mich in das Aben­teu­er com­pu­ter­ge­stütz­ter Stimm­ana­ly­se zu stür­zen. Ich bezahl­te 300 Dol­lar und bekam das Pro­gramm per e‑mail geschickt. Es war sehr ein­fach zu instal­lie­ren und brauch­te sehr wenig Spei­cher­platz. Das Mikro­fon wur­de in die Sound­kar­te ein­ge­steckt und nun konn­te es los­ge­hen. Ich spür­te sehr schnell, dass man in das Mikro­fon sin­gend, den Bild­schirm beob­ach­tend intui­tiv auf das opti­sche Vor­bild reagiert. Es kann in einem gewis­sen Rah­men gelin­gen, eine "Wunsch­kur­ve" nach­zu­sin­gen. Aber wie sieht nun die idea­le Wunsch­kur­ve aus? Es ent­stan­den sehr schnell immer mehr Fra­gen — auch gab es in dem Pro­gramm ein paar Ein­stel­lungs­mög­lich­kei­ten, mit denen ich nichts anfan­gen konn­te. Donald Mil­ler teil­te mir mit, dass es ihm wich­tig wäre, dass die Anwen­de­rIn­nen von Voce­Vis­ta auch erfolg­reich mit die­sem Pro­gramm arbei­ten könn­ten, und lud mich nach Gro­nin­gen ein, um in einem "Kom­pakt­se­mi­nar" die Grund­la­gen der com­pu­ter­ge­steu­er­ten Stimm­ana­ly­se mit Voce­Vis­ta zu erar­bei­ten. Also pack­te ich mei­nen PC ein und fuhr für drei Tage nach Gro­nin­gen. Dort ange­kom­men staun­te ich zunächst über die bei­den Räu­me der Uni­ver­si­tät, die das Stimm­la­bor beher­berg­ten: ein krea­ti­ves Cha­os — so stel­le ich mir die Gara­ge vor, in der Bill Gates ange­fan­gen haben soll. Aller­dings ver­fügt er sicher nicht über eine sol­che Biblio­thek: In einem rie­si­gen Regal stand wohl alles, was über Gesang je geschrie­ben wur­de. Für wei­te­res Stau­nen blieb lei­der kei­ne Zeit mehr. Wir wen­de­ten uns der Arbeit zu. Es erwar­te­te mich Sup­port vom Feinsten.

Die Ein­stel­lungs­mög­lich­kei­ten des Programms

Wir gin­gen zunächst die Ein­stel­lungs­mög­lich­kei­ten des Pro­gramms Voce­Vis­ta durch; die wich­tigs­ten will ich hier erklä­ren. Durch einen Maus­klick auf "Ana­ly­sis" oder drü­cken der Tas­te "a" erscheint am Bild­schirm die "Ana­ly­sis-Box". Hier kann man u. a. fol­gen­de Ein­stel­lun­gen vornehmen:

Maß­stab für die Fre­quenz­ach­se: Wahl­wei­se kann die Dar­stel­lung bis 3 kHz,

5 kHz oder 10 kHz gehen. In Abb. 1 sehen wir die Ein­stel­lung bis 5 kHz.

Den Bild­schirm tei­len: Der Bild­schirm kann in zwei Hälf­ten geteilt wer­den (sie­he Abb. 2–6). Durch einen Tas­ten­druck kann man die Kur­ve, die man in der obe­ren Bild­schirm­hälf­te gera­de "fest­ge­hal­ten" hat, in die unte­re Hälf­te spei­chern und dann in der obe­ren Hälf­te wei­ter neue Töne anschau­en. Dies ist die idea­le Ein­stel­lung, um Töne mit­ein­an­der zu ver­glei­chen (sie­he Abb. 3, 4 und 6) oder um eine "Ide­al­kur­ve" nachzusingen.

Die Geschwin­dig­keit des Kur­ven­auf­baus: Es gibt die Mög­lich­keit ein­zu­stel­len, wie schnell sich die Kur­ve auf­baut (ein Vor­gang, den man nicht unbe­dingt ganz genau ver­ste­hen muss). Wählt man für "Spec­trum Average" einen klei­nen Wert, dann baut sich die Kur­ve sehr schnell auf, bei einem grö­ße­ren Wert baut sie sich lang­sa­mer auf. Will man bei­spiels­wei­se aus einer Auf­nah­me einen rela­tiv kur­zen Ton anhal­ten, so soll­te man hier einen klei­nen Wert ein­set­zen. Grund­sätz­lich emp­fiehlt es sich, die Grund­ein­stel­lung beizubehalten.

Das Audio­fens­ter: Wie schon erwähnt gibt es in Voce­Vis­ta die Mög­lich­keit, den clo­sed quo­ti­ent dar­zu­stel­len. Wählt man bei "Dis­play" die Ein­stel­lung "Glot­to­gram", dann zeigt der Bild­schirm nur die Kur­ve, die das EGG misst. Wählt man die Ein­stel­lung "Audio/Glottogram" zeigt der Bild­schirm in der obe­ren Hälf­te das Audio­fens­ter und in der unte­ren das Glot­to­gram (sie­he Abb. 2). Das Audio­fens­ter zeigt den gesun­ge­nen Ton über einen wähl­ba­ren Zeit­raum. Die x‑Achse gibt die Zeit in Mil­li­se­kun­den an, die y‑Achse (wie in der Echt­zeit­ana­ly­se) die Inten­si­tät in Dezi­bel. Die­ses Fens­ter zeigt also den gesam­ten Klang über einen kur­zen Zeit­ab­schnitt (wähl­bar zwi­schen 5 msec. und 150 msec.). Man beach­te den Unter­schied zur Echt­zeit­ana­ly­se, in der der Klang in dem Moment dar­ge­stellt wird, in dem wir ihn hören — und zwar "auf­ge­schlüs­selt" in Grund­ton und Ober­tö­ne bis maxi­mal 10 kHz. Für mich per­sön­lich war es eine Ver­ständ­nis­hil­fe, den Grund­ton aus der Kur­ve im Audio­fens­ter zu mes­sen. Hier­zu muss man die Periode5 P der Kur­ve bestim­men, dann gilt für den Grund­ton F0 = 1/P. Man kann den Grund­ton natür­lich auch ganz ein­fach im Echt­zeit­fens­ter able­sen (sie­he Abb. 1).

Noch mehr für Spezialisten

Es gibt noch wei­te­re Ein­stel­lungs­mög­lich­kei­ten, die aller­dings ein tie­fe­res Ver­ständ­nis für die akus­ti­schen Vor­gän­ge vor­aus­set­zen und teil­wei­se auch nur im Zusam­men­hang mit der Benut­zung des EGG zur Anwen­dung kom­men. Für die hier beschrie­be­nen Anwen­dun­gen kommt man gut zurecht, wenn man die vor­ge­ge­be­nen Grund­ein­stel­lun­gen beibehält.

Nach­dem nun die grund­le­gen­den Ein­stel­lungs­mög­lich­kei­ten des Pro­gramms erklärt waren, schau­ten und hör­ten wir uns vie­le Töne im Echt­zeit­fens­ter an. Das Ver­ständ­nis für die Kur­ven wur­de von Bei­spiel zu Bei­spiel bes­ser. Es war für mich fas­zi­nie­rend, bei­spiels­wei­se den Unter­schied von Vokal "a" zu Vokal "e" zu sehen (sie­he Abb. 3). Schon oft hat­te ich das The­ma Vokal­for­man­ten im Metho­dik­un­ter­richt erklärt — es blieb immer etwas theo­re­tisch. Jetzt erkann­te ich in Voce­Vis­ta ein Instru­ment, mit dem man u. a. die­ses The­ma auf sehr leben­di­ge wei­se im wahrs­ten Sin­ne des Wor­tes anschau­lich ver­mit­teln konnte.

Oder der grund­sätz­li­che Unter­schied zwi­schen Män­ner- und Frau­en­stim­men, auch dies ein The­ma, das für den Metho­dik­un­ter­richt wich­tig ist. Es war für mich eben­so fas­zi­nie­rend zu sehen, dass die Frau­en­stim­me im Wesent­li­chen nur halb so viel Har­mo­ni­sche hat, die sie ver­stär­ken kann, wie die Män­ner­stim­me, wäh­rend sich die Mög­lich­kei­ten des Ansatz­rohrs nicht so wesent­lich von denen der Män­ner­stim­me unter­schei­den (sie­he Abb. 4).

vocal fry — die For­man­ten darstellen

Als nächs­tes erklär­te Donald Mil­ler einen Trick, mit dem er sei­ne For­man­ten bes­ser sicht­bar machen kann, als man sie aus der Fre­quenz­kur­ve (über die Inter­pre­ta­ti­on der Inten­si­tät der ver­schie­de­nen Har­mo­ni­schen) lesen kann. Er formt mit dem Ansatz­rohr bei­spiels­wei­se den Vokal "a", singt aber kei­nen Ton, son­dern macht inspi­ra­to­risch eine Art Rei­be­ge­räusch. Die­ses "Geräusch" nennt er "vocal fry". Auf dem Bild­schirm erscheint ein "kon­ti­nu­ier­li­ches Spek­trum" (sie­he Abb. 5). Die­ses Bild zeigt ziem­lich genau, wie die Fre­quen­zen des Pri­mär­tons ver­stärkt wer­den. Und das Bild des gesun­ge­nen Tons zeigt sozu­sa­gen das Ergeb­nis die­ser Ver­stär­kung. Natür­lich kann man auch ohne die­sen Trick ein­fach aus der Fre­quenz­kur­ve die For­man­ten und vie­le ande­re Phä­no­me­ne ent­de­cken, aber für das Gesamt­ver­ständ­nis war es wie­der sehr erhel­lend — und da mir die­ses Geräusch auch rela­tiv schnell gelang, mach­te ich eini­ge Expe­ri­men­te damit und hat­te dabei auch inter­es­san­te Erkennt­nis­se (s. u.).

Ana­ly­se von Aufnahmen

Ein wich­ti­ges The­ma des Kom­pakt­se­mi­nars in Gro­nin­gen war noch die Ana­ly­se von Auf­nah­men. Man kann mit Voce­Vis­ta zum einen live Ein­ge­sun­ge­nes oder über den line-in-Ein­gang bzw. über CD Ein­ge­spiel­tes direkt anse­hen, zum ande­ren aber auch auf dem­sel­ben Wege Auf­nah­men her­stel­len. Die ent­stan­de­ne Auf­nah­me wird als "vis"-Datei abge­spei­chert. Datei­en mit einem ande­ren For­mat kann Voce­Vis­ta nicht abspielen.

Wir hör­ten uns in Gro­nin­gen u. a. das hohe b aus der Arie "Celes­te Aida" aus Ver­dis Oper Aida an. Mil­ler ver­glich Dom­in­go mit Pava­rot­ti. Zunächst war für mich sehr inter­es­sant zu sehen, wie es mög­lich ist, die Töne des Sän­gers am Bild­schirm von dem Klang des Orches­ters zu unter­schei­den: Der Blick schärft sich sehr schnell, das Orches­ter ist im Bereich um 3 kHz und dar­über hin­aus nicht mehr so inten­siv. Hat man nun einen eini­ger­ma­ßen expo­nier­ten Ton, so erkennt man den Grund­ton des Sän­gers und kann dann die Har­mo­ni­schen rela­tiv leicht fin­den (es hilft natür­lich, wenn man die Ton­hö­he genau kennt, in unse­rem Bei­spiel b1 = 466 Hz). Man erkennt, dass sich die höhe­ren Har­mo­ni­schen immer deut­li­cher vom Orches­ter abhe­ben (sie­he Abb. 6). Wir sehen, dass Dom­in­gos Klang von einem domi­nan­ten H6 cha­rak­te­ri­siert wird, wäh­rend Pava­rot­ti einen domi­nan­ten H3 benutzt. Wenn man nun weiß, dass die Vokal­for­man­ten für das zu sin­gen­de "o" (sole) unge­fähr um 430 Hz bzw. 780 Hz lie­gen (für ein offe­nes "o" etwa bei 550 Hz bzw. 820 Hz), könn­te man ver­mu­ten, dass im Klang­bild des b1 (H1 = 466, H2 = 932 Hz) auch einer die­ser bei­den Har­mo­ni­schen dominiert.

Aber die Stra­te­gie der berühm­ten Tenö­re ist offen­sicht­lich eine ande­re. Pava­rot­ti benutzt sei­nen zwei­ten For­man­ten, um H3 = 1398 Hz zu ver­stär­ken, wäh­rend Dom­in­go sei­nen Sän­ger­for­man­ten benutzt, um H6 = 2796 Hz zu ver­stär­ken. Donald Mil­ler hat in Gro­nin­gen noch fest­ge­stellt, dass Caru­so bei die­sem Ton in die­ser Arie die glei­che Reso­nanz­stra­te­gie benutz­te wie Dom­in­go. Wenn man nun noch bedenkt, dass man auch dar­über Aus­sa­gen machen kann, durch wel­che phy­si­sche Ver­än­de­rung des Ansatz­rohrs man sei­ne For­man­ten ver­schie­ben kann, dann wird sehr deut­lich, wie span­nend und lehr­reich sol­che Ana­ly­sen sein können.

Ich hat­te in den zwei Tagen in Gro­nin­gen sehr viel Neu­es über "Sin­gen" gelernt, dem sym­pa­thi­schen Donald Mil­ler sei auch hier noch ein­mal gedankt. Ver­steht man die­ses "Kom­pakt­se­mi­nar", an dem neben mir noch ein an Voce­Vis­ta inter­es­sier­ter Tenor aus Ham­burg teil­nahm, als Sup­port für das Com­pu­ter­pro­gramm, dann ist das der bes­te Sup­port, den man sich den­ken kann. Da sich für mich nun immer mehr tie­fer ins Detail gehen­de Fra­gen stell­ten, die man teil­wei­se durch Expe­ri­men­tie­ren mit dem Pro­gramm beant­wor­ten kann, habe ich mir noch einen PC gekauft und die­sen so in mein Musik­zim­mer gestellt, dass er einer­seits die Atmo­sphä­re nicht ganz zer­stört (Lap­top wäre unauf­fäl­li­ger — aber wesent­lich teu­rer), ande­rer­seits aber jeder­zeit auch bei der Arbeit mit Schü­lern ein­zu­set­zen ist. Über die wesent­li­chen ers­ten Erfah­run­gen, die ich bei der Arbeit mit Voce­Vis­ta mach­te, möch­te ich im letz­ten Abschnitt berichten.

Die ers­ten eige­nen Erfahrungen

Klä­rung der Begrif­fe — Prä­zi­sie­rung der Sprache
Gesangs­leh­re­rIn­nen dis­ku­tie­ren oft sehr diver­gent. Der eine bei­spiels­wei­se redet aus metho­di­schen Grün­den nur von "Ein­re­gis­ter", die ande­re dif­fe­ren­ziert, gera­de um einen mög­lichst guten Regis­ter­aus­gleich zu errei­chen, die Regis­ter sehr genau, etwa in "Kopf‑, Mit­tel- und Brust­stim­me". Oder der eine schließt in den Begriff "Reso­nanz" Vibra­ti­ons­ge­füh­le im Brust- und Bauch­raum und allen mög­li­chen ande­ren Kör­per­par­tien mit ein, wäh­rend sich eine ande­re sehr genau an einer wis­sen­schaft­li­chen Defi­ni­ti­on des Begriffs ori­en­tiert. Oft­mals lässt sich in einer Dis­kus­si­on nicht ein­mal fest­stel­len, ob die Dis­ku­tie­ren­den nun eine ähn­li­che Ansicht zu einer Fra­ge­stel­lung tei­len oder nicht, weil jeder Begrif­fe wie "Reso­nanz" oder "Regis­ter" in einem ande­ren Sinn (mit einer ande­ren Defi­ni­ti­on) benutzt. Sehr häu­fig wird die Ebe­ne der eige­nen Wahr­neh­mung mit einer "wis­sen­schaft­lich-beschrei­ben­den" ver­mischt. Dies macht eine dif­fe­ren­zier­te Dis­kus­si­on sehr schwie­rig. Die Beschäf­ti­gung mit Voce­Vis­ta erzwingt nun gewis­ser­ma­ßen eine Objek­ti­vie­rung der Begrif­fe und eine Prä­zi­sie­rung der Spra­che. Dies ist ein Effekt der Arbeit mit Voce­Vis­ta, den ich für sehr wert­voll hal­te. Auf den ers­ten Blick wird die­ser Aspekt leicht unter­schätzt, aber ist die Kom­mu­ni­ka­ti­ons­fä­hig­keit nicht eine der wich­tigs­ten Fähig­kei­ten für einen Gesangs­leh­rer? Und zur Ver­bes­se­rung der Kom­mu­ni­ka­ti­ons­fä­hig­keit kann die Prä­zi­sie­rung der Spra­che einen wesent­li­chen Bei­trag leisten.

Das eige­ne Ansatz­rohr erforschen
Ver­sucht man nun immer wie­der vocal fry und dann den auf einer bestimm­ten Ton­hö­he gesun­ge­nen zuge­hö­ri­gen Vokal zu ver­glei­chen, fängt man an, sei­ne Stim­me auf eine neue Art und Wei­se zu ent­de­cken. Ich war sehr fas­zi­niert zu sehen, dass es bei­spiels­wei­se hilf­reich sein kann, in bestimm­ten Situa­tio­nen die Zun­ge etwas anzu­he­ben. Durch die­se Maß­nah­me wer­den die For­man­ten ein wenig ver­scho­ben. Die­se "Ver­schie­bung" der For­man­ten konn­te ich auch bei der Umset­zung der Vor­stel­lung "Stau­nen" oder gar "Gäh­nen" (also eine Wei­tung des Ansatz­rohrs, im Wesent­li­chen cha­rak­te­ri­siert durch Anhe­ben des wei­chen Gau­mens und Absen­ken des Kehl­kopfs) beob­ach­ten. Auf der Basis sol­cher Beob­ach­tun­gen kann man nun indi­vi­du­el­le Reso­nanz­stra­te­gien gewis­ser­ma­ßen neu ver­ste­hen. Ich sehe Vor­gän­ge und ver­ste­he nun, war­um mich bis­her eine sän­ge­ri­sche Intui­ti­on zu bestimm­ten Ein­stel­lun­gen führ­te. So kann ich z. B. den Vor­gang des "Abde­ckens" in eine ande­re Spra­che übersetzen,6 weil ich ihn in einem neu­en Zusam­men­hang begrei­fe. Das heißt, ich kann auch die Intui­ti­on von ande­ren Sän­gern bes­ser ver­ste­hen und als Gesangs­leh­rer u. U. sehr dif­fe­ren­ziert in die­sen Pro­zess ein­grei­fen. Der gelern­te Sän­ger wird in der Regel fest­stel­len, dass die so gewon­ne­ne Ein­sicht zur glei­chen Bemü­hung führt, die er schon vor­her über Hören und Spü­ren ver­folg­te — aber jetzt kann er sehen, war­um er es tut. Und in der einen oder ande­ren Situa­ti­on lässt sich viel­leicht doch etwas durch die­sen tie­fe­ren Ein­blick verbessern.

Eine neue Dimen­si­on des Nachmachens
Das intui­ti­ve Nach­sin­gen eines gese­he­nen Tons bedeu­tet für mich tat­säch­lich den Ein­tritt in eine neue Dimen­si­on des Stimm­trai­nings. Sehr wich­tig ist, dass wir unter­schei­den zwi­schen dem oben beschrie­be­nen "Erfor­schen" des Ansatz­rohrs (das ist ein sehr ana­ly­ti­scher Vor­gang) und dem intui­ti­ven Nach­sin­gen. Die Erkennt­nis­se aus der Erfor­schung des Ansatz­rohrs wer­den auf einem sehr kogni­ti­ven Weg gefun­den, das intui­ti­ve Nach­sin­gen einer Kur­ve hin­ge­gen erfor­dert nicht die­se kogni­ti­ven Fähig­kei­ten. Es bin­det die sän­ge­ri­schen Sin­ne auf eine neue Art und Wei­se. Ich höre einen gesun­ge­nen Ton von einem nach­ah­mens­wer­ten Sän­ger mei­nes Stimm­fachs ein­mal und dann sehe ich die Kur­ve — ich höre sie nicht immer wie­der, ich sehe sie per­ma­nent, kon­zen­trie­re mich auf tie­fen Atem und die­ses Bild (die­ser Vor­gang lenkt von den Orga­nen ab, die sich jetzt opti­mal auf­ein­an­der abstim­men sol­len) und ver­su­che eine Kur­ve zu sin­gen, die in den wesent­li­chen Eigen­schaf­ten mit denen des Bilds übereinstimmt.7 Das Phä­no­me­na­le an die­ser Art des Nach­ma­chens ist, dass sich der Sän­ger dar­auf beschränkt, ein paar wesent­li­che akus­ti­sche Merk­ma­le eines Klangs nach­zu­emp­fin­den, und nicht der Gefahr aus­ge­setzt ist, einen Gesamt­klang nach­zu­ma­chen, der u. U. mit sei­ner Stim­me auf phy­sio­lo­gisch gesun­de Art und Wei­se gar nicht her­zu­stel­len ist. Für mich per­sön­lich war es fas­zi­nie­rend fest­zu­stel­len, wie die Fähig­keit wächst eine Kur­ve nach­zu­sin­gen. Es ent­steht eine neue Sen­si­bi­li­tät, denn die Anfor­de­run­gen sind von einer ande­ren Qua­li­tät, als wenn man einen Klang nach­singt oder, was bes­ser ist, bestimm­te Eigen­schaf­ten eines Klangs nach­zu­ma­chen versucht.

Für den Unter­richt sehe ich hier ein brei­tes Feld der Anwen­dungs­mög­lich­kei­ten. Ins­be­son­de­re weil der Schü­ler oder die Schü­le­rin nicht mit dem gan­zen theo­re­ti­schen Hin­ter­grund, den der Leh­rer natür­lich im Blick haben soll­te, kon­fron­tiert wer­den muss. Bei­spiel: Die Schü­le­rin soll sich (mit den Augen) auf ihre Sän­ger­for­man­ten kon­zen­trie­ren und dann auf einem Ton alle Voka­le sin­gen. Das Ziel dabei ist, die Inten­si­tät des Sän­ger­for­man­ten mög­lichst hoch zu hal­ten. Fällt nun bei einem Vokal die Inten­si­tät deut­lich ab, dann sieht die Schü­le­rin sofort, wie die Kur­ve ent­spre­chend ein­fällt. Dazu muss nicht die Gesamt­heit des kom­ple­xen Hin­ter­grunds erklärt werden,8 die Schü­le­rin bleibt auf dem Pfad zur Her­an­bil­dung einer sän­ge­ri­schen Intui­ti­on. Mei­ne ers­ten Erfah­run­gen in die­sem Zusam­men­hang zei­gen, dass die Schü­le­rIn­nen sehr neu­gie­rig und offen auf die Kon­fron­ta­ti­on mit ihrer eige­nen Kur­ve reagie­ren, auch wenn sie sonst kei­ne Freun­de des Com­pu­ters sind. Hier tut sich eben eine neue Dimen­si­on auf.

Kein Wun­der­mit­tel, aber die Ent­de­ckung einer neu­en Welt

Die bis­her erwähn­ten Erfah­rungs­be­rei­che oder Anwen­dungs­mög­lich­kei­ten haben eine Gemein­sam­keit: Man lernt stimm­li­che Vor­gän­ge neu zu for­mu­lie­ren, gege­be­nen­falls erar­bei­tet man sich eini­ge Begrif­fe neu, man erkennt neue Zusam­men­hän­ge, man schärft das ana­ly­ti­sche Ohr. Das heißt, durch die Nut­zung der Mög­lich­kei­ten des Pro­gramms lernt man vie­les qua­si neben­her. Lässt man sich durch den Umgang mit der not­wen­di­gen Tech­nik nicht abschre­cken, so kann man die­se wert­vol­len Erkennt­nis­se auf durch­aus spie­le­ri­sche Art und Wei­se gewinnen.

Voce­Vis­ta ist kein Pro­gramm für "jeder­mann", es ist ein Pro­gramm für Fach­leu­te, denn es ist zwar leicht zu bedie­nen, aber man muss wis­sen, was man tut, wenn man zu qua­li­fi­zier­ten Aus­sa­gen kom­men will. Das for­dert die Aus­ein­an­der­set­zung mit den Fach­be­grif­fen und davon pro­fi­tiert nach mei­ner Mei­nung die gesam­te Gesangspädagogik.

Der PC hält Ein­zug in vie­le Berei­che unse­res Lebens, in Kin­der­zim­mern und Wohn­zim­mern kann er auch schnell zur Last wer­den und mehr Pro­ble­me schaf­fen, als er löst. Im Gesangs­zim­mer kann er einen Weg in eine neue Welt eröff­nen, nicht um die "alte Welt" in Fra­ge zu stel­len, son­dern um sie dif­fe­ren­zier­ter zu betrachten.

1 Die Ton­hö­hen­an­ga­ben in die­sem Bericht bezie­hen sich auf das in Deutsch­land übli­che Sys­tem a = 220 Hz, a1 = 440 Hz usw.
2 aus der eng­li­schen Fach­li­te­ra­tur; ins Deut­sche über­tra­gen: "Spek­tral­ana­ly­se in Echtzeit".
3 Das EGG ist ein klei­nes Gerät bestehend aus zwei Kon­tak­ten, die an den Kehl­kopf ange­legt wer­den. So kann der Kon­takt der Stimm­lip­pen pro Zeit gemes­sen wer­den. Es ent­steht eine Kur­ve, die eine sehr wich­ti­ge Aus­sa­ge über die Art der Stimm­ge­bung macht. Eine noch dif­fe­ren­zier­te­re Aus­sa­ge über die Stimm­ge­bung kann man eben dann machen, wenn man die Dar­stel­lung des Stimm­lip­pen­kon­takts und den dar­aus abge­le­se­nen "clo­sed quo­ti­ent" ("Schließ­quo­ti­ent") zusam­men mit dem akus­ti­schen Signal inter­pre­tiert. Die Aus­füh­rung die­ser Mög­lich­kei­ten wür­de hier zu weit führen.
4 Ich benut­ze einen Pen­ti­um I (166 MHz, MMX), 64 RAM, Win98 als Betriebssystem.
5 Die Peri­ode P ist die (Zeit)Länge einer Schwin­gung. Für die Grund­fre­quenz F0 der Schwin­gung gilt also F0 = 1/P, sie gibt dann an, wie viel Schwin­gun­gen pro Sekun­de aus­ge­führt wer­den. Zur Mes­sung mit der Maus: Man kann mit der Maus im Audio­fens­ter jedes belie­bi­ge Zeit­in­ter­vall mes­sen. Am gewünsch­ten Anfangs­punkt drückt man die lin­ke Maus­tas­te, dann zieht man die Maus bis zum gewünsch­ten End­punkt und lässt sie los. Der Com­pu­ter gibt dann das so gemes­se­ne Inter­vall in msec an. Wählt man nun Anfangs- und End­punkt so, dass die bei­den Punk­te die Peri­ode der Kur­ve bestim­men, dann erhält man als (Zeit)Intervall genau die (Zeit)Länge der Periode.
6 vgl. oben: "offe­nes Sin­gen in der Höhe heißt, dass der ers­te For­mant dem natür­li­chen Drang nach­gibt der zwei­ten Har­mo­ni­schen zu fol­gen". Man beach­te, dass dies so nur für Män­ner­stim­men gilt.
7 In der Unter­richts­si­tua­ti­on soll­te man dar­auf ach­ten, dass man den Bild­schirm höher auf­stellt als übli­cher­wei­se, so dass man in einer ganz natür­li­chen Hal­tung sin­gen kann.
8 Für man­che Schü­le­rin und man­chen Schü­ler kann natür­lich gera­de eine wis­sen­schaft­lich ori­en­tier­te prä­zi­se Erklä­rung der Vor­gän­ge moti­vie­rend sein.

Lite­ra­tur
Donald Gray Mil­ler: Regis­ters In Sin­ging, Roden 2000, zu bezie­hen über: Gro­nin­gen Voice Rese­arch Lab, Depart­ment of Bio­me­di­cal Engi­nee­ring, P. O. Box 196, NL-9700 AD Groningen
Garyth Nair: Voice-Tra­di­ti­on and Tech­no­lo­gy, San Die­go 1999, Sin­gu­lar Publi­shing Group, Inc.

Voce­Vis­ta, wei­te­re Infos: www.vocevista.com

Kon­takt
Mat­thi­as Mül­ler,  www.stimmkultur.de