Müller, Matthias

VoceVista. Endlich sehen, was ich schon immer hören wollte

Ein Bericht über computergesteuerte Stimmanalyse im Gesangsunterricht

Rubrik: Aufsatz
erschienen in: üben & musizieren 2/2001 , Seite 16

Im folgenden Bericht können Sie nachlesen, wie eine Begegnung bei den internationalen Stuttgarter Stimmtagen zu einer Reise in ein ungewöhnliches Stimmlabor an der medizinischen Fakultät der Universität Groningen führte und beides schließlich dazu beitrug, dass ein Gesangslehrer nun einen Computer neben dem Klavier stehen hat…

Die Ausgangssituation

Ein Gesangslehrer wird ständig vor die Aufgabe gestellt Gesangsstimmen zu beurteilen. Nicht nur Fragen wie: “Kann ich ein Opernsänger werden?”, “Werde ich eine Aufnahmeprüfung an einer Musikhochschule schaffen?”, “Wie gut ist meine Stimme?” verlangen immer wieder die Fähigkeit eine Stimme beurteilen zu können, sondern auch im alltäglichen Unterricht müssen ständig Gesangstöne beurteilt bzw. analysiert werden, um dann eine technische Verbesserung oder Vervollkommnung auf den Weg zu bringen. D. h. die Fähigkeit zu einer möglichst differenzierten Beurteilung wird immer wieder auf die Probe gestellt. Im Laufe der Berufsjahre wächst die Fähigkeit zur Beurteilung durch Erfahrungen, die man im sängerischen und pädagogischen Bereich macht. Diese “persönlichen Erfahrungen” können aber nicht alleine die Grundlage für eine objektive Stimmbeurteilung sein, denn für eine objektive Beurteilung benötigt man objektive Kriterien. Manchmal muss man sich sogar von persönlichen Erfahrungen regelrecht frei machen, um die (stimmliche) Situation eines Schülers vorurteilsfrei und möglichst objektiv beurteilen zu können. Für mich ist das Bedürfnis nach objektiven Kriterien im Laufe der Berufsjahre immer größer geworden, letztlich auch deshalb, weil eine differenziertere Wahrnehmung der Stimmen immer weiterführendere Fragen stellen lässt und andererseits (das geht zumindest mir so) das Bewusstsein, wie schwierig doch eine gute Beurteilung ist und wie groß oft die Verantwortung ist, die man mit der aus der Beurteilung folgenden Beratung übernimmt, immer ausgeprägter wird. Von dem Bedürfnis nach Vermehrung der objektiven Kriterien zur Beurteilung von Gesangsstimmen angetrieben besuchte ich eine Veranstaltung, von der ich hier berichten will. Um es LeserInnen mit unterschiedlichen Voraussetzungen im stimmwissenschaftlichen Bereich zu ermöglichen den Bericht zu lesen und so an einer Begegnung teilzuhaben, die für mich den Eintritt in eine neue Dimension in der Beschäftigung mit der Gesangsstimme bedeutete, werde ich zunächst kurz darstellen, was ich in dem Bericht an stimmwissenschaftlichen Grundlagen voraussetzen werde. Der Wissende möge diese Zeilen “überfliegen”.

Grundlagen

Ein Ton im musikalischen Sinne ist physikalisch gesehen ein Klang, d. h. es schwingen ein Grundton und diverse Obertöne. Ein “Ton” wäre genau eine Sinusschwingung, genau eine Tonhöhe und sonst nichts, keine Farben, kein Vibrato, kein Charakter. So etwas kommt glücklicherweise sowohl in der Musik als auch in der Natur so gut wie nie vor. Ein musikalischer Ton, also ein Klang, dem wir eine Tonhöhe zuordnen, besteht aus einem Grundton und seinen Obertönen. Diese schwingen mit Frequenzen, die ganzzahlige Vielfache der Frequenz des Grundtons sind – diese Obertöne nennt man auch “Harmonische”. Singt ein Tenor ein hohes a, dann ist der Grundton H1 = 440 Hz, H2 = 880 Hz, H3 = 1320 Hz, H4 = 4440 Hz usw.; wobei gilt: H1 = erste Harmonische, H2 = zweite Harmonische usw. (Hz = Hertz, Einheit, mit der die Frequenz gemessen wird: Anzahl der Schwingungen pro Sekunde).

Wie stark nun bestimmte Obertöne hervortreten, ist für den Charakter eines Klangs ganz entscheidend. Die Obertonbereiche, die einen bestimmte Klang charakterisieren, nennt man Formanten. Die zwei tiefsten Formanten (Resonanzen des Ansatzrohrs) nennt man auch Vokalformanten, sie bestimmen den Vokal, den wir hören.

Beispiel: Um einen gesungenen Ton als Vokal “a” zu erkennen, müssen bestimmte Frequenzbereiche eine gewisse Dominanz haben. Der erste “Formant” für den Vokal “a” liegt je nach Geschlecht und Stimmlage etwa zwischen 600 Hz und 700 Hz und der zweite etwa zwischen 1000 Hz und 1200 Hz.

Ein weiteres Beispiel für einen wichtigen Frequenzbereich ist der so genannte “Sängerformant”. Durch viele Messungen hat man herausgefunden, dass die Frequenzen um 3 kHz (3000 Hz) eine entscheidende Rolle für die Tragfähigkeit einer Stimme spielen. Deshalb nennt man diesen Frequenzbereich um 3 kHz “Sängerformant”. Das heißt, der Sängerformant ist gut ausgeprägt, wenn in einem gesungenen Ton die Frequenzen in einem breiten Band um 3 kHz (unabhängig vom Grundton) eine “relative Stärke” haben.

Zur Tonproduktion: An den Stimmlippen entsteht der so genannte Primärton. Im Ansatzrohr (Rachen, Mund- und Nasenraum) werden bestimmte Frequenzen herausgefiltert und verstärkt. Welche Harmonischen nun im Ansatzrohr in welchem Maß (mit welcher Intensität) verstärkt werden, ist für den entstehenden Gesangston von entscheidender Bedeutung.

So oder ähnlich hat das fast jeder Gesangslehrer schon einmal gelesen – sehr trocken, sehr theoretisch. VoceVista, das Computerprogramm, über das ich hier berichten werde, versetzt uns in die Lage, vieles von diesen Dingen mit unseren Augen an einem Bildschirm beobachten zu können. Darüber hinaus können wir noch viel komplexere Vorgänge wie etwa die Resonanzstrategie eines Tenors in der Höhe nicht nur hörend, sondern auch sehend vergleichen. Dazu müssen wir uns aber zunächst auf den Computer und mit ihm auf das Computerprogramm VoceVista einlassen.

Die erste Begegnung mit VoceVista

Alle zwei Jahre veranstaltet die Akademie für gesprochenes Wort an der Stuttgarter Musikhochschule die “Internationalen Stuttgarter Stimmtage”. Im Oktober 1998 besuchte ich diese Stimmtage und war einer der wenigen Zuhörer in einem Vortrag “Feedback akustischer Daten im Gesangsunterricht”. Ein amerikanischer Sänger (Donald G. Miller) und ein Professor für Phoniatrie von der medizinischen Fakultät der Universität Groningen (Harm K. Schutte) stellten den Zuhörern ihr Computerprogramm VoceVista vor. Der Sänger (Bass-Bariton) sang in das Mikrofon, das an den PC angeschlossen war, und auf dem Bildschirm sah man eine Kurve “wackeln”; der Sänger drückte eine Taste, worauf die Kurve erstarrte. Nun erklärten die beiden, was man mit Hilfe des Programms auf dem Bildschirm alles sehen konnte.

Meine stimmwissenschaftliche Vorbildung war zu diesem Zeitpunkt für einen Gesangspädagogen nicht mehr als durchschnittlich, also verstand ich vieles, was hier gesagt wurde, nicht auf Anhieb – aber es wurde sofort sehr deutlich, dass es hier um ein absolut objektives Feedback zu den gesungenen Tönen geht und dass man (wenn man über ein gewisses Verständnis verfügt) aus dieser “Rückmeldung” auch Konsequenzen ziehen oder zumindest ein differenzierteres Bild über die jeweilige Stimme erstellen kann. Da ich sehr daran interessiert bin, eine möglichst breite Basis objektiver Erkenntnisse zur Grundlage meines Unterrichts zu machen, war ich trotz mancher Verständnisschwierigkeiten sehr begeistert und versuchte so gut als möglich zu folgen.

Es stellte sich schnell heraus, dass unter den wenigen Zuhörern einige Spezialisten waren (u. a. Eugen Rabine), die sehr genau wussten, welche Rolle die Sängerformanten spielen, wie man eine “real-time spectral analysis” deuten kann oder was der “closed quotient” bedeutet, den man mit dem Electroglottograf messen kann. Ich staunte über die Präzision der entstehenden Diskussion. Der sympathische Sänger sang immer wieder in das Mikrofon, meist in der Übergangslage und in der Höhe, hielt dann die Kurve auf dem Bildschirm mit einem Tastendruck fest und erklärte beispielsweise, was einen gedeckten (geschlossenen) Ton oberhalb des Passagio-Bereichs (etwa e1)1 von einem ungedeckten (offenen) Ton unterscheidet. Der HNO-Professor untermauerte die Erklärungen mit wissenschaftlicher Präzision und ich ahnte – nein, ich war mir ganz sicher: Hier sind Antworten auf viele Fragen, mit denen ich mich schon lange beschäftige, und hier eröffnet sich eine neue Dimension, was die Möglichkeit der objektiven Beurteilung einer Stimme anbelangt. Am Ende dieser Veranstaltung hatte ich also kurz zusammengefasst Folgendes gelernt:

VoceVista ist ein PC-Programm, das zwei Signale am Bildschirm darstellen kann: erstens eine “real-time spectral analysis”2 von dem in das Mikrofon eingesungenen oder in den Line-in-Eingang der Soundkarte eingespielten Ton, zweitens eine Darstellung des mit dem Electroglottografen3 (EGG) gemessenen Stimmlippenkontakts. Da ich selbst kein EGG besitze, also auch keine eigenen Erfahrungen damit machen konnte, werde ich in diesem Bericht ausführlich nur auf die Möglichkeiten der Spektralanalyse in Echtzeit eingehen. Der Vollständigkeit halber sei aber erwähnt, dass die Messung mit dem EGG ein seriöses, wissenschaftlich abgesichertes Verfahren ist, das insbesondere, wenn man die Messergebnisse zusammen mit der Spektralanalyse auswertet, eine sehr fundierte Aussage über die Stimmgebung ermöglicht. Beschränkt man sich auf die Möglichkeiten der Auswertung der Spektralanalyse in Echtzeit, hat man eine Aussage über “Resonanzstrategie” in Abhängigkeit der verschiedenen Formen des Ansatzrohrs. Die verschiedenen Funktionsweisen der Stimmlippen bleiben dabei außen vor.

Zurück nach Stuttgart: Nach der erwähnten Veranstaltung hatte ich von der Spektralanalyse in Echtzeit etwa Folgendes verstanden: Die Spektralanalyse in Echtzeit zeigt den Ton, den wir in diesem Moment hören, und zwar aufgeschlüsselt in Grundton und die folgenden Obertöne (Grundton = H1, Obertöne H2, H3 usw.). Die entstehende Kurve wird in einem Achsenkreuz gezeigt, in dem entlang der x-Achse die Frequenzen in Hz gemessen werden und entlang der y-Achse die Intensität in dB (siehe Abb. 1).

Wir sehen also den Grundton (H1) und seine Obertöne H2, H3, H4 usw. Ganz entscheidend ist nun, welche Obertöne relativ zu den anderen gesehen stärker hervortreten und welche schwächer – anders formuliert: welche Obertonbereiche dominieren. Das heißt, ich kann z. B. die Sängerformanten sehen; sind die Obertöne im Bereich um 3 kHz stärker ausgeprägt oder eher schwach? Sind sie stärker ausgebildet, dann sind die so genannten Sängerformanten auch gut ausgeprägt; sind im Bereich von 3 kHz nur schwache Ausschläge, dann sind die Sängerformanten eben schwächer ausgeprägt.

Mit diesem Grundverständnis im Kopf, einem Mikrofon vor dem Mund und einer sich bewegenden Kurve vor den Augen begriff ich: Hier entsteht eine völlig neue Dimension von Rückmeldung und in Folge dessen auch eine völlig neue Dimension des Nachmachens: Ich singe eine Kurve…

Natürlich waren zu diesem Zeitpunkt für mich noch sehr viele Fragen offen: Wie ist der genaue Zusammenhang zwischen Formanten und der Intensität der Obertöne? Wie geschieht die Verstärkung bestimmter Obertöne im Ansatzrohr genau? Gibt es neben den konkreten akustischen Erkenntnissen auch Erkenntnisse, was die praktische Umsetzung, also die bewusste Beeinflussung dieser Vorgänge angeht? Und wie kann ich nun einen “offenen” Ton von einem “gedeckten” mit den hier sehr präzise gefassten Begrifflichkeiten unterscheiden? Die beiden Referenten formulierten zu diesem Thema einen Satz, der etwa lautete: Offenes Singen in der Höhe heißt, dass der erste Formant dem natürlichen Drang nachgibt, der zweiten Harmonischen zu folgen. Ich war sehr fasziniert, denn es war die Antwort auf eine Frage, die ich mir schon lange Zeit immer wieder stellte.

Eine aufschlussreiche Reise

Nachdem ich nun wusste, dass es möglich war, mit Hilfe eines PC-Programms viele Vorgänge beim Singen sichtbar und damit auch verständlicher zu machen, ließ mich dieses Thema nicht mehr los. So las ich bei verschiedenen Autoren noch einmal die Grundlagen über akustische Daten und kaufte mir schließlich das Buch Voice-Tradition and Technology von Garyth Nair. Dieses Buch enthält zwei Kapitel von Harm K. Schutte und Donald G. Miller, in denen sie die Arbeit mit VoceVista beschreiben. Außerdem enthält es eine CD-ROM, mit der man am PC Klangbeispiele anhören und mit der Echtzeitspektralanalyse analysieren kann; d. h. man hört einen gesungenen Ton, sieht die zugehörige Kurve am Bildschirm, kann sie zu einem beliebigen Zeitpunkt durch einen Tastendruck stoppen und kann nun mit Hilfe des Buchs den Ton nach akustischen Kriterien analysieren. Die Leichtigkeit, mit der man diese Beispiele auf einem “ganz normalen PC”4 abspielen konnte, überzeugte mich sehr. Also teilte ich Donald Miller per e-mail mit (fast ein Jahr nach den Stuttgarter Stimmtagen), dass ich das Programm VoceVista kaufen wolle, um mich in das Abenteuer computergestützter Stimmanalyse zu stürzen. Ich bezahlte 300 Dollar und bekam das Programm per e-mail geschickt. Es war sehr einfach zu installieren und brauchte sehr wenig Speicherplatz. Das Mikrofon wurde in die Soundkarte eingesteckt und nun konnte es losgehen. Ich spürte sehr schnell, dass man in das Mikrofon singend, den Bildschirm beobachtend intuitiv auf das optische Vorbild reagiert. Es kann in einem gewissen Rahmen gelingen, eine “Wunschkurve” nachzusingen. Aber wie sieht nun die ideale Wunschkurve aus? Es entstanden sehr schnell immer mehr Fragen – auch gab es in dem Programm ein paar Einstellungsmöglichkeiten, mit denen ich nichts anfangen konnte. Donald Miller teilte mir mit, dass es ihm wichtig wäre, dass die AnwenderInnen von VoceVista auch erfolgreich mit diesem Programm arbeiten könnten, und lud mich nach Groningen ein, um in einem “Kompaktseminar” die Grundlagen der computergesteuerten Stimmanalyse mit VoceVista zu erarbeiten. Also packte ich meinen PC ein und fuhr für drei Tage nach Groningen. Dort angekommen staunte ich zunächst über die beiden Räume der Universität, die das Stimmlabor beherbergten: ein kreatives Chaos – so stelle ich mir die Garage vor, in der Bill Gates angefangen haben soll. Allerdings verfügt er sicher nicht über eine solche Bibliothek: In einem riesigen Regal stand wohl alles, was über Gesang je geschrieben wurde. Für weiteres Staunen blieb leider keine Zeit mehr. Wir wendeten uns der Arbeit zu. Es erwartete mich Support vom Feinsten.

Die Einstellungsmöglichkeiten des Programms

Wir gingen zunächst die Einstellungsmöglichkeiten des Programms VoceVista durch; die wichtigsten will ich hier erklären. Durch einen Mausklick auf “Analysis” oder drücken der Taste “a” erscheint am Bildschirm die “Analysis-Box”. Hier kann man u. a. folgende Einstellungen vornehmen:

Maßstab für die Frequenzachse: Wahlweise kann die Darstellung bis 3 kHz,

5 kHz oder 10 kHz gehen. In Abb. 1 sehen wir die Einstellung bis 5 kHz.

Den Bildschirm teilen: Der Bildschirm kann in zwei Hälften geteilt werden (siehe Abb. 2-6). Durch einen Tastendruck kann man die Kurve, die man in der oberen Bildschirmhälfte gerade “festgehalten” hat, in die untere Hälfte speichern und dann in der oberen Hälfte weiter neue Töne anschauen. Dies ist die ideale Einstellung, um Töne miteinander zu vergleichen (siehe Abb. 3, 4 und 6) oder um eine “Idealkurve” nachzusingen.

Die Geschwindigkeit des Kurvenaufbaus: Es gibt die Möglichkeit einzustellen, wie schnell sich die Kurve aufbaut (ein Vorgang, den man nicht unbedingt ganz genau verstehen muss). Wählt man für “Spectrum Average” einen kleinen Wert, dann baut sich die Kurve sehr schnell auf, bei einem größeren Wert baut sie sich langsamer auf. Will man beispielsweise aus einer Aufnahme einen relativ kurzen Ton anhalten, so sollte man hier einen kleinen Wert einsetzen. Grundsätzlich empfiehlt es sich, die Grundeinstellung beizubehalten.

Das Audiofenster: Wie schon erwähnt gibt es in VoceVista die Möglichkeit, den closed quotient darzustellen. Wählt man bei “Display” die Einstellung “Glottogram”, dann zeigt der Bildschirm nur die Kurve, die das EGG misst. Wählt man die Einstellung “Audio/Glottogram” zeigt der Bildschirm in der oberen Hälfte das Audiofenster und in der unteren das Glottogram (siehe Abb. 2). Das Audiofenster zeigt den gesungenen Ton über einen wählbaren Zeitraum. Die x-Achse gibt die Zeit in Millisekunden an, die y-Achse (wie in der Echtzeitanalyse) die Intensität in Dezibel. Dieses Fenster zeigt also den gesamten Klang über einen kurzen Zeitabschnitt (wählbar zwischen 5 msec. und 150 msec.). Man beachte den Unterschied zur Echtzeitanalyse, in der der Klang in dem Moment dargestellt wird, in dem wir ihn hören – und zwar “aufgeschlüsselt” in Grundton und Obertöne bis maximal 10 kHz. Für mich persönlich war es eine Verständnishilfe, den Grundton aus der Kurve im Audiofenster zu messen. Hierzu muss man die Periode5 P der Kurve bestimmen, dann gilt für den Grundton F0 = 1/P. Man kann den Grundton natürlich auch ganz einfach im Echtzeitfenster ablesen (siehe Abb. 1).

Noch mehr für Spezialisten

Es gibt noch weitere Einstellungsmöglichkeiten, die allerdings ein tieferes Verständnis für die akustischen Vorgänge voraussetzen und teilweise auch nur im Zusammenhang mit der Benutzung des EGG zur Anwendung kommen. Für die hier beschriebenen Anwendungen kommt man gut zurecht, wenn man die vorgegebenen Grundeinstellungen beibehält.

Nachdem nun die grundlegenden Einstellungsmöglichkeiten des Programms erklärt waren, schauten und hörten wir uns viele Töne im Echtzeitfenster an. Das Verständnis für die Kurven wurde von Beispiel zu Beispiel besser. Es war für mich faszinierend, beispielsweise den Unterschied von Vokal “a” zu Vokal “e” zu sehen (siehe Abb. 3). Schon oft hatte ich das Thema Vokalformanten im Methodikunterricht erklärt – es blieb immer etwas theoretisch. Jetzt erkannte ich in VoceVista ein Instrument, mit dem man u. a. dieses Thema auf sehr lebendige weise im wahrsten Sinne des Wortes anschaulich vermitteln konnte.

Oder der grundsätzliche Unterschied zwischen Männer- und Frauenstimmen, auch dies ein Thema, das für den Methodikunterricht wichtig ist. Es war für mich ebenso faszinierend zu sehen, dass die Frauenstimme im Wesentlichen nur halb so viel Harmonische hat, die sie verstärken kann, wie die Männerstimme, während sich die Möglichkeiten des Ansatzrohrs nicht so wesentlich von denen der Männerstimme unterscheiden (siehe Abb. 4).

vocal fry – die Formanten darstellen

Als nächstes erklärte Donald Miller einen Trick, mit dem er seine Formanten besser sichtbar machen kann, als man sie aus der Frequenzkurve (über die Interpretation der Intensität der verschiedenen Harmonischen) lesen kann. Er formt mit dem Ansatzrohr beispielsweise den Vokal “a”, singt aber keinen Ton, sondern macht inspiratorisch eine Art Reibegeräusch. Dieses “Geräusch” nennt er “vocal fry”. Auf dem Bildschirm erscheint ein “kontinuierliches Spektrum” (siehe Abb. 5). Dieses Bild zeigt ziemlich genau, wie die Frequenzen des Primärtons verstärkt werden. Und das Bild des gesungenen Tons zeigt sozusagen das Ergebnis dieser Verstärkung. Natürlich kann man auch ohne diesen Trick einfach aus der Frequenzkurve die Formanten und viele andere Phänomene entdecken, aber für das Gesamtverständnis war es wieder sehr erhellend – und da mir dieses Geräusch auch relativ schnell gelang, machte ich einige Experimente damit und hatte dabei auch interessante Erkenntnisse (s. u.).

Analyse von Aufnahmen

Ein wichtiges Thema des Kompaktseminars in Groningen war noch die Analyse von Aufnahmen. Man kann mit VoceVista zum einen live Eingesungenes oder über den line-in-Eingang bzw. über CD Eingespieltes direkt ansehen, zum anderen aber auch auf demselben Wege Aufnahmen herstellen. Die entstandene Aufnahme wird als “vis”-Datei abgespeichert. Dateien mit einem anderen Format kann VoceVista nicht abspielen.

Wir hörten uns in Groningen u. a. das hohe b aus der Arie “Celeste Aida” aus Verdis Oper Aida an. Miller verglich Domingo mit Pavarotti. Zunächst war für mich sehr interessant zu sehen, wie es möglich ist, die Töne des Sängers am Bildschirm von dem Klang des Orchesters zu unterscheiden: Der Blick schärft sich sehr schnell, das Orchester ist im Bereich um 3 kHz und darüber hinaus nicht mehr so intensiv. Hat man nun einen einigermaßen exponierten Ton, so erkennt man den Grundton des Sängers und kann dann die Harmonischen relativ leicht finden (es hilft natürlich, wenn man die Tonhöhe genau kennt, in unserem Beispiel b1 = 466 Hz). Man erkennt, dass sich die höheren Harmonischen immer deutlicher vom Orchester abheben (siehe Abb. 6). Wir sehen, dass Domingos Klang von einem dominanten H6 charakterisiert wird, während Pavarotti einen dominanten H3 benutzt. Wenn man nun weiß, dass die Vokalformanten für das zu singende “o” (sole) ungefähr um 430 Hz bzw. 780 Hz liegen (für ein offenes “o” etwa bei 550 Hz bzw. 820 Hz), könnte man vermuten, dass im Klangbild des b1 (H1 = 466, H2 = 932 Hz) auch einer dieser beiden Harmonischen dominiert.

Aber die Strategie der berühmten Tenöre ist offensichtlich eine andere. Pavarotti benutzt seinen zweiten Formanten, um H3 = 1398 Hz zu verstärken, während Domingo seinen Sängerformanten benutzt, um H6 = 2796 Hz zu verstärken. Donald Miller hat in Groningen noch festgestellt, dass Caruso bei diesem Ton in dieser Arie die gleiche Resonanzstrategie benutzte wie Domingo. Wenn man nun noch bedenkt, dass man auch darüber Aussagen machen kann, durch welche physische Veränderung des Ansatzrohrs man seine Formanten verschieben kann, dann wird sehr deutlich, wie spannend und lehrreich solche Analysen sein können.

Ich hatte in den zwei Tagen in Groningen sehr viel Neues über “Singen” gelernt, dem sympathischen Donald Miller sei auch hier noch einmal gedankt. Versteht man dieses “Kompaktseminar”, an dem neben mir noch ein an VoceVista interessierter Tenor aus Hamburg teilnahm, als Support für das Computerprogramm, dann ist das der beste Support, den man sich denken kann. Da sich für mich nun immer mehr tiefer ins Detail gehende Fragen stellten, die man teilweise durch Experimentieren mit dem Programm beantworten kann, habe ich mir noch einen PC gekauft und diesen so in mein Musikzimmer gestellt, dass er einerseits die Atmosphäre nicht ganz zerstört (Laptop wäre unauffälliger – aber wesentlich teurer), andererseits aber jederzeit auch bei der Arbeit mit Schülern einzusetzen ist. Über die wesentlichen ersten Erfahrungen, die ich bei der Arbeit mit VoceVista machte, möchte ich im letzten Abschnitt berichten.

Die ersten eigenen Erfahrungen

Klärung der Begriffe – Präzisierung der Sprache
GesangslehrerInnen diskutieren oft sehr divergent. Der eine beispielsweise redet aus methodischen Gründen nur von “Einregister”, die andere differenziert, gerade um einen möglichst guten Registerausgleich zu erreichen, die Register sehr genau, etwa in “Kopf-, Mittel- und Bruststimme”. Oder der eine schließt in den Begriff “Resonanz” Vibrationsgefühle im Brust- und Bauchraum und allen möglichen anderen Körperpartien mit ein, während sich eine andere sehr genau an einer wissenschaftlichen Definition des Begriffs orientiert. Oftmals lässt sich in einer Diskussion nicht einmal feststellen, ob die Diskutierenden nun eine ähnliche Ansicht zu einer Fragestellung teilen oder nicht, weil jeder Begriffe wie “Resonanz” oder “Register” in einem anderen Sinn (mit einer anderen Definition) benutzt. Sehr häufig wird die Ebene der eigenen Wahrnehmung mit einer “wissenschaftlich-beschreibenden” vermischt. Dies macht eine differenzierte Diskussion sehr schwierig. Die Beschäftigung mit VoceVista erzwingt nun gewissermaßen eine Objektivierung der Begriffe und eine Präzisierung der Sprache. Dies ist ein Effekt der Arbeit mit VoceVista, den ich für sehr wertvoll halte. Auf den ersten Blick wird dieser Aspekt leicht unterschätzt, aber ist die Kommunikationsfähigkeit nicht eine der wichtigsten Fähigkeiten für einen Gesangslehrer? Und zur Verbesserung der Kommunikationsfähigkeit kann die Präzisierung der Sprache einen wesentlichen Beitrag leisten.

Das eigene Ansatzrohr erforschen
Versucht man nun immer wieder vocal fry und dann den auf einer bestimmten Tonhöhe gesungenen zugehörigen Vokal zu vergleichen, fängt man an, seine Stimme auf eine neue Art und Weise zu entdecken. Ich war sehr fasziniert zu sehen, dass es beispielsweise hilfreich sein kann, in bestimmten Situationen die Zunge etwas anzuheben. Durch diese Maßnahme werden die Formanten ein wenig verschoben. Diese “Verschiebung” der Formanten konnte ich auch bei der Umsetzung der Vorstellung “Staunen” oder gar “Gähnen” (also eine Weitung des Ansatzrohrs, im Wesentlichen charakterisiert durch Anheben des weichen Gaumens und Absenken des Kehlkopfs) beobachten. Auf der Basis solcher Beobachtungen kann man nun individuelle Resonanzstrategien gewissermaßen neu verstehen. Ich sehe Vorgänge und verstehe nun, warum mich bisher eine sängerische Intuition zu bestimmten Einstellungen führte. So kann ich z. B. den Vorgang des “Abdeckens” in eine andere Sprache übersetzen,6 weil ich ihn in einem neuen Zusammenhang begreife. Das heißt, ich kann auch die Intuition von anderen Sängern besser verstehen und als Gesangslehrer u. U. sehr differenziert in diesen Prozess eingreifen. Der gelernte Sänger wird in der Regel feststellen, dass die so gewonnene Einsicht zur gleichen Bemühung führt, die er schon vorher über Hören und Spüren verfolgte – aber jetzt kann er sehen, warum er es tut. Und in der einen oder anderen Situation lässt sich vielleicht doch etwas durch diesen tieferen Einblick verbessern.

Eine neue Dimension des Nachmachens
Das intuitive Nachsingen eines gesehenen Tons bedeutet für mich tatsächlich den Eintritt in eine neue Dimension des Stimmtrainings. Sehr wichtig ist, dass wir unterscheiden zwischen dem oben beschriebenen “Erforschen” des Ansatzrohrs (das ist ein sehr analytischer Vorgang) und dem intuitiven Nachsingen. Die Erkenntnisse aus der Erforschung des Ansatzrohrs werden auf einem sehr kognitiven Weg gefunden, das intuitive Nachsingen einer Kurve hingegen erfordert nicht diese kognitiven Fähigkeiten. Es bindet die sängerischen Sinne auf eine neue Art und Weise. Ich höre einen gesungenen Ton von einem nachahmenswerten Sänger meines Stimmfachs einmal und dann sehe ich die Kurve – ich höre sie nicht immer wieder, ich sehe sie permanent, konzentriere mich auf tiefen Atem und dieses Bild (dieser Vorgang lenkt von den Organen ab, die sich jetzt optimal aufeinander abstimmen sollen) und versuche eine Kurve zu singen, die in den wesentlichen Eigenschaften mit denen des Bilds übereinstimmt.7 Das Phänomenale an dieser Art des Nachmachens ist, dass sich der Sänger darauf beschränkt, ein paar wesentliche akustische Merkmale eines Klangs nachzuempfinden, und nicht der Gefahr ausgesetzt ist, einen Gesamtklang nachzumachen, der u. U. mit seiner Stimme auf physiologisch gesunde Art und Weise gar nicht herzustellen ist. Für mich persönlich war es faszinierend festzustellen, wie die Fähigkeit wächst eine Kurve nachzusingen. Es entsteht eine neue Sensibilität, denn die Anforderungen sind von einer anderen Qualität, als wenn man einen Klang nachsingt oder, was besser ist, bestimmte Eigenschaften eines Klangs nachzumachen versucht.

Für den Unterricht sehe ich hier ein breites Feld der Anwendungsmöglichkeiten. Insbesondere weil der Schüler oder die Schülerin nicht mit dem ganzen theoretischen Hintergrund, den der Lehrer natürlich im Blick haben sollte, konfrontiert werden muss. Beispiel: Die Schülerin soll sich (mit den Augen) auf ihre Sängerformanten konzentrieren und dann auf einem Ton alle Vokale singen. Das Ziel dabei ist, die Intensität des Sängerformanten möglichst hoch zu halten. Fällt nun bei einem Vokal die Intensität deutlich ab, dann sieht die Schülerin sofort, wie die Kurve entsprechend einfällt. Dazu muss nicht die Gesamtheit des komplexen Hintergrunds erklärt werden,8 die Schülerin bleibt auf dem Pfad zur Heranbildung einer sängerischen Intuition. Meine ersten Erfahrungen in diesem Zusammenhang zeigen, dass die SchülerInnen sehr neugierig und offen auf die Konfrontation mit ihrer eigenen Kurve reagieren, auch wenn sie sonst keine Freunde des Computers sind. Hier tut sich eben eine neue Dimension auf.

Kein Wundermittel, aber die Entdeckung einer neuen Welt

Die bisher erwähnten Erfahrungsbereiche oder Anwendungsmöglichkeiten haben eine Gemeinsamkeit: Man lernt stimmliche Vorgänge neu zu formulieren, gegebenenfalls erarbeitet man sich einige Begriffe neu, man erkennt neue Zusammenhänge, man schärft das analytische Ohr. Das heißt, durch die Nutzung der Möglichkeiten des Programms lernt man vieles quasi nebenher. Lässt man sich durch den Umgang mit der notwendigen Technik nicht abschrecken, so kann man diese wertvollen Erkenntnisse auf durchaus spielerische Art und Weise gewinnen.

VoceVista ist kein Programm für “jedermann”, es ist ein Programm für Fachleute, denn es ist zwar leicht zu bedienen, aber man muss wissen, was man tut, wenn man zu qualifizierten Aussagen kommen will. Das fordert die Auseinandersetzung mit den Fachbegriffen und davon profitiert nach meiner Meinung die gesamte Gesangspädagogik.

Der PC hält Einzug in viele Bereiche unseres Lebens, in Kinderzimmern und Wohnzimmern kann er auch schnell zur Last werden und mehr Probleme schaffen, als er löst. Im Gesangszimmer kann er einen Weg in eine neue Welt eröffnen, nicht um die “alte Welt” in Frage zu stellen, sondern um sie differenzierter zu betrachten.

1 Die Tonhöhenangaben in diesem Bericht beziehen sich auf das in Deutschland übliche System a = 220 Hz, a1 = 440 Hz usw.
2 aus der englischen Fachliteratur; ins Deutsche übertragen: “Spektralanalyse in Echtzeit”.
3 Das EGG ist ein kleines Gerät bestehend aus zwei Kontakten, die an den Kehlkopf angelegt werden. So kann der Kontakt der Stimmlippen pro Zeit gemessen werden. Es entsteht eine Kurve, die eine sehr wichtige Aussage über die Art der Stimmgebung macht. Eine noch differenziertere Aussage über die Stimmgebung kann man eben dann machen, wenn man die Darstellung des Stimmlippenkontakts und den daraus abgelesenen “closed quotient” (“Schließquotient”) zusammen mit dem akustischen Signal interpretiert. Die Ausführung dieser Möglichkeiten würde hier zu weit führen.
4 Ich benutze einen Pentium I (166 MHz, MMX), 64 RAM, Win98 als Betriebssystem.
5 Die Periode P ist die (Zeit)Länge einer Schwingung. Für die Grundfrequenz F0 der Schwingung gilt also F0 = 1/P, sie gibt dann an, wie viel Schwingungen pro Sekunde ausgeführt werden. Zur Messung mit der Maus: Man kann mit der Maus im Audiofenster jedes beliebige Zeitintervall messen. Am gewünschten Anfangspunkt drückt man die linke Maustaste, dann zieht man die Maus bis zum gewünschten Endpunkt und lässt sie los. Der Computer gibt dann das so gemessene Intervall in msec an. Wählt man nun Anfangs- und Endpunkt so, dass die beiden Punkte die Periode der Kurve bestimmen, dann erhält man als (Zeit)Intervall genau die (Zeit)Länge der Periode.
6 vgl. oben: “offenes Singen in der Höhe heißt, dass der erste Formant dem natürlichen Drang nachgibt der zweiten Harmonischen zu folgen”. Man beachte, dass dies so nur für Männerstimmen gilt.
7 In der Unterrichtssituation sollte man darauf achten, dass man den Bildschirm höher aufstellt als üblicherweise, so dass man in einer ganz natürlichen Haltung singen kann.
8 Für manche Schülerin und manchen Schüler kann natürlich gerade eine wissenschaftlich orientierte präzise Erklärung der Vorgänge motivierend sein.

Literatur
Donald Gray Miller: Registers In Singing, Roden 2000, zu beziehen über: Groningen Voice Research Lab, Department of Biomedical Engineering, P. O. Box 196, NL-9700 AD Groningen
Garyth Nair: Voice-Tradition and Technology, San Diego 1999, Singular Publishing Group, Inc.

VoceVista, weitere Infos: www.vocevista.com

Kontakt
Matthias Müller,  www.stimmkultur.de