Vokal

Aus besserwiki.de

Ein Vokal ist ein syllabischer Sprachlaut, der ohne Verengung des Vokaltrakts ausgesprochen wird. Vokale sind eine der beiden Hauptklassen von Sprachlauten, die andere ist der Konsonant. Vokale variieren in ihrer Qualität, Lautstärke und auch in ihrer Quantität (Länge). Sie sind in der Regel stimmhaft und spielen eine wichtige Rolle bei prosodischen Variationen wie Tonfall, Intonation und Betonung.

Das Wort Vokal stammt vom lateinischen Wort vocalis ab, das "stimmhaft" bedeutet (d. h. mit der Stimme zusammenhängend). Im Englischen wird das Wort Vokal üblicherweise sowohl für die Vokallaute als auch für die schriftlichen Symbole verwendet, die sie darstellen (a, e, i, o, u und manchmal y).

Ein Vokal (von lateinisch [litera/littera] vocalis ‚tönender [Buchstabe]‘; zu vox ‚Stimme‘) oder Selbstlaut ist ein Sprachlaut, bei dessen Artikulation der Phonations­strom weitgehend ungehindert durch den Mund ausströmen kann. Vokale sind im Allgemeinen stimmhaft.

„Vokale“ im genauen Sinne des Wortes sind vokalische Laute, also Phone: Einheiten der gesprochenen Sprache. Buchstaben der geschriebenen Sprache wie A, E, I, O, U sind Vokalbuchstaben, sie werden allgemeinsprachlich, so auch im Duden, aber meist ebenfalls „Vokale“ genannt.

Definition

Es gibt zwei sich ergänzende Definitionen des Vokals, eine phonetische und eine phonologische.

  • Nach der phonetischen Definition ist ein Vokal ein Laut, wie das englische "ah" /ɑː/ oder "oh" //, der mit einem offenen Vokaltrakt erzeugt wird; er ist median (die Luft entweicht entlang der Zungenmitte), oral (zumindest ein Teil des Luftstroms muss durch den Mund entweichen), reibungsfrei und kontinuierlich. An keinem Punkt oberhalb der Glottis kommt es zu einem nennenswerten Luftdruckanstieg. Dies steht im Gegensatz zu Konsonanten, wie z. B. dem englischen "sh" [ʃ], die an irgendeiner Stelle des Vokaltrakts eine Einschnürung oder einen Verschluss aufweisen.
  • In der phonologischen Definition wird ein Vokal als syllabisch definiert, d. h. als der Laut, der die Spitze einer Silbe bildet. Ein phonetisch gleichwertiger, aber nichtsilbiger Laut ist ein Halbvokal. In mündlichen Sprachen bilden phonetische Vokale normalerweise den Scheitelpunkt (Nukleus) vieler oder aller Silben, während Konsonanten den Anfang und (in Sprachen, in denen es sie gibt) die Koda bilden. In einigen Sprachen können auch andere Laute den Kern einer Silbe bilden, wie z. B. das syllabische (d. h., vocalic) l im englischen Wort table [ˈtʰeɪ.bl̩] (wenn es nicht als schwacher Vokallaut betrachtet wird: [ˈtʰeɪ.bəl]) oder das syllabische r im serbo-kroatischen Wort vrt [ʋr̩̂t] "Garten".

Die phonetische Definition von "Vokal" (d. h. ein Laut, der ohne Verengung des Vokaltrakts erzeugt wird) stimmt nicht immer mit der phonologischen Definition überein (d. h. ein Laut, der den Scheitelpunkt einer Silbe bildet). Die Approximanten [j] und [w] veranschaulichen dies: beide werden ohne große Verengung im Vokaltrakt erzeugt (so dass sie phonetisch gesehen vokalähnlich erscheinen), aber sie treten am Silbenanfang auf (z. B. in "yet" und "wet"), was darauf hindeutet, dass sie phonologisch gesehen Konsonanten sind. Eine ähnliche Debatte gibt es darüber, ob ein Wort wie Vogel in einem rhotischen Dialekt einen r-gefärbten Vokal /ɝ/ oder einen Silbenkonsonanten /ɹ̩/ hat. Der amerikanische Linguist Kenneth Pike (1943) schlug die Begriffe "vocoid" für einen phonetischen Vokal und "vowel" für einen phonologischen Vokal vor, so dass [j] und [w] nach dieser Terminologie als vocoids, aber nicht als Vokale klassifiziert werden. Maddieson und Emmory (1985) haben jedoch anhand einer Reihe von Sprachen gezeigt, dass Halbvokale mit einer engeren Verengung des Vokaltrakts produziert werden als Vokale und daher auf dieser Grundlage als Konsonanten betrachtet werden können. Dennoch würden die phonetischen und phonemischen Definitionen für das syllabische /l/ in table oder die syllabischen Nasale in button und rhythm in Konflikt geraten.

Artikulation

Röntgenaufnahmen von Daniel Jones' [i, u, a, ɑ].
Das ursprüngliche Vokalviereck aus Jones' Artikulation. Das Vokaltrapez des modernen IPA, das sich am Anfang dieses Artikels befindet, ist eine vereinfachte Wiedergabe dieses Diagramms. Die Kugeln sind die Kardinalpunkte der Vokale. (Ein paralleles Diagramm umfasst die vorderen und mittleren gerundeten und hinteren ungerundeten Vokale). Die Zellen zeigen die Artikulationsbereiche an, die vernünftigerweise mit diesen kardinalen Vokalbuchstaben [i, e, ɛ, a, ɑ, ɔ, o, u, ɨ] und nicht-kardinalen [ə] transkribiert werden können. Wenn eine Sprache weniger als diese Vokalqualitäten unterscheidet, könnte [e, ɛ] zu ⟨e⟩, [o, ɔ] zu ⟨o⟩, [a, ɑ] zu ⟨a⟩, usw. zusammengefasst werden. Wenn eine Sprache mehr unterscheidet, könnte ⟨ɪ⟩ hinzugefügt werden, wo sich die Bereiche von [i, e, ɨ, ə] schneiden, ⟨ʊ⟩, wo sich [u, o, ɨ, ə] schneiden, und ⟨ɐ⟩, wo sich [ɛ, ɔ, a, ɑ, ə] schneiden.

Die traditionelle Sichtweise der Vokalproduktion, die sich zum Beispiel in der Terminologie und Darstellung des Internationalen Phonetischen Alphabets widerspiegelt, geht von artikulatorischen Merkmalen aus, die die Qualität eines Vokals bestimmen und ihn von anderen Vokalen unterscheiden. Daniel Jones entwickelte das kardinale Vokalsystem zur Beschreibung von Vokalen anhand der Merkmale Zungenhöhe (vertikale Dimension), Zungenrücklage (horizontale Dimension) und Rundung (Lippenartikulation). Diese drei Parameter sind in dem schematischen viereckigen IPA-Vokaldiagramm auf der rechten Seite dargestellt. Es gibt noch weitere Merkmale der Vokalqualität, wie die Stellung des Velums (Nasalität), die Art der Stimmlippenschwingung (Phonation) und die Zungenwurzelstellung.

Seit 1928 ist bekannt, dass dieses Konzept der Vokalartikulation ungenau ist. Peter Ladefoged hat gesagt, dass "die frühen Phonetiker ... dachten, sie würden den höchsten Punkt der Zunge beschreiben, aber sie taten es nicht. In Wirklichkeit beschrieben sie Formantfrequenzen". (Siehe unten.) Das IPA-Handbuch räumt ein, dass "das Vokalviereck als eine Abstraktion und nicht als eine direkte Abbildung der Zungenposition betrachtet werden muss."

Nichtsdestotrotz wird das Konzept, dass Vokalqualitäten in erster Linie durch die Zungenposition und die Lippenrundung bestimmt werden, in der Pädagogik weiterhin verwendet, da es eine intuitive Erklärung für die Unterscheidung von Vokalen bietet.

In betonten Silben unterscheidet man im Deutschen zwischen zwei Typen von Vokalen:

  • Vokalen, die lang und geschlossen sind (z. B. [o:] wie in Ton) und
  • Vokalen, die kurz und offen sind (z. B. [ɔ] wie in Sonne).

Dieses Muster wird in zwei Fällen durchbrochen:

  • Der ungerundete offene Zentralvokal [a] erscheint zwar sowohl in der Lang- als auch in der Kurzform (Vokalquantität), wird aber stets offen gesprochen (Vokalqualität). (In manchen Regionalvarianten, etwa in niederdeutsch beeinflussten, werden die beiden Quantitäten jedoch in der Qualität unterschieden, so wird der Langvokal etwa als gerundeter Hinterzungenvokal [ɒː] und der Kurzvokal als ungerundeter Vorderzungenvokal [a] realisiert.)
  • Mit dem kurzen ungerundeten halboffenen Vorderzungenvokal [ɛ] korrespondieren zwei Langformen: 1. der ungerundete halbgeschlossene Vorderzungenvokal [e:] und 2. die Langform [ɛ:] (wie in Mädchen). Dies gilt jedoch vor allem für die Standardaussprache. In vielen deutschen Dialekten wird das lange <ä> wie [e:] ausgesprochen.

Einige weitere Vokale, die in der Tabelle nicht aufgeführt sind, erscheinen ausschließlich in Fremdwörtern. Besonders produktiv war und ist hier das Französische, dem das Deutsche die Nasalvokale [ɑ̃] (wie in Orange), [ɛ̃] (Teint, Mannequin), [õ] (Contenance), [ɔ̃] (Jargon) und [œ̃] (Parfum) sowie den Langvokal [œ:] (Œuvre) verdankt. Die Benutzung der Nasalvokale gilt teilweise als bildungssprachlich; auch die Aussprache mit gewöhnlichem, nicht-nasaliertem Vokal ‒ meist von [ŋ] gefolgt (z. B. Orange [oˈʀaŋʒə], Bonbon [bɔŋˈbɔŋ]) ‒ wird zunehmend als normgerecht empfunden.

Aus dem Englischen gelangte unter anderem der Langvokal [ɔː] (Smalltalk) ins Deutsche.

Höhe

Theoretisch bezieht sich die Vokalhöhe auf die vertikale Position entweder der Zunge oder des Kiefers (je nach Modell) im Verhältnis zum Mundboden oder zur Kieferöffnung. In der Praxis bezieht sie sich jedoch auf den ersten Formanten (tiefste Resonanz der Stimme), abgekürzt F1, der mit der Höhe der Zunge verbunden ist. Bei engen Vokalen, die auch als hohe Vokale bezeichnet werden, wie [i] und [u], entspricht der erste Formante der Position der Zunge nahe am Gaumen, also hoch im Mund, während bei offenen Vokalen, die auch als tiefe Vokale bezeichnet werden, wie [a], F1 der Position des offenen Kiefers und der tiefen Position der Zunge im Mund entspricht. Die Höhe wird durch den Kehrwert des F1-Wertes definiert: je höher die Frequenz des ersten Formanten, desto tiefer (offener) der Vokal. Im Sprachgebrauch von John Elsing, bei dem die Höhe von Frontalvokalen durch die Position des Kiefers und nicht der Zunge bestimmt wird, werden nur die Begriffe "offen" und "geschlossen" verwendet, da sich "hoch" und "tief" auf die Position der Zunge beziehen.

Das Internationale Phonetische Alphabet definiert sieben Höhenstufen für Vokale, aber es ist keine Sprache bekannt, die alle Vokale unterscheidet, ohne ein anderes Attribut zu nennen:

  • nah (hoch)
  • nah-nah (nah-hoch)
  • nah-mittel (hoch-mittel)
  • mittel (echt-mittel)
  • offen-mittel (tief-mittel)
  • near-open (fast-niedrig)
  • offen (niedrig)

Die Buchstaben [e, ø, ɵ, ɤ, o] werden in der Regel entweder für close-mid oder true-mid Vokale verwendet. Wenn jedoch mehr Präzision erforderlich ist, können echte mittlere Vokale mit einem absteigenden Diakritikum geschrieben werden [e̞, ø̞, ɵ̞, ɤ̞, o̞]. Die Kensiu-Sprache, die in Malaysia und Thailand gesprochen wird, ist insofern höchst ungewöhnlich, als sie true-mid mit close-mid und open-mid Vokalen kontrastiert, ohne Unterschiede in anderen Parametern wie Backness oder Roundness.

Es scheint, dass einige Varietäten des Deutschen fünf Vokalhöhen haben, die sich unabhängig von der Länge oder anderen Parametern unterscheiden. Der bayerische Dialekt von Amstetten hat dreizehn lange Vokale, die so analysiert werden können, dass jeweils fünf Höhen (eng, eng-mittel, mittel, offen-mittel und offen) unter den vorderen ungerundeten, vorderen gerundeten und hinteren gerundeten Vokalen sowie ein offener zentraler Vokal unterschieden werden können, was insgesamt fünf Vokalhöhen ergibt: /i e ɛ̝ ɛ/, /y ø œ̝ œ/, /u o ɔ̝ ɔ/, /ä/. Von keiner anderen Sprache ist bekannt, dass sie mehr als vier Stufen der Vokalhöhe unterscheidet.

Der Parameter der Vokalhöhe scheint das wichtigste sprachübergreifende Merkmal von Vokalen zu sein, da alle bisher untersuchten gesprochenen Sprachen die Höhe als kontrastives Merkmal verwenden. Kein anderer Parameter, auch nicht die Rückung oder Rundung (siehe unten), wird in allen Sprachen verwendet. Einige Sprachen haben vertikale Vokalsysteme, in denen zumindest auf phonemischer Ebene nur die Höhe zur Unterscheidung von Vokalen verwendet wird.

Rückung

Idealistische Zungenstellung der vorderen Kardinalvokale mit Angabe des höchsten Punktes.

Die Vokalrücklage wird nach der Position der Zunge bei der Artikulation eines Vokals im Verhältnis zum hinteren Teil des Mundes benannt. Wie die Vokalhöhe wird sie jedoch durch einen Formanten der Stimme definiert, in diesem Fall die Sekunde F2, und nicht durch die Position der Zunge. Bei vorderen Vokalen, wie z. B. [i], ist die Frequenz von F2 relativ hoch, was im Allgemeinen einer vorderen Zungenposition im Mund entspricht, während bei hinteren Vokalen, wie z. B. [u], F2 niedrig ist, was mit der Position der Zunge im hinteren Teil des Mundes übereinstimmt.

Das Internationale Phonetische Alphabet definiert fünf Grade der Vokalrückständigkeit:

  • vorne
  • Nahe der Front
  • zentral
  • nah-hinten
  • hinten

Hinzu kommen front-central und back-central, die den vertikalen Linien entsprechen, die in einigen IPA-Diagrammen die zentralen von den vorderen und hinteren Vokalräumen trennen. Die Begriffe front-central und back-central können jedoch auch als Synonyme für near-front und near-back verwendet werden. Es ist keine Sprache bekannt, die mehr als drei Grade von Backness kontrastiert, und es gibt auch keine Sprache, die vordere Vokale mit near-front Vokalen und hintere mit near-back Vokalen kontrastiert.

Obwohl es in einigen englischen Dialekten Vokale mit fünf Rückwärtsgraden gibt, ist keine Sprache bekannt, die fünf Rückwärtsgrade ohne zusätzliche Unterschiede in Höhe oder Rundung unterscheidet.

Abgerundetheit

Roundedness ist nach der Abrundung der Lippen bei einigen Vokalen benannt. Da die Lippenrundung leicht sichtbar ist, können Vokale anhand der Lippenartikulation allgemein als gerundet bezeichnet werden. Akustisch sind gerundete Vokale vor allem durch eine Verringerung von F2 gekennzeichnet, obwohl auch F1 leicht verringert ist.

In den meisten Sprachen ist die Rundung eher ein Verstärkungsmerkmal für mittlere bis hohe hintere Vokale als ein Unterscheidungsmerkmal. Normalerweise ist die Rundung umso stärker, je höher ein hinterer Vokal ist. In einigen Sprachen ist die Rundung jedoch unabhängig von der Rücklautung, z. B. im Französischen und Deutschen (mit vorne gerundeten Vokalen), in den meisten uralischen Sprachen (Estnisch hat einen Rundungskontrast für /o/ und vordere Vokale), in den Turksprachen (mit einem Rundungsunterschied für vordere Vokale und /u/) und im Vietnamesischen mit hinten ungerundeten Vokalen.

Dennoch besteht selbst in diesen Sprachen in der Regel eine gewisse phonetische Korrelation zwischen Rundung und Rückseitigkeit: vorne gerundete Vokale sind tendenziell eher vorne-zentral als vorne, und hinten ungerundete Vokale sind tendenziell eher hinten-zentral als hinten. Die Platzierung von ungerundeten Vokalen links von gerundeten Vokalen in der IPA-Vokaltabelle spiegelt also ihre Position im Formantraum wider.

Es sind verschiedene Arten der Labialisierung möglich. Bei mittleren bis hohen gerundeten hinteren Vokalen sind die Lippen im Allgemeinen nach außen vorgestülpt ("pursed"), ein Phänomen, das als endolabiale Rundung bekannt ist, da die Innenseiten der Lippen sichtbar sind, während bei mittleren bis hohen gerundeten vorderen Vokalen die Lippen im Allgemeinen "zusammengedrückt" sind, wobei die Lippenränder nach innen gezogen und aufeinander zu bewegt werden, ein Phänomen, das als exolabiale Rundung bekannt ist. Allerdings folgen nicht alle Sprachen diesem Muster. Das japanische /u/ zum Beispiel ist ein exolabialer (zusammengedrückter) hinterer Vokal und klingt ganz anders als ein englisches endolabiales /u/. Schwedisch und Norwegisch sind die einzigen beiden bekannten Sprachen, in denen dieses Merkmal kontrastiv ist; sie haben sowohl exo- als auch endo-labiale nahe Vordervokale bzw. nahe Zentralvokale. In vielen phonetischen Darstellungen werden beide als Arten der Rundung betrachtet, aber einige Phonetiker glauben nicht, dass es sich dabei um Teilmengen eines einzigen Phänomens handelt, und gehen stattdessen von drei unabhängigen Merkmalen aus: gerundet (endolabial), gestaucht (exolabial) und ungerundet. Die Lippenposition von ungerundeten Vokalen kann auch separat als gespreizt und neutral (weder gerundet noch gespreizt) klassifiziert werden. Andere unterscheiden zwischen komprimierten gerundeten Vokalen, bei denen die Mundwinkel zusammengezogen sind, und komprimierten ungerundeten Vokalen, bei denen die Lippen zusammengepresst sind, die Mundwinkel aber wie bei gespreizten Vokalen auseinander bleiben.

Vorne, hochgezogen und eingezogen

Vorne, hoch und zurückgezogen sind die drei artikulatorischen Dimensionen des Vokalraums. Öffnen und Schließen beziehen sich auf den Kiefer, nicht auf die Zunge.

Die Vorstellung, dass sich die Zunge in zwei Richtungen bewegt, hoch-tief und vorne-hinten, wird nicht durch artikulatorische Belege gestützt und klärt nicht, wie die Artikulation die Vokalqualität beeinflusst. Vokale können stattdessen durch die drei Bewegungsrichtungen der Zunge aus ihrer neutralen Position charakterisiert werden: vorne (vorwärts), angehoben (nach oben und hinten) und zurückgezogen (nach unten und hinten). Vordere Vokale ([i, e, ɛ] und in geringerem Maße [ɨ, ɘ, ɜ, æ] usw.) können wie in der traditionellen Auffassung sekundär als geschlossen oder offen bezeichnet werden, aber dies bezieht sich eher auf die Kiefer- als auf die Zungenposition. Darüber hinaus gibt es keine einheitliche Kategorie der rückwärtigen Vokale, sondern die Umgruppierung sieht erhabene Vokale vor, bei denen sich der Zungenkörper dem Velum nähert ([u, o, ɨ] usw.), und zurückgezogene Vokale, bei denen sich der Zungengrund dem Rachen nähert ([ɑ, ɔ] usw.):

  • vorne
  • angehoben
  • retrahiert

Die Zugehörigkeit zu diesen Kategorien ist skalar, wobei die mittleren Vokale in keiner der Kategorien vertreten sind.

Nasalierung

Die Nasalierung tritt auf, wenn die Luft durch die Nase entweicht. Vokale werden oft unter dem Einfluss benachbarter nasaler Konsonanten nasalisiert, wie im englischen hand [hæ̃nd]. Nasalisierte Vokale sollten jedoch nicht mit nasalen Vokalen verwechselt werden. Letztere beziehen sich auf Vokale, die sich von ihren oralen Gegenstücken unterscheiden, wie im Französischen /ɑ/ vs. /ɑ̃/.

Bei nasalen Vokalen ist das Velum abgesenkt, und ein Teil der Luft strömt sowohl durch die Nasenhöhle als auch durch den Mund. Ein oraler Vokal ist ein Vokal, bei dem die gesamte Luft durch den Mund entweicht. Auch im Polnischen und Portugiesischen werden nasale und orale Vokale unterschieden.

Phonation

Die Intonation beschreibt, ob die Stimmbänder bei der Artikulation eines Vokals vibrieren. Die meisten Sprachen haben nur stimmhafte Vokale, aber einige indianische Sprachen wie Cheyenne und Totonac unterscheiden stimmhafte und stimmlose Vokale. In geflüsterter Sprache sind die Vokale stimmlos. Im Japanischen und im Québec-Französischen werden Vokale, die zwischen stimmlosen Konsonanten liegen, oft stimmlos gemacht.

Modale Stimme, knarrende Stimme und gehauchte Stimme (gemurmelte Vokale) sind Phonationsarten, die in einigen Sprachen kontrastiv verwendet werden. Oftmals treten sie zusammen mit Ton- oder Betonungsunterschieden auf; in der Sprache Mon werden Vokale, die im hohen Ton ausgesprochen werden, auch mit knarrender Stimme produziert. In solchen Fällen kann es unklar sein, ob der Ton, der Intonationstyp oder die Paarung von beidem für den phonemischen Kontrast verwendet wird. Die Kombination von phonetischen Merkmalen (Phonation, Ton, Betonung) wird als Register oder Registerkomplex bezeichnet.

Dehnbarkeit

Die Spannkraft wird verwendet, um den Gegensatz zwischen gespannten Vokalen und lockeren Vokalen zu beschreiben. Diese Opposition wurde traditionell als Ergebnis einer größeren Muskelspannung angesehen, obwohl phonetische Experimente dies wiederholt nicht gezeigt haben.

Im Gegensatz zu den anderen Merkmalen der Vokalqualität ist die Spannung nur auf die wenigen Sprachen anwendbar, die diese Opposition haben (hauptsächlich germanische Sprachen, z. B. Englisch), während die Vokale der anderen Sprachen (z. B. Spanisch) in Bezug auf die Spannung in keiner Weise sinnvoll beschrieben werden können.

Man kann die englischen gespannten vs. laxen Vokale grob unterscheiden, und zwar anhand der Schreibweise. Gespannte Vokale treten in der Regel in Wörtern mit stummem e am Ende auf, wie in mate. Laxe Vokale kommen in Wörtern ohne stummes e vor, wie z. B. mat. Im amerikanischen Englisch kommen die laxen Vokale [ɪ, ʊ, ɛ, ʌ, æ] nicht in betonten offenen Silben vor.

In der traditionellen Grammatik werden die Begriffe lange Vokale und kurze Vokale häufiger verwendet als die Begriffe angespannt und lax. Die beiden Begriffe werden von einigen austauschbar verwendet, weil die Merkmale in einigen Varietäten des Englischen zusammenfallen. In den meisten germanischen Sprachen können laxe Vokale nur in geschlossenen Silben vorkommen. Sie werden daher auch als kontrollierte Vokale bezeichnet, während die gespannten Vokale als freie Vokale bezeichnet werden, da sie in jeder Art von Silbe vorkommen können.

Stellung der Zungenwurzel

Die fortgeschrittene Zungenwurzel (Advanced Tongue Root, ATR) ist ein Merkmal, das in weiten Teilen Afrikas, im pazifischen Nordwesten und in vereinzelten anderen Sprachen wie dem modernen Mongolisch zu finden ist. Der Kontrast zwischen vorgeschobenem und zurückgezogenem Zungengrund ähnelt akustisch dem Kontrast zwischen Spannung und Entspannung, aber sie werden unterschiedlich artikuliert. Diese Vokale sind mit einer spürbaren Spannung im Vokaltrakt verbunden.

Sekundäre Verengungen im Vokaltrakt

Pharyngealisierte Vokale kommen in einigen Sprachen wie Sedang und den tungusischen Sprachen vor. Die Pharyngealisierung ähnelt in der Artikulation der zurückgezogenen Zungenwurzel, ist aber akustisch anders.

Ein stärkerer Grad an Pharyngealisierung tritt in den nordostkaukasischen Sprachen und den Khoisan-Sprachen auf. Man könnte sie als epiglottalisiert bezeichnen, da die primäre Einschnürung an der Spitze der Epiglottis liegt.

Am stärksten ausgeprägt ist die Pharyngealisierung bei den schrillen Vokalen der Khoisan-Sprachen, bei denen der Kehlkopf angehoben und der Rachen eingeengt ist, so dass entweder der Kehldeckel oder die Arytenoidknorpel anstelle der Stimmbänder vibrieren.

Beachten Sie, dass die Begriffe pharyngealisiert, epiglottalisiert, schrill und sphinkterisch manchmal synonym verwendet werden.

Rhotische Vokale

Rhotische Vokale sind die "R-farbigen Vokale" des amerikanischen Englisch und einiger anderer Sprachen.

Reduzierte Vokale

Gewöhnliche reduzierte Vokale
(IPA bietet nur ⟨ə⟩ und ⟨ɐ⟩)
Fast-
vorne
Zentral Fast-
hinten
Nahe-nah ᵿ
Mittel ə
Fast offen ɐ

In einigen Sprachen, wie z. B. im Englischen und Russischen, gibt es in einigen unbetonten Positionen so genannte "reduzierte", "schwache" oder "undeutliche" Vokale. Diese Vokale entsprechen nicht eins zu eins den Vokallauten, die in betonter Stellung vorkommen (so genannte "volle" Vokale), und sie sind im Vergleich dazu eher mittig und weisen eine geringere Rundung oder Spreizung auf. Das IPA sieht seit langem zwei Buchstaben für undeutliche Vokale vor, das mittlere ⟨ə⟩ und das untere ⟨ɐ⟩, die beide nicht für Rundungen definiert sind. Dialekte des Englischen können bis zu vier phonemisch reduzierte Vokale haben: /ɐ/, /ə/, und höhere ungerundete /ᵻ/ und gerundete /ᵿ/. (Für letztere können die Nicht-IPA-Buchstaben ⟨⟩ und ⟨ᵿ⟩ verwendet werden, um Verwechslungen mit den klar definierten Werten von IPA-Buchstaben wie ⟨ɨ⟩ und ⟨ɵ⟩ zu vermeiden, die auch gesehen werden, da das IPA nur zwei reduzierte Vokale vorsieht).

Akustik

Spektrogramm der Vokale [i, u, ɑ]. [ɑ] ist ein tiefer Vokal, daher ist sein F1-Wert höher als der von [i] und [u], die hohe Vokale sind. [i] ist ein vorderer Vokal, daher ist sein F2-Wert wesentlich höher als der von [u] und [ɑ], die hintere Vokale sind.
Ein idealisiertes Schema des Vokalraums, basierend auf den Formanten von Daniel Jones und John Wells bei der Aussprache der Kardinalvokale des IPA. Die Skala ist logarithmisch. Der graue Bereich ist der Bereich, in dem F2 kleiner als F1 wäre, was per Definition unmöglich ist. [a] ist ein extra tiefer zentraler Vokal. Phonemisch kann er je nach Sprache vorne oder hinten sein. Abgerundete Vokale, die in der Zungenposition vorne sind, sind im Formantraum vorne-zentral, während ungerundete Vokale, die in der Artikulation hinten sind, im Formantraum hinten-zentral sind. So hat [y ɯ] vielleicht ähnliche F1- und F2-Werte wie die hohen zentralen Vokale [ɨ ʉ]; ähnlich [ø ɤ] gegenüber zentralen [ɘ ɵ] und [œ ʌ] gegenüber zentralen [ɜ ɞ].
Das gleiche Diagramm, mit einigen Zwischenvokalen. Das tiefe vordere [æ] liegt zwischen [a] und [ɛ], während [ɒ] zwischen [ɑ] und [ɔ] liegt. Die hinteren Vokale verändern sich allmählich in der Rundung, von ungerundetem [ɑ] und leicht gerundetem [ɒ] zu eng gerundetem [u]; ebenso leicht gerundetes [œ] zu eng gerundetem [y]. Wenn man [a] als (extra-)tiefen zentralen Vokal betrachtet, können die Vokale [æ ɐ ɑ] als vordere, zentrale und hintere (fast-)tiefe Vokale neu definiert werden.

Die Akustik der Vokale ist recht gut verstanden. Die verschiedenen Vokalqualitäten werden in akustischen Analysen von Vokalen durch die relativen Werte der Formanten, akustische Resonanzen des Vokaltrakts, die als dunkle Bänder in einem Spektrogramm erscheinen, realisiert. Der Vokaltrakt fungiert als Resonanzraum, und die Position von Kiefer, Lippen und Zunge beeinflusst die Parameter des Resonanzraums, was zu unterschiedlichen Formantenwerten führt. Die Akustik von Vokalen kann mit Hilfe von Spektrogrammen veranschaulicht werden, die die akustische Energie bei jeder Frequenz und deren zeitliche Veränderung darstellen.

Der erste Formanten, abgekürzt "F1", entspricht der Offenheit des Vokals (Vokalhöhe). Offene Vokale haben hohe F1-Frequenzen, während enge Vokale niedrige F1-Frequenzen haben, wie im nebenstehenden Spektrogramm zu sehen ist: Das [i] und das [u] haben ähnlich niedrige erste Formanten, während das [ɑ] einen höheren Formanten hat.

Der zweite Formante, F2, entspricht der Frontalität des Vokals. Hintere Vokale haben niedrige F2-Frequenzen, während vordere Vokale hohe F2-Frequenzen haben. Dies wird im Spektrogramm sehr deutlich, wo der vordere Vokal [i] eine viel höhere F2-Frequenz hat als die beiden anderen Vokale. Bei offenen Vokalen erzwingt die hohe F1-Frequenz jedoch auch einen Anstieg der F2-Frequenz, so dass ein alternatives Maß für die Frontalität die Differenz zwischen dem ersten und dem zweiten Formanten ist. Aus diesem Grund bevorzugen einige Leute die Darstellung als F1 vs. F2 - F1. (Diese Dimension wird gewöhnlich als "Backness" und nicht als "Frontness" bezeichnet, aber der Begriff "Backness" kann bei der Diskussion von Formanten kontraintuitiv sein).

In der dritten Auflage seines Lehrbuchs empfahl Peter Ladefoged die Darstellung von F1 gegen F2 - F1, um die Qualität von Vokalen darzustellen. In der vierten Auflage ging er jedoch dazu über, eine einfache Darstellung von F1 gegen F2 zu verwenden, und diese einfache Darstellung von F1 gegen F2 wurde auch in der fünften (und letzten) Auflage des Buches beibehalten. Katrina Hayward vergleicht die beiden Darstellungsarten und kommt zu dem Schluss, dass die Darstellung von F1 gegen F2 - F1 "wegen ihrer Auswirkung auf die Platzierung der zentralen Vokale nicht sehr zufriedenstellend ist", weshalb sie ebenfalls die Verwendung einer einfachen Darstellung von F1 gegen F2 empfiehlt. Tatsächlich wurde diese Art der Darstellung von F1 gegen F2 von Analytikern verwendet, um die Qualität der Vokale in einer Vielzahl von Sprachen zu zeigen, darunter RP, das Englisch der Königin, amerikanisches Englisch, Singapur-Englisch, Brunei-Englisch, Nordfriesisch, Türkisch-Kabardisch und verschiedene indigene Sprachen Australiens.

R-farbige Vokale zeichnen sich durch niedrigere F3-Werte aus.

Die Abrundung wird im Allgemeinen durch eine Verringerung von F2 realisiert, die die Rückwärtsbewegung des Vokals verstärkt. Ein Effekt davon ist, dass hintere Vokale meist gerundet sind, während vordere Vokale meist ungerundet sind; ein anderer ist, dass gerundete Vokale dazu neigen, in Vokaltabellen rechts von ungerundeten Vokalen zu stehen. Das heißt, es gibt einen Grund für die Darstellung von Vokalpaaren auf diese Weise.

Prosodie und Intonation

Zusätzlich zu den oben beschriebenen Unterschieden in der Vokalqualität variieren Vokale auch aufgrund von Unterschieden in der Prosodie. Die wichtigsten prosodischen Variablen sind Tonhöhe (Grundfrequenz), Lautstärke (Intensität) und Länge (Dauer). Die Merkmale der Prosodie beziehen sich jedoch gewöhnlich nicht auf den Vokal selbst, sondern auf die Silbe, in der der Vokal vorkommt. Mit anderen Worten: Der Bereich der Prosodie ist die Silbe, nicht das Segment (Vokal oder Konsonant). Wir können die Auswirkungen der Prosodie auf die Vokalkomponente einer Silbe kurz auflisten.

  • Tonhöhe: Im Falle einer Silbe wie "Katze" ist der einzige stimmhafte Teil der Silbe der Vokal, so dass der Vokal die Tonhöheninformation trägt. Diese kann sich auf die Silbe beziehen, in der er vorkommt, oder auf einen größeren Sprachabschnitt, zu dem eine Intonationskontur gehört. In einem Wort wie "Mann" sind alle Segmente in der Silbe sonor, und alle sind an einer Tonhöhenänderung beteiligt.
  • Lautheit: Diese Variable wird traditionell mit der sprachlichen Betonung in Verbindung gebracht, obwohl dabei in der Regel auch andere Faktoren eine Rolle spielen. Lehiste (ebd.) argumentiert, dass Betonung oder Lautheit nicht mit einem einzelnen Segment in einer Silbe unabhängig vom Rest der Silbe in Verbindung gebracht werden kann (S. 147). Dies bedeutet, dass die Lautheit des Vokals eine Begleiterscheinung der Lautheit der Silbe ist, in der er vorkommt.
  • Länge: Es ist wichtig, zwei Aspekte der Vokallänge zu unterscheiden. Der eine ist der phonologische Unterschied in der Länge, den einige Sprachen aufweisen. Japanisch, Finnisch, Ungarisch, Arabisch und Latein haben einen zweiseitigen phonemischen Kontrast zwischen kurzen und langen Vokalen. In der Sprache Mixe gibt es einen dreifachen Kontrast zwischen kurzen, halblangen und langen Vokalen. Die andere Art der Längenvariation bei Vokalen ist nicht unterscheidbar und ist das Ergebnis prosodischer Variation in der Sprache: Vokale werden tendenziell verlängert, wenn sie in einer betonten Silbe stehen oder wenn die Äußerungsgeschwindigkeit langsam ist.

Der deutsche Vokalbestand umfasst einige Eigentümlichkeiten, die sich einer simplen Kategorisierung entziehen. Einordnungsprobleme bietet bereits der Laut [ɐ] (wie in Leder), der eine Realisierungsvariante des konsonantischen [ʁ] darstellt.

Monophthonge, Diphthonge, Triphthonge

Ein Vokal, dessen Qualität sich über die Dauer des Vokals nicht ändert, wird als Monophthong bezeichnet. Monophthonge werden manchmal als "reine" oder "stabile" Vokale bezeichnet. Ein Vokal, der von einer Qualität zu einer anderen übergeht, wird als Diphthong bezeichnet, und ein Vokal, der nacheinander drei Qualitäten durchläuft, ist ein Triphthong.

Alle Sprachen haben Monophthonge und viele Sprachen haben Diphthonge, aber Triphthonge oder Vokallaute mit noch mehr Zielqualitäten sind sprachübergreifend relativ selten. Im Englischen gibt es alle drei Typen: Der Vokallaut in hit ist ein Monophthong /ɪ/, der Vokallaut in boy ist in den meisten Dialekten ein Diphthong /ɔɪ/, und die Vokallaute von flower, /aʊər/, bilden je nach Dialekt einen Triphthong oder eine Zweisilbe.

In der Phonologie werden Diphthonge und Triphthonge von Folgen von Monophthongen danach unterschieden, ob der Vokallaut in verschiedene Phoneme zerlegt werden kann. Zum Beispiel bilden die Vokale in einer zweisilbigen Aussprache des Wortes Blume (/ˈflaʊər/) phonetisch einen zweisilbigen Triphong, sind aber phonologisch eine Folge von einem Diphthong (dargestellt durch die Buchstaben ⟨ow⟩) und einem Monophthong (dargestellt durch die Buchstaben ⟨er⟩). Einige Linguisten verwenden die Begriffe Diphthong und Triphthong nur in diesem phonemischen Sinne.

Geschriebene Vokale

Die Bezeichnung "Vokal" wird häufig für die Symbole verwendet, die Vokallaute im Schriftsystem einer Sprache darstellen, insbesondere wenn die Sprache ein Alphabet verwendet. In Schriftsystemen, die auf dem lateinischen Alphabet basieren, können die Buchstaben A, E, I, O, U, Y, W und manchmal auch andere verwendet werden, um Vokale darzustellen. Allerdings stellen nicht alle diese Buchstaben die Vokale in allen Sprachen dar, die diese Schrift verwenden, oder sogar einheitlich innerhalb einer Sprache. Einige von ihnen, insbesondere W und Y, werden auch zur Darstellung von Annäherungskonsonanten verwendet. Außerdem kann ein Vokal durch einen Buchstaben dargestellt werden, der normalerweise für Konsonanten reserviert ist, oder durch eine Buchstabenkombination, insbesondere wenn ein Buchstabe für mehrere Laute gleichzeitig steht, oder umgekehrt; Beispiele aus dem Englischen sind igh in "thigh" und x in "x-ray". Darüber hinaus gibt es in den Erweiterungen des lateinischen Alphabets unabhängige Vokalbuchstaben wie Ä, Ö, Ü, Å, Æ und Ø.

Die phonetischen Werte variieren je nach Sprache erheblich, und einige Sprachen verwenden I und Y für den Konsonanten [j], z. B. die Initiale I im Italienischen oder Rumänischen und die Initiale Y im Englischen. Im ursprünglichen lateinischen Alphabet gab es keine schriftliche Unterscheidung zwischen V und U, und der Buchstabe stand für den Approximanten [w] und die Vokale [u] und [ʊ]. Im modernen Walisisch steht der Buchstabe W für dieselben Laute. In ähnlicher Weise steht im Griechischen der Buchstabe V für [ə]. Es besteht nicht unbedingt eine direkte Eins-zu-eins-Entsprechung zwischen den Vokallauten einer Sprache und den Vokalbuchstaben. Viele Sprachen, die eine Form des lateinischen Alphabets verwenden, haben mehr Vokallaute, als durch die fünf Standardvokalbuchstaben dargestellt werden können. In der englischen Rechtschreibung können die fünf Buchstaben A, E, I, O und U eine Vielzahl von Vokallauten darstellen, während der Buchstabe Y häufig für Vokale steht (z. B. in "gym", "happy" oder den Diphthongen in "cry", "thyme"); W wird zur Darstellung einiger Diphthonge (wie in "cow") und zur Darstellung eines Monophthongs in den entlehnten Wörtern "cwm" und "crwth" (manchmal cruth) verwendet.

Andere Sprachen gehen mit der begrenzten Anzahl der lateinischen Vokalbuchstaben auf ähnliche Weise um. Viele Sprachen machen ausgiebig Gebrauch von Buchstabenkombinationen, um verschiedene Laute darzustellen. Andere Sprachen verwenden Vokalbuchstaben mit Modifikationen, wie ä im Schwedischen, oder fügen Vokalen diakritische Zeichen wie Umlaute hinzu, um die Vielfalt der möglichen Vokallaute darzustellen. Einige Sprachen haben auch zusätzliche Vokalbuchstaben konstruiert, indem sie die lateinischen Standardvokale auf andere Weise modifiziert haben, wie z. B. æ oder ø, die in einigen skandinavischen Sprachen vorkommen. Das Internationale Phonetische Alphabet besteht aus 28 Symbolen, die die verschiedenen Grundvokale darstellen, und einer Reihe von diakritischen Zeichen, die Abweichungen vom Grundvokal kennzeichnen.

In den Schriftsystemen einiger Sprachen, wie dem hebräischen und dem arabischen Alphabet, werden in der Regel nicht alle Vokale markiert, da sie für die Identifizierung eines Wortes häufig nicht erforderlich sind. Technisch gesehen handelt es sich um Abjads und nicht um Alphabete. Obwohl es möglich ist, englische Sätze zu konstruieren, die ohne geschriebene Vokale verstanden werden können (cn y rd ths?), können einzelne englische Wörter ohne geschriebene Vokale ununterscheidbar sein; man denke an dd, das jedes von dad, dada, dado, dead, deed, did, died, diode, dodo, dud, dude, odd, add und aided sein könnte. (Man beachte jedoch, dass Abjads im Allgemeinen einige wortinterne Vokale und alle wortinitialen und wortfinalen Vokale ausdrücken, wodurch die Mehrdeutigkeit stark reduziert wird.) Die Masoreten entwickelten ein Vokalnotationssystem für die hebräische jüdische Schrift, das immer noch weit verbreitet ist, ebenso wie die Trope-Symbole, die für die Kantillation verwendet werden; beide sind Teil der mündlichen Tradition und immer noch die Grundlage für viele Bibelübersetzungen - jüdische und christliche.

Als Vokalbuchstaben gelten im Deutschen: A, Ä, E, I, O, Ö, U, Ü, Y.

Sie stehen den Konsonanten­buchstaben B, C, D, F, G, H, J, K, L, M, N, P, Q, R, S, ẞ, T, V, W, X, Z gegenüber.

Diese Zuordnung beruht auf den grundlegenden Buchstaben-Laut-Beziehungen (Graphem-Phonem-Korrespondenzen), die aufgrund verschiedener Kriterien ermittelt werden können (Häufigkeit, Kontextbedingtheit, Eindeutigkeit). Vokalbuchstaben können in bestimmten Kontexten auch die Funktion übernehmen, nicht-silbische Laute wiederzugeben, und (eher seltener) Konsonantenbuchstaben die Funktion, silbische Laute darzustellen. Je nach Definition und Abgrenzung zwischen Vokalen und Konsonanten (vgl. oben) und dem Status von Halbvokalen kann dann formuliert werden, Vokalbuchstaben stehen auch für Konsonanten und Konsonantenbuchstaben für Vokale.

Im Deutschen betrifft das vor allem die Vokalbuchstaben I, U und Y, sowie die Konsonantenbuchstaben R, J und W. Bei einer an der Sonorität orientierten Definition der Vokale kommen auch noch die Konsonantenbuchstaben L, N und M hinzu. Eine besondere Rolle bei der Darstellung von Vokalen nimmt auch der Konsonantenbuchstabe H ein, allerdings nur in Kombination mit Vokalbuchstaben, nicht für sich allein.

Beispiele für unsilbisch, halbvokalisch bzw. konsonantisch verwendete I, U und Y: Mai, Aktie, Union, Harpyie; Mauer, eventuell, Biskuit, Etui, Qualle; Bayern, Yak, Maya, daneben gelegentlich auch weitere Vokalbuchstaben, z. B. O: Kakao, Coiffeur.

Beispiele für zwar unsilbische, aber eher halbvokalisch verwendete Konsonantenbuchstaben: bei R im Silbenendrand, vor allem nach langen Vokalen (mehr, vier, rührt); bei J lässt sich ganz allgemein streiten, ob der repräsentierte Laut eher Halbvokal oder Konsonant ist; auch bei W kann die Aussprache Richtung Halbvokal gehen.

Beispiele für die selteneren Fälle, in denen R, J und W als silbische Vokale verwendet werden: Zentaur, Matrjoschka, Rwanda.

Außerdem können Konsonantenbuchstaben in bestimmten Kombinationen ihren konsonantischen Charakter verlieren: z. B. in der häufigen Endung -er, aber auch z. B. in der Namensendung -ow. Hierher gehört dann auch die vielfältige Funktion des stummen H nach Vokalbuchstaben (als Dehnungs-h, als silbentrennendes h, …).

Verschiebungen

Die Unterschiede in der Aussprache der Vokalbuchstaben zwischen dem Englischen und den mit ihm verwandten Sprachen lassen sich auf die große Vokalverschiebung zurückführen. Nachdem der Buchdruck in England eingeführt und damit die Rechtschreibung mehr oder weniger standardisiert worden war, kam es zu einer Reihe dramatischer Veränderungen in der Aussprache der Vokalphoneme, die bis in die letzten Jahrhunderte andauerten, sich aber nicht in der Rechtschreibung niederschlugen. Dies hat zu zahlreichen Unstimmigkeiten bei der Schreibweise der englischen Vokallaute und der Aussprache der englischen Vokalbuchstaben geführt (und zur falschen Aussprache von Fremdwörtern und Namen durch Englischsprachige).

Audio-Beispiele

Systeme

Die Bedeutung der Vokale bei der Unterscheidung eines Wortes von einem anderen ist von Sprache zu Sprache unterschiedlich. Fast alle Sprachen haben mindestens drei phonemische Vokale, normalerweise /i/, /a/, /u/ wie im klassischen Arabisch und Inuktitut, obwohl Adyghe und viele Sepik-Sprachen ein vertikales Vokalsystem von /ɨ/, /ə/, /a/ haben. Nur sehr wenige Sprachen haben weniger Vokale, obwohl in einigen Arrernte-, Tscherkessischen und Ndu-Sprachen behauptet wird, dass sie nur zwei Vokale haben, /ə/ und /a/, wobei [ɨ] epenthetisch ist.

Es ist nicht einfach zu sagen, welche Sprache die meisten Vokale hat, da dies davon abhängt, wie sie gezählt werden. Zum Beispiel können lange Vokale, Nasalvokale und verschiedene Phonationen separat gezählt werden oder auch nicht; tatsächlich kann es manchmal unklar sein, ob die Phonation zu den Vokalen oder den Konsonanten einer Sprache gehört. Wenn man solche Dinge ignoriert und nur Vokale mit eigenen IPA-Buchstaben ("Vokalqualitäten") berücksichtigt, dann haben nur sehr wenige Sprachen mehr als zehn. Die germanischen Sprachen haben einige der größten Bestände: Das Standarddänische hat 11 bis 13 kurze Vokale (/(a) ɑ (ɐ) e ə ɛ i o ɔ u ø œ y/), während der Amstettener Dialekt des Bairischen Berichten zufolge dreizehn lange Vokale hat: /i y e ø ɛ œ æ ɶ a ɒ ɔ o u/. Innerhalb einer Sprachfamilie kann die Situation sehr unterschiedlich sein: Spanisch und Französisch sind zwei eng verwandte romanische Sprachen, aber Spanisch hat nur fünf reine Vokalqualitäten, /a, e, i, o, u/, während das klassische Französisch elf hat: /a, ɑ, e, ɛ, i, o, ɔ, u, y, œ, ø/ und vier nasale Vokale /ɑ̃/, /ɛ̃/, /ɔ̃/ und /œ̃/. Die Mon-Khmer-Sprachen Südostasiens haben ebenfalls ein großes Inventar, wie zum Beispiel die elf Vokale des Vietnamesischen: /i e ɛ ɐ a ə ɔ ɤ o ɯ u/. Die Wu-Dialekte haben das größte Inventar des Chinesischen; der Jinhui-Dialekt von Wu soll ebenfalls elf Vokale haben: zehn Grundvokale, /i y e ø ɛ ɑ ɔ o u ɯ/, plus das eingeschränkte /ɨ/; dabei sind die sieben Nasalvokale nicht mitgerechnet.

Einer der häufigsten Vokale ist [a̠]; es ist fast universell, dass eine Sprache mindestens einen offenen Vokal hat, obwohl die meisten Dialekte des Englischen ein [æ] und ein [ɑ]- und oft ein [ɒ] haben, alles offene Vokale, aber kein zentrales [a]. Einige Tagalog- und Cebuano-Sprecher haben [ɐ] anstelle von [a], und Dhangu Yolngu wird mit /ɪ ɐ ʊ/ beschrieben, ohne periphere Vokale. Das [i] ist ebenfalls sehr häufig, obwohl das Tehuelche nur die Vokale /e a o/ und keine nahen Vokale hat. Der dritte Vokal des arabischen Dreivokalsystems, /u/, ist deutlich weniger verbreitet. Ein großer Teil der nordamerikanischen Sprachen hat zufällig ein Viervokalsystem ohne /u/: /i, e, a, o/; Nahuatl und Navajo sind Beispiele dafür.

In den meisten Sprachen dienen die Vokale hauptsächlich dazu, verschiedene Lexeme zu unterscheiden, und nicht, wie in den semitischen Sprachen, verschiedene Flexionsformen desselben Lexems. Während zum Beispiel im Englischen man im Plural zu men wird, ist moon ein völlig anderes Wort.

Wörter ohne Vokale

In rhotischen Dialekten des Englischen, wie in Kanada und den Vereinigten Staaten, gibt es viele Wörter wie bird, learn, girl, church, worst, wyrm, myrrh, die von manchen Phonetikern als Wörter ohne Vokale, nur mit einem Silbenkonsonanten /ɹ̩/, analysiert werden. Andere hingegen analysieren diese Wörter als Wörter mit einem rhotischen Vokal, /ɝː/. Der Unterschied kann teilweise auf den Dialekt zurückzuführen sein.

Es gibt ein paar solcher Wörter, die zweisilbig sind, wie Cursor, Vorhang und Schildkröte: [ˈkɹ̩sɹ̩], [ˈkɹ̩tn̩] und [ˈtɹ̩tl̩] (oder [ˈkɝːsɚ], [ˈkɝːtən] und [ˈtɝːtəl]), und sogar ein paar, die dreisilbig sind, zumindest in einigen Akzenten, wie purpler [ˈpɹ̩. pl̩.ɹ̩], hurdler [ˈhɹ̩.dl̩.ɹ̩], gurgler [ˈɡɹ̩.ɡl̩.ɹ̩], und certainer [ˈsɹ̩.tn̩.ɹ̩].

Das Wort und zieht sich häufig zu einem einfachen nasalen 'n zusammen, wie in lock 'n key [ˌlɒk ŋ ˈkiː]. Wörter wie will, haben und ist werden regelmäßig zu 'll [l], 've [v] und 's [z] zusammengezogen. Keines dieser Wörter wird jedoch allein ohne Vokale ausgesprochen, sie sind also keine phonologischen Wörter. Zu den lautmalerischen Wörtern, die allein ausgesprochen werden können und keine Vokale oder Ars haben, gehören hmm, pst!, shh!, tsk! und zzz. Wie in anderen Sprachen auch, stehen Onomatopoetika außerhalb der normalen Phonotaktik des Englischen.

Es gibt andere Sprachen, die lexikalische Wörter ohne Vokallaute bilden. Im Serbokroatischen zum Beispiel können die Konsonanten [r] und [rː] (der Unterschied wird nicht geschrieben) als Silbenkern fungieren und einen steigenden oder fallenden Ton tragen; Beispiele sind der Zungenbrecher na vrh brda vrba mrda und geografische Namen wie Krk. Im Tschechischen und Slowakischen kann entweder [l] oder [r] für Vokale stehen: vlk [vl̩k] "Wolf", krk [kr̩k] "Hals". Ein besonders langes Wort ohne Vokale ist čtvrthrst mit zwei Silben (eine für jedes R) und scvrnkls, eine Verbform mit der Bedeutung "du hast (etw.) umgedreht" (z. B. eine Murmel). Ganze Sätze (in der Regel Zungenbrecher) können aus solchen Wörtern gebildet werden, z. B. Strč prst skrz krk, was so viel bedeutet wie "Steck dir den Finger in den Hals" (ausgesprochen [str̩tʃ pr̩st skr̩s kr̩k] (hören)), und Smrž pln skvrn zvlhl z mlh. (Hier hat zvlhl zwei Silben, die auf L basieren; und beachten Sie, dass die Präposition z aus einem einzigen Konsonanten besteht. Dies ist im Tschechischen nur bei Präpositionen der Fall, und sie sind normalerweise phonetisch mit dem folgenden Wort verbunden, verhalten sich also nicht wirklich wie vokallose Wörter.) Im Russischen gibt es auch Präpositionen, die aus einem einzigen Konsonanten bestehen, z. B. k, "zu", v, "in", und s, "mit". Bei diesen Formen handelt es sich jedoch eigentlich um Verkürzungen von ko, vo bzw. so, und diese Formen werden im modernen Russisch noch immer vor Wörtern mit bestimmten Konsonantengruppen verwendet, um die Aussprache zu erleichtern.

Im Kasachischen und in einigen anderen Turksprachen können Wörter ohne Vokalklänge entstehen, weil schwache Vokale reduziert werden. Ein gängiges Beispiel ist das kasachische Wort für eins: bir, ausgesprochen [br]. Bei sorgfältigen Sprechern kann jedoch der ursprüngliche Vokal erhalten bleiben, und die Vokale werden in der Rechtschreibung immer beibehalten.

In südlichen Varietäten des Chinesischen, wie Kantonesisch und Minnan, bestehen einige einsilbige Wörter ausschließlich aus Nasalen, wie [m̩˨˩] "nein" und [ŋ̩˩˧] "fünf".

Bisher waren alle diese Silbenkonsonanten, zumindest in den lexikalischen Wörtern, Sonoranten, wie [r], [l], [m] und [n], die ähnlich wie Vokale stimmhaft sind (sie können z. B. einen Ton tragen). Es gibt jedoch Sprachen mit lexikalischen Wörtern, die nicht nur keine Vokale, sondern auch keine Sonoranten enthalten, wie das (nicht-lexikalische) shh! im Englischen. Dazu gehören einige Berbersprachen und einige Sprachen des amerikanischen pazifischen Nordwestens, wie z. B. Nuxalk. Ein Beispiel aus letzterer Sprache ist scs "Robbenfett" (ausgesprochen [sxs], wie buchstabiert), und ein längeres Beispiel ist clhp'xwlhtlhplhhskwts' (ausgesprochen [xɬpʼχʷɬtʰɬpʰɬːskʷʰt͡sʼ]) "er hatte eine Bunchberry-Pflanze in seinem Besitz". (Weitere Beispiele finden Sie unter dem Nuxalk-Link). Berberische Beispiele sind /tkkststt/ "du hast es ausgezogen" und /tfktstt/ "du hast es gegeben". Einige Wörter können nur einen oder zwei Konsonanten enthalten: /ɡ/ "sein", /ks/ "auffressen". (Im Mandarin-Chinesischen werden Wörter und Silben wie und zhī phonemisch manchmal als syllabische Frikative und Affrikate beschrieben, /ś/ und /tʂ́/, aber diese haben ein stimmhaftes Segment, das den Ton trägt.) In der japanischen Sprache Miyako gibt es Wörter ohne stimmhafte Laute, wie ss 'Staub', kss 'Brust/Milch', pss 'Tag', ff 'ein Kamm', kff 'machen', fks 'bauen', ksks 'Monat', sks 'schneiden', psks 'ziehen'.

In einigen Analysen von Wandala wird berichtet, dass es keine phonemischen Vokale gibt.

Wörter, die nur aus Vokalen bestehen

Es ist nicht ungewöhnlich, dass kurze grammatikalische Wörter nur aus Vokalen bestehen, wie z. B. a und I im Englischen. Lexikalische Wörter sind im Englischen etwas seltener und beschränken sich im Allgemeinen auf eine einzige Silbe: eye, awe, owe, und in nicht-rhotischen Akzenten air, ore, err. Wörter mit nur einem Vokal und mehr als einer Silbe sind in der Regel Fremdwörter wie ai (zweisilbig: /ˈɑːi/) für das Mähnenfaultier oder Eigennamen wie Iowa (in einigen Akzenten: /ˈ..ə/).

In einigen anderen Sprachen, vor allem in den Bantusprachen und den polynesischen Sprachen, aber auch im Japanischen und in den finnischen Sprachen, sind Vokalsequenzen im Hiatus jedoch eher erlaubt. In diesen Sprachen gibt es in der Regel eine größere Vielfalt von Wörtern, die nur aus Vokalen bestehen. Im Suaheli (Bantu) gibt es beispielsweise aua "überblicken" und eua "reinigen" (beide drei Silben); im Japanischen aoi 青い "blau/grün" und oioi 追々 "allmählich" (drei und vier Silben); und im Finnischen aie "Absicht" und auo "offen!" (beide zwei Silben), obwohl einige Dialekte sie als aije und auvo aussprechen. In Urdu wird āye/aaie آئیے oder āyn آئیں 'kommen' verwendet. Das Hawaiianische und die polynesischen Sprachen im Allgemeinen haben ungewöhnlich viele solcher Wörter, wie z. B. aeāea (ein kleiner grüner Fisch), das aus drei Silben besteht: ae.āe.a. Bei den meisten langen Wörtern handelt es sich um Reduplikationen, die im Polynesischen recht produktiv sind: ioio 'Rillen', eaea 'Atem', uaua 'zäh' (alle vier Silben), auēuē 'weinen' (fünf Silben, von uē (uwē) 'weinen'), uoa oder uouoa 'falsche Meeräsche' (sp. Fisch, drei oder fünf Silben).

Abgrenzung zu den Konsonanten

Klassifiziert man Laute lediglich nach ihrer Artikulationsart, dann unterscheiden sich Vokale von Konsonanten allein dadurch, dass der Phonationsstrom bei Vokalen fast ungehindert durch das Ansatzrohr strömt (Genauer: Im Gegensatz zu Konsonanten ist die Konstriktion [Verengung] im Artikulationsraum nicht so stark, dass sie ein Geräusch erzeugte). Dieses Kriterium allein leistet jedoch noch keine Unterscheidung von Vokalen einerseits und halbvokalischen oder konsonantischen Approximanten andererseits.

Eine andere Möglichkeit ist die Klassifizierung nach akustischen Kriterien, vor allem nach ihrer Sonorität (Schallfülle). Danach sind die meisten Konsonanten Geräusche ohne Sonorität, während es sich bei Vokalen und einigen Konsonanten wie beispielsweise dem l-, m-, n-, ng- und (zum Teil) r-Laut um Klänge handelt. Diese sind also sonorant.

Sonorität bzw. Schallfülle ist eine wichtige Eigenschaft hinsichtlich der Funktion eines Lautes als Silbenträger: je sonorer ein Laut ist, desto deutlicher hebt er sich von den anderen ihn umgebenden Lauten ab. Sonorante Laute können deshalb Silbenträger sein.

In einigen Sprachen nehmen l, m, n, ng, aber auch r silbischen Charakter an und tragen den Hauptton, beispielsweise l in Plzeň auf Tschechisch und r in Krk auf Serbokroatisch.

Auch im Deutschen kommen die Laute l, m, n, ng silbisch vor, allerdings nur in unbetonter Silbe, so in der Standardaussprache bei den Endungen -em, -en und -el/-l nach Konsonanten (silbischer m-Laut: „großem“, „leben“, „Bremen“; silbischer n-Laut: „reden“, silbischer ng-Laut: „liegen“, silbischer l-Laut: „Apfel“, „Dirndl“).

Vokale im Deutschen

Übersicht

Das Deutsche ist, was das Lautinventar im Sprachvergleich betrifft, verhältnismäßig reich an Vokalen. Zu den gesprochenen Vokalen (Monophthongen) des Standarddeutschen gehören:

wissenschaftliche Bezeichnung IPA-Zeichen Beispiele
lang kurz
in betonten
Silben
in betonten
Silben
in unbetonten
Silben
in Reduktions-
silben
Ungerundeter geschlossener Vorderzungenvokal [i], [i:] Lied wieso, direkt
Ungerundeter zentralisierter fast geschlossener Vorderzungenvokal [ɪ] frisch Ärztin
Ungerundeter halbgeschlossener Vorderzungenvokal [e], [e:] Schnee lebendig, Debatte
Ungerundeter halboffener Vorderzungenvokal [ɛ], [ɛ:] Mädchen nett verlieren
Ungerundeter offener Zentralvokal [a], [a:] Tal Blatt daheim, Banane
Mittlerer Zentralvokal (Schwa) [ə] Blume, gesagt, behalten
Fast offener Zentralvokal [ɐ] Leder
Gerundeter halbgeschlossener Hinterzungenvokal [o], [o:] Ton sodass, Rosine
Gerundeter halboffener Hinterzungenvokal [ɔ] Rost Kosmos
Gerundeter geschlossener Hinterzungenvokal [u], [u:] gut zuvor, kulant
Gerundeter zentralisierter fast geschlossener Hinterzungenvokal [ʊ] Mund Neigung
Gerundeter geschlossener Vorderzungenvokal [y], [y:] kühl Büro, Physik
Gerundeter zentralisierter fast geschlossener Vorderzungenvokal [ʏ] hübsch Abkürzung
Gerundeter halbgeschlossener Vorderzungenvokal [ø], [ø:] schön Ökonomie
Gerundeter halboffener Vorderzungenvokal [œ] löschen Esslöffel

Siehe auch: Diphthonge im Deutschen

Vokale im Sprachvergleich

IPA-Zeichen deutsch englisch
(BE)
französisch
Wortbeispiele
[iː] Igel speak
[i] direkt fille
[ɪ] frisch give
[eː] Schnee
[e] lebendig nez
[ə] Blume maiden fenêtre
[ɛː] Mädchen
[ɛ] nett tell mais
[ɛ̃] pain
[ɜ:] word
[æ] cat
[aː] Vater
[a] Katze patte
[ɐ] Bruder butter
[ɑ:] calm
[ɑ] pâte (selten)
[ɑ̃] avant
[ɒ] hot
[oː] Ton
[o] Rosine eau
[ɔ:] talk
[ɔ] Sonne porte
[ɔ̃] bon
[uː] gut moon
[u] kulant coup
[ʊ] Mund book
[yː] müde
[y] Büro nu
[ʏ] hübsch
[øː] König
[ø] Ökonomie feu
[œ] löschen fleur
[œ̃] un

Englisches [ɐ] wird am häufigsten /ʌ/ transkribiert.

Das Englische ist deutlich ärmer an Vokalphonen (nicht allerdings an Vokalphonemen) als das Deutsche, besitzt dafür aber mehr Diphthonge (take, go, night, flower, boy, here, there, sure).

Spanisch

In der spanischen Sprache, genauer dem Kastilischen, existieren nur die fünf Vokalphoneme /a e i o u/. Dies unterscheidet das Kastilische von den anderen iberoromanischen Sprachen Portugiesisch, Galicisch und Katalanisch (mit Valencianisch, wobei hier die Unterschiede zum Kastilischen geringer sind). Der a-Laut ähnelt dem deutschen kurzen (offenen) a, während i-Laut und u-Laut den langen (geschlossenen) Vokalen im Deutschen gleichen. Der e-Laut und der o-Laut des Spanischen haben eine mittlere Höhe und daher kein genaues Gegenstück im Hochdeutschen.

Französisch

Der ungespannte (mit weniger Muskelanspannung geformte) i-Laut (wie in Wind), der ungespannte ü-laut (wie in wünscht), der ungespannte u-Laut (wie in Wunsch) und der a-ähnliche, sogenannte tiefe Schwa-Laut (wie der -er geschriebene Vokal in Mutter) fehlen im Französischen. Ansonsten besitzt es die gleichen oralen (mit dem Mund geformten) Vokale wie das Deutsche plus vier Nasalvokale. Allerdings kennt das Französische nicht den systematischen bedeutungsverändernden Unterschied zwischen kurzen ungespannten und langen gespannten Vokalen, der für das Deutsche typisch ist (wie in Wahl/Wall, den/denn, ihn/in, Ole/Olle, pult/Pult, Tönchen/Tönnchen, Fühler/Füller).