Prosodie

Aus besserwiki.de

In der Linguistik befasst sich die Prosodie (/ˈprɒsədi, ˈprɒzədi/) mit Elementen der Sprache, die nicht aus einzelnen phonetischen Segmenten (Vokalen und Konsonanten) bestehen, sondern Eigenschaften von Silben und größeren Einheiten der Sprache sind, einschließlich sprachlicher Funktionen wie Intonation, Betonung und Rhythmus. Solche Elemente werden als Suprasegmentale bezeichnet.

Prosodie kann Merkmale des Sprechers oder der Äußerung widerspiegeln: ihren emotionalen Zustand, die Form der Äußerung (Aussage, Frage oder Befehl), das Vorhandensein von Ironie oder Sarkasmus, Betonung, Kontrast und Fokus. Sie kann Elemente der Sprache widerspiegeln, die nicht durch die Grammatik oder die Wahl des Vokabulars kodiert sind.

ABC oder Namenbüchlein von 1741: zur Prosodie

Teile werden durch die umgangssprachlichen Ausdrücke Betonung und Tonfall bezeichnet, die allerdings keine Termini sind.

Wie viele Termini dieser Art bezeichnet Prosodie sowohl einen Ausschnitt des Objektbereichs — also die genannten sprachlichen Eigenschaften — als auch eine Subdisziplin einer wissenschaftlichen Disziplin — in diesem Falle der Phonologie und der Phonetik. Entsprechend ist Prosodie Gegenstand sowohl der Linguistik als auch der Phonetik.

Attribute der Prosodie

Bei der Untersuchung prosodischer Aspekte der Sprache wird üblicherweise zwischen auditiven (subjektive Eindrücke, die im Kopf des Hörers entstehen) und objektiven (physikalische Eigenschaften der Schallwelle und physiologische Merkmale der Artikulation, die objektiv gemessen werden können) Messgrößen unterschieden. Die auditive (subjektive) und die objektive (akustische und artikulatorische) Messung der Prosodie entsprechen sich nicht auf lineare Weise. Die meisten Studien zur Prosodie beruhen auf der auditiven Analyse unter Verwendung auditiver Skalen.

Es gibt keine einheitliche Anzahl von prosodischen Variablen. In auditiver Hinsicht sind die wichtigsten Variablen:

  • die Tonhöhe der Stimme (zwischen tief und hoch variierend)
  • die Länge der Laute (zwischen kurz und lang variierend)
  • die Lautstärke oder Prominenz (variiert zwischen leise und laut)
  • Klangfarbe oder Stimmqualität (Qualität des Klangs)

In der Akustik entsprechen diese Begriffe in etwa der:

  • der Grundfrequenz (gemessen in Hertz, oder Zyklen pro Sekunde)
  • Dauer (gemessen in Zeiteinheiten wie Millisekunden oder Sekunden)
  • Intensität oder Schalldruckpegel (gemessen in Dezibel)
  • spektrale Eigenschaften (Verteilung der Energie in verschiedenen Teilen des hörbaren Frequenzbereichs)

Verschiedene Kombinationen dieser Variablen werden für die sprachlichen Funktionen von Intonation und Betonung sowie für andere prosodische Merkmale wie Rhythmus und Tempo genutzt. Weitere prosodische Variablen wurden untersucht, darunter Stimmqualität und Pausen. Das Verhalten der prosodischen Variablen kann entweder als Konturen über die prosodische Einheit oder durch das Verhalten der Grenzen untersucht werden.

Phonologie

Prosodische Merkmale werden als suprasegmental bezeichnet, da sie Eigenschaften von Sprecheinheiten sind, die größer sind als das einzelne Segment (obwohl es in Ausnahmefällen vorkommen kann, dass ein einzelnes Segment eine Silbe und damit sogar eine ganze Äußerung ausmacht, z. B. "Ah!"). Es ist notwendig, zwischen den persönlichen Hintergrundmerkmalen, die zur Stimme einer Person gehören (z. B. ihre gewohnte Tonhöhe), und den unabhängig variablen prosodischen Merkmalen zu unterscheiden, die kontrastiv zur Bedeutungsübertragung verwendet werden (z. B. die Verwendung von Tonhöhenveränderungen, um den Unterschied zwischen Aussagen und Fragen anzuzeigen). Persönliche Merkmale sind sprachlich nicht signifikant. Es ist nicht möglich, mit Sicherheit zu sagen, welche Aspekte der Prosodie in allen Sprachen zu finden sind und welche spezifisch für eine bestimmte Sprache oder einen bestimmten Dialekt sind.

Intonation

Einige Autoren (z. B. O'Connor und Arnold) haben die Intonation ausschließlich in Bezug auf die Tonhöhe beschrieben, während andere (z. B. Crystal) vorschlagen, dass das, was als "Intonation" bezeichnet wird, in Wirklichkeit ein Amalgam aus mehreren prosodischen Variablen ist. Die Form der englischen Intonation wird häufig auf drei Aspekte zurückgeführt:

  • Die Aufteilung der Sprache in Einheiten
  • Die Hervorhebung bestimmter Wörter und Silben
  • Die Wahl der Tonhöhenbewegung (z. B. Fallen oder Steigen)

Diese Aspekte werden manchmal auch als Tonalität, Tonizität und Tonus (und zusammen als "die drei T's") bezeichnet.

Eine weitere, mit der Tonhöhe zusammenhängende Variation ist der Tonhöhenbereich; Sprecher sind in der Lage, mit einem breiten Tonhöhenbereich zu sprechen (dies wird in der Regel mit Erregung in Verbindung gebracht), während sie zu anderen Zeiten einen engen Tonhöhenbereich haben. Man sagt, dass die englische Sprache von Tonhöhenveränderungen Gebrauch macht; man glaubt, dass es in bestimmten Kontexten sinnvoll ist, die Intonation in den höheren oder tieferen Teil des Tonhöhenbereichs zu verlagern.

Betonung

Aus der Sicht der Wahrnehmung dient die Betonung dazu, eine Silbe hervorzuheben; die Betonung kann in Bezug auf einzelne Wörter (als "Wortbetonung" oder lexikalische Betonung bezeichnet) oder in Bezug auf größere Spracheinheiten (traditionell als "Satzbetonung" bezeichnet, aber angemessener als "prosodische Betonung") untersucht werden. Betonte Silben werden durch mehrere Variablen hervorgehoben, einzeln oder in Kombination. Betonung wird typischerweise mit Folgendem in Verbindung gebracht:

  • Hervorhebung der Tonhöhe, d. h. ein Tonhöhenniveau, das sich von dem benachbarter Silben unterscheidet, oder eine Tonhöhenverschiebung
  • erhöhte Länge (Dauer)
  • erhöhte Lautstärke (Dynamik)
  • Unterschiede in der Klangfarbe: Im Englischen und in einigen anderen Sprachen ist die Betonung mit Aspekten der Vokalqualität verbunden (deren akustisches Korrelat die Formantfrequenzen oder das Spektrum des Vokals sind). Unbetonte Vokale sind tendenziell zentralisiert im Vergleich zu betonten Vokalen, die in der Regel eine eher periphere Qualität aufweisen.

Diese Anhaltspunkte für die Betonung sind nicht gleich stark. Cruttenden schreibt zum Beispiel: "Wahrnehmungsexperimente haben eindeutig gezeigt, dass, jedenfalls im Englischen, die drei Merkmale (Tonhöhe, Länge und Lautstärke) eine Wichtigkeitsskala für die Hervorhebung von Silben bilden, wobei die Tonhöhe am wirksamsten und die Lautstärke am wenigsten wirksam ist".

Wenn die Betonung der Tonhöhe der wichtigste Faktor ist, wird die daraus resultierende Betonung oft als Akzent und nicht als Betonung bezeichnet.

Die Rolle der Betonung bei der Identifizierung von Wörtern oder bei der Interpretation von Grammatik und Syntax ist von Sprache zu Sprache sehr unterschiedlich.

Rhythmus

Da die Eigenschaften, die unter Prosodie fallen, eben das gemeinsam haben, dass sie auf einer lautlichen Ebene „oberhalb“ des Segments angesiedelt sind, werden sie auch suprasegmentale Merkmale (Suprasegmentalia) genannt. Entsprechend unterscheidet man die segmentale von der suprasegmentalen Ebene. z. B. sind die deutschen Wörter umfahren ‚[etwas] durch Dagegenfahren zu Fall bringen‘ und umfahren ‚um [etwas] herumfahren‘ auf der segmentalen Ebene gleich zusammengesetzt (und auch homograph), auf der suprasegmentalen jedoch verschieden (und daher nicht homophon); denn das erstere hat den Wortakzent auf der ersten, das letztere dagegen auf der zweiten Silbe.

Die Suprasegmentalia haben im Einzelnen folgende akustische Basis:

  1. Akzent: Schallintensität, also in erster Linie relative Lautstärke, in zweiter relative Tonhöhe
  2. Ton: relative Tonhöhe (Grundfrequenz) und deren Verlauf innerhalb der Silbe
  3. Intonation und Satzmelodie: Verlauf der Tonhöhe über syntaktischen Einheiten
  4. Quantität: relative zeitliche Dauer sprachlicher Einheiten
  5. Tempo, Rhythmus und Pausen: Zuweisung von sprachlichen Einheiten und deren Akzent zu aufeinander folgenden Zeitspannen.

Die Termini werden im folgenden Abschnitt erläutert.

Pause

Ob stimmhaft oder stimmlos, die Pause ist eine Form der Unterbrechung der artikulatorischen Kontinuität, wie z. B. eine offene oder terminale Verbindung. In der Konversationsanalyse wird üblicherweise die Länge der Pausen notiert. Eine Herausforderung ist die Unterscheidung zwischen auditivem Zögern und stummen Pausen. Die Gegenüberstellung von Übergängen innerhalb und außerhalb von Wortteilen kann bei der Identifizierung von Pausen helfen.

Es gibt eine Vielzahl von "gefüllten" Pausentypen. Zu den formelhaften Pausenfüllern gehören "wie", "äh" und "ähm", und zu den paralinguistischen expressiven Atempausen gehören der Seufzer und das Keuchen.

Obwohl sie mit der Atmung zusammenhängen, können Pausen auch kontrastiven sprachlichen Inhalt enthalten, wie die Perioden zwischen einzelnen Wörtern in englischen Werbetexten, die manchmal gesetzt werden, um einen hohen Informationsgehalt zu kennzeichnen, z. B. "Quality. Service. Wert."

Chunking

Pausen oder ihr Fehlen tragen zur Wahrnehmung von Wortgruppen oder Chunks bei. Beispiele hierfür sind die Phrase, das Phrasem, die Konstituente oder die Interjektion. Chunks heben in der Regel lexikalische Elemente oder feststehende Redewendungen hervor. Die Chunking-Prosodie ist in jeder vollständigen Äußerung vorhanden und kann einer syntaktischen Kategorie entsprechen, muss es aber nicht. Der bekannte englische Chunk "Know what I mean?" klingt wie ein einziges Wort ("No-whuta-meen?"), weil die Artikulation benachbarter Wortsilben verwischt oder überstürzt wird, wodurch die potenziellen offenen Verbindungen zwischen den Wörtern zu geschlossenen Verbindungen werden.

Kognitive Aspekte

Der Intonation wird im Englischen und in anderen Sprachen eine Reihe von Wahrnehmungsfunktionen zugeschrieben, die zum Erkennen und Verstehen von Sprache beitragen.

Grammatik

Man geht davon aus, dass die Prosodie den Hörer bei der Analyse kontinuierlicher Sprache und bei der Erkennung von Wörtern unterstützt, indem sie Hinweise auf die syntaktische Struktur, grammatikalische Grenzen und den Satztyp liefert. Die Grenzen zwischen den Intonationseinheiten sind oft mit grammatikalischen oder syntaktischen Grenzen verbunden; diese werden durch prosodische Merkmale wie Pausen und Verlangsamung des Tempos sowie durch "Tonhöhen-Reset" markiert, bei dem die Tonhöhe des Sprechers auf das für den Beginn einer neuen Intonationseinheit typische Niveau zurückkehrt. Auf diese Weise können potenzielle Mehrdeutigkeiten aufgelöst werden. Zum Beispiel ist der Satz "Sie haben Bob und Bill eingeladen und Al wurde abgelehnt" mehrdeutig, wenn er geschrieben wird, obwohl das Hinzufügen eines Kommas nach "Bob" oder "Bill" die Mehrdeutigkeit des Satzes beseitigt. Wird der Satz jedoch laut vorgelesen, wird die Mehrdeutigkeit durch prosodische Hinweise wie Pausen (die den Satz in Abschnitte unterteilen) und Änderungen der Intonation verringert oder aufgehoben. Die Verschiebung der Intonationsgrenze führt in Fällen wie dem obigen Beispiel dazu, dass sich die Interpretation des Satzes ändert. Dieses Ergebnis wurde in Studien sowohl auf Englisch als auch auf Bulgarisch festgestellt. Die Forschung im Bereich der englischen Worterkennung hat gezeigt, dass die Prosodie eine wichtige Rolle spielt.

Schwerpunkt

Intonation und Betonung arbeiten zusammen, um wichtige Wörter oder Silben hervorzuheben, um sie zu kontrastieren und zu fokussieren. Dies wird manchmal als die akzentuierende Funktion der Prosodie bezeichnet. Ein bekanntes Beispiel ist der mehrdeutige Satz "Ich habe nie gesagt, dass sie mein Geld gestohlen hat", bei dem es sieben Bedeutungsänderungen gibt, je nachdem, welches der sieben Wörter stimmlich hervorgehoben wird.

Diskurs

Die Prosodie spielt eine Rolle bei der Regulierung der Gesprächsinteraktion und bei der Signalisierung der Diskursstruktur. David Brazil und seine Mitarbeiter untersuchten, wie die Intonation anzeigen kann, ob es sich um neue oder bereits bekannte Informationen handelt, ob ein Sprecher in einem Gespräch dominant ist oder nicht und wann ein Sprecher den Zuhörer auffordert, einen Beitrag zum Gespräch zu leisten.

Emotionen

Die Prosodie ist auch wichtig, um Emotionen und Haltungen zu signalisieren. Wenn dies unwillkürlich geschieht (z. B. wenn die Stimme durch Angst oder Furcht beeinflusst wird), ist die prosodische Information sprachlich nicht von Bedeutung. Wenn der Sprecher jedoch seine Sprache absichtlich variiert, um beispielsweise Sarkasmus zu signalisieren, werden in der Regel prosodische Merkmale verwendet. Das nützlichste prosodische Merkmal bei der Erkennung von Sarkasmus ist eine Verringerung der mittleren Grundfrequenz im Vergleich zu anderer Sprache für Humor, Neutralität oder Aufrichtigkeit. Prosodische Merkmale sind zwar wichtig, um Sarkasmus zu erkennen, aber auch Kontextmerkmale und gemeinsames Wissen sind von Bedeutung.

Charles Darwin vertrat in The Descent of Man die Ansicht, dass die emotionale Prosodie der Entwicklung der menschlichen Sprache vorausging: "Sogar Affen drücken starke Gefühle in verschiedenen Tönen aus - Wut und Ungeduld durch tiefe, Angst und Schmerz durch hohe Töne." Muttersprachler, die Schauspielern zuhörten, die einen gefühlsneutralen Text lasen und dabei Emotionen projizierten, erkannten in 62 % der Fälle Glück, in 95 % Wut, in 91 % Überraschung, in 81 % Traurigkeit und in 76 % einen neutralen Ton. Bei der Verarbeitung einer Datenbank mit dieser Sprache durch einen Computer ermöglichten segmentale Merkmale eine Erkennung von Glück und Ärger von über 90 %, während suprasegmentale prosodische Merkmale nur eine Erkennung von 44 % bis 49 % ermöglichten. Das Gegenteil galt für Überraschung, die nur in 69% der Fälle durch segmentale Merkmale und in 96% der Fälle durch suprasegmentale Prosodie erkannt wurde. In einer typischen Konversation (ohne die Stimme eines Schauspielers) kann die Erkennung von Emotionen ziemlich niedrig sein, in der Größenordnung von 50 %, was die von einigen Autoren befürwortete komplexe Beziehungsfunktion von Sprache behindert. Aber auch wenn der emotionale Ausdruck durch die Prosodie nicht immer bewusst erkannt werden kann, kann der Tonfall im Gespräch weiterhin unbewusste Auswirkungen haben. Diese Art des Ausdrucks beruht nicht auf sprachlichen oder semantischen Effekten und kann daher vom traditionellen sprachlichen Inhalt isoliert werden. Die Fähigkeit einer Durchschnittsperson, die Implikatur emotionaler Prosodie in Gesprächen zu dekodieren, ist nachweislich etwas ungenauer als die traditionelle Fähigkeit zur Unterscheidung von Gesichtsausdrücken; die spezifische Dekodierfähigkeit variiert jedoch je nach Emotion. Es wurde festgestellt, dass diese Emotionen in allen Kulturen allgegenwärtig sind, da sie in allen Kulturen verwendet und verstanden werden. Die verschiedenen Emotionen und ihre allgemeinen experimentellen Identifikationsraten sind wie folgt:

  • Wut und Traurigkeit: Hohe Erkennungsrate
  • Furcht und Freude: Mittlere Erkennungsrate
  • Ekel: Schlechte Erkennungsrate

Die Prosodie einer Äußerung wird von Zuhörern verwendet, um Entscheidungen über die emotionale Wirkung der Situation zu treffen. Ob eine Person die Prosodie als positiv, negativ oder neutral dekodiert, spielt eine Rolle bei der Art und Weise, wie eine Person einen Gesichtsausdruck dekodiert, der eine Äußerung begleitet. Je mehr sich der Gesichtsausdruck dem neutralen Bereich annähert, desto mehr beeinflusst die prosodische Interpretation die Deutung des Gesichtsausdrucks. Eine Studie von Marc D. Pell ergab, dass 600 ms prosodischer Informationen notwendig sind, damit Hörer den affektiven Ton der Äußerung erkennen können. Bei einer geringeren Länge reichten die Informationen nicht aus, um den emotionalen Kontext der Äußerung zu verarbeiten.

Kindersprache

Einzigartige prosodische Merkmale wurden bei der kindlichen Sprache (infant-directed speech, IDS) festgestellt, die auch als Babysprache, kindliche Sprache (child-directed speech, CDS) oder "motherese" bezeichnet wird. Erwachsene, insbesondere Betreuungspersonen, die mit kleinen Kindern sprechen, neigen dazu, die kindliche Sprache zu imitieren, indem sie eine höhere und variablere Tonlage sowie eine übertriebene Betonung verwenden. Es wird angenommen, dass diese prosodischen Merkmale Kindern helfen, Phoneme zu erwerben, Wörter zu segmentieren und Satzgrenzen zu erkennen. Und obwohl es keine Beweise dafür gibt, dass kindliche Sprache für den Spracherwerb notwendig ist, wurden diese spezifischen prosodischen Merkmale in vielen verschiedenen Sprachen beobachtet.

Aprosodie

Eine Aprosodie ist eine erworbene oder entwicklungsbedingte Beeinträchtigung des Verständnisses oder der Erzeugung von Emotionen, die in der gesprochenen Sprache vermittelt werden. Aprosodie geht oft mit der Unfähigkeit einher, Variationen in der Sprache richtig zu nutzen, insbesondere mit Defiziten bei der Fähigkeit, Tonhöhe, Lautstärke, Intonation und Rhythmus der Wortbildung genau zu modulieren. Dies wird manchmal bei Personen mit Asperger-Syndrom beobachtet.

Beteiligte Gehirnregionen

Die Erzeugung dieser nonverbalen Elemente erfordert intakte motorische Bereiche des Gesichts, des Mundes, der Zunge und des Rachens. Dieser Bereich ist mit den Brodmann-Arealen 44 und 45 (Broca-Areal) des linken Frontallappens verbunden. Eine Schädigung der Areale 44/45, insbesondere in der rechten Hemisphäre, führt zu motorischen Aprosodien, wobei die nonverbalen Elemente der Sprache (Gesichtsausdruck, Tonfall, Rhythmus der Stimme) gestört sind.

Das Verstehen dieser nonverbalen Elemente erfordert ein intaktes und gut funktionierendes rechtshemisphärisches perisylvisches Areal, insbesondere das Brodmann-Areal 22 (nicht zu verwechseln mit dem entsprechenden Areal in der linken Hemisphäre, das das Wernicke-Areal enthält). Eine Schädigung des rechten inferioren frontalen Gyrus führt zu einer verminderten Fähigkeit, Emotionen oder Betonungen durch Stimme oder Gesten zu vermitteln, und eine Schädigung des rechten superioren temporalen Gyrus führt zu Problemen, Emotionen oder Betonungen in der Stimme oder den Gesten anderer zu verstehen. Das rechte Brodmann-Areal 22 hilft bei der Interpretation der Prosodie, und eine Schädigung führt zu sensorischen Aprosodien, so dass der Patient nicht in der Lage ist, Veränderungen in Stimme und Körpersprache zu verstehen.

Herkunft des Ausdrucks

Der Ausdruck Prosodie (auch Prosodik) ist ein Fremdwort von lateinisch prosodia aus griechisch prosōdía (προσῳδία). Die enthaltenen Wurzeln sind pros (πρός) ‚hinzu‘ und ōd- (ᾠδ-) ‚singen‘; die Grundbedeutung ist also etwa ‚Hinzugesang‘. Der Begriff bezog sich vor allem auf das phonetisch richtige Vorlesen von Dichtung und umfasste auch den oben mitaufgeführten Ton. Auf dem griechischen Ausdruck basiert die lateinische Lehnübersetzung accentus. Da es jedoch im Lateinischen keinen Ton in diesem Sinne gibt, wurde der Begriff accentus auch eingeengt auf den Teil der Prosodie, den auch der Terminus „Akzent“ bezeichnet.

Prosodie und Akustik

Grundfrequenz

Die Intonation einer Sprache lässt sich akustisch gesehen mit der Grundfrequenz (Einheit ist Hertz) einer Stimme beschreiben (bzw. dem Verlauf der Grundfrequenz, sogenannten Grundfrequenzkonturen).

Dauer

Prosodische Dauermerkmale wie Rhythmus, Sprechgeschwindigkeit, Pausen, Gedehntheit etc. lassen sich durch Messung der zeitlichen Länge dieser Signalabschnitte oder durch Bildung von Mittelwerten (mittlere Sprechgeschwindigkeit) messen. Oft werden zum Beispiel erst inkrementell Phonemlängen bestimmt und daraus dann Silbenlängen. Da sich diese Längen von Sprecher zu Sprecher unterscheiden können, müssen diese Längen normiert werden.

Energie

Energiemerkmale beschreiben die Schallintensität (in dB) eines Sprachsignals. In der Mustererkennung wird oft die Momentanenergie auf Frameebene berechnet, also die Energie in einem kleinen Ausschnitt des Sprachsignals. Mittels dieser Energiemerkmale kann zum Beispiel erkannt werden, ob ein Sprachsignalabschnitt eine Stimme oder nur Stille enthält (Unterscheidung zwischen stimmhaft und stimmlos). In der Internettelefonie VoIP werden so Abschnitte, welche keine Stimme enthalten, gar nicht erst übertragen, um Bandbreite zu sparen (allerdings bezeichnet man in der Technik die relevante Messgröße als Amplitude).

Prosodie und Psychoakustik

In der Psychoakustik werden menschliche Wahrnehmungen in Vergleichsexperimenten mit akustischen Einheiten in Zusammenhang gebracht.

Tonhöhe

Die Tonhöhe oder die Tonlage beschreiben die wahrgenommene Höhe eines Tons verglichen mit einem 1-kHz-Signal einer bestimmten Schallintensität. Sie wird in Hörversuchen festgestellt. Die empfundene Tonhöhe steht in einem nichtlinearen Verhältnis zur Frequenz eines Tons. Bis 500 Hz ist auf der Zwickerskala noch ein lineares Verhältnis vorhanden, dann führt jedoch eine Verdopplung der Frequenz eines Tons nicht mehr zu einer Verdopplung der wahrgenommenen Tonhöhe. Die Einheit der Tonhöhe ist mel. Die Veränderungen in der Tonhöhe korrelieren in der Prosodie mit der Intonation.

Lautheit

Die Lautheit ist eine Empfindungsgröße, die ebenfalls in Hörversuchen festgestellt wird, weil sie nicht nur vom Schalldruck, sondern auch von der Frequenz und weiteren Einflussfaktoren abhängt. Die Einheit der Lautheit ist sone. Ein sone ist definiert als die empfundene Lautstärke eines 1000-Hz-Sinustons bei 40 dB SPL (Schalldruckpegel, Sound Pressure Level).

Unterschiede in der wahrgenommenen Lautheit werden in der Prosodie oft zur Akzentuierung eingesetzt.

Prosodie und Schriftsprache

In der Schriftsprache korrelieren Schriftauszeichnung (kursiv, fett, Schriftgröße, Schriftart) mit dem prosodischen Merkmal Akzent und der Intonation, Interpunktion mit dem Sprechrhythmus sowie mit Pausen. So wird nach einem Punkt oder einem Komma in der Regel auch eine sprachliche Pause eingelegt. Auch Gedankenstriche, die einen Satzteil einschieben, werden beim Lesen durch Pausen ersetzt und mit veränderter Intonation gelesen. Fragezeichen oder Rufzeichen markieren Frage- bzw. Ausrufesätze und werden ebenfalls durch spezielle Intonation am Ende des Satzes markiert.

Funktionen der Prosodie

Korrelation prosodischer Merkmale

Prosodische Eigenschaften wie Veränderungen in der Intonation, in der Lautstärke und im Rhythmus treten öfter synchron auf anstatt einzeln, sind also korreliert. So wird die Hervorhebung eines Wortes zum Beispiel dadurch erreicht, dass die Intonation (bzw. die Tonhöhe) verändert wird, die Sprechgeschwindigkeit gleichzeitig reduziert wird (zum Beispiel in dem vor dem Wort eine Sprechpause eingelegt wird) und das Wort mit erhöhter Lautstärke ausgesprochen wird.

Auflösung von Ambiguitäten

Syntaktische Ebene

Die Wortfolge

  • Erna kommt nicht aber Erwin.

entspricht zwei verschiedenen syntaktischen Konstruktionen, nämlich

a) Erna kommt, nicht aber Erwin.

b) Erna kommt nicht, aber Erwin.

Die beiden Versionen unterscheiden sich u. a. darin, dass #a eine Sprechpause hinter kommt, #b diese Pause jedoch hinter nicht hat. In diesem Falle reflektiert die Interpunktion die Prosodie.

Die Wortfolge

  • Der Mann sah die Frau mit dem Fernglas.

entspricht zwei verschiedenen syntaktischen Konstruktionen, nämlich

a) der Mann sah [ die Frau mit dem Fernglas ] (die mit Fernglas ausgestattete Frau)

b) der Mann sah [ die Frau ] [ mit dem Fernglas ] (er blickte durch ein Fernglas)

Diese beiden Versionen sind in gewöhnlicher Sprechweise nicht einmal durch die Prosodie verschieden. Man kann aber versuchen, Version #b durch starken Intonationsbruch mit einer Sprechpause hinter Frau zu verdeutlichen.

Lexikalische Ebene

Neben solchen Paaren wie den homographen, nicht jedoch homophonen Verben umfahren stehen im Deutschen weitere wie übersetzen, unterstellen, überlaufen usw. (Sie sind übrigens nur in einigen Flexionsformen homograph, nicht jedoch z. B. im Partizip: (hat) übersetzt vs. übergesetzt.) Außerdem gibt es Homographen wie Tenor, was mit Akzent auf der ersten Silbe "Gehalt", mit Akzent auf der zweiten jedoch "hohe männliche Stimmlage" bedeutet.

Pragmatische Ebene

  • Das ist aber kalt hier.

Je nach Aussprache des Satzes kann angedeutet werden, dass es nur eine Aussage über die Temperatur ist (monotone Stimme), eine Aufforderung, ein Fenster zu schließen (negative Klangfarbe, Betonung des Wortes kalt) oder nur die Klage über diesen als negativ empfundenen Zustand, der nicht zu ändern ist. Durch eine starke Betonung auf dem Wort „Das“ kann die Aussage auch ironisch gemeint sein. Somit kann die Funktion eines Sprechaktes besser verdeutlicht werden.

Dialogebene

Auf Dialogebene lassen sich Satz- oder Phrasengrenzen markieren, sodass Dialoge in sinnvolle Abschnitte unterteilt werden können. So können sprachliche Handlungen strukturiert werden. Als bekannt vorausgesetzte Informationen werden dabei deakzentuiert (gleichbleibende Intonation), wichtige Informationen jedoch akzentuiert.

Prosodieebenen

Nach Hans Günther Tillmann unterscheidet man zwischen A-, B- und C-Prosodie.

A-Prosodie

Die A-Prosodie kann vom Sprecher willkürlich gesteuert werden. Parameter der A-Prosodie sind unter anderem die Intonation, Pausen und Lautstärkeänderungen. Mit Hilfe der A-Prosodie werden beispielsweise die Satzintention übermittelt und Betonungen gesetzt. Des Weiteren dient sie der Auflösung von syntaktischen und lexikalischen Ambiguitäten. Auch die Gefühle und die körperliche Verfassung des Sprechers können durch die A-Prosodie übermittelt werden.

Sprache, aus der man die A-Prosodie entfernt, wird allgemein als mechanisch empfunden („Computerstimme“).

B-Prosodie

Die B-Prosodie wird unwillkürlich erzeugt und bezeichnet den der Muttersprache eigenen Silbenrhythmus. Sie regelt die Abfolge von stimmhaften und stimmlosen Abschnitten. Durch die B-Prosodie erkennen wir ein Signal als Sprache.

C-Prosodie

Die C-Prosodie bezeichnet die intrinsische dynamische Struktur der Sprachlaute, das heißt beispielsweise die korrekten Übergänge zwischen benachbarten Lauten, die Abfolge von Pause, Burst und Aspiration bei Plosiven oder das Zusammenspiel von stimmhafter Anregung und Friktion bei stimmhaften Frikativen.

Mikroprosodie

Die Mikroprosodie betrachtet Schwankungen im Sprachsignal, wie zum Beispiel Jitter und Shimmer. Diese Schwankungen sind vor allem in verrauschten Sprachsignalen zu finden. In der Medizin lassen sich allein aus der Messung des jitter und des shimmer Rückschlüsse auf das Vorliegen von Rachenkrankheiten oder Kehlkopfentzündungen schließen (zum Beispiel Kehlkopfkrebs im Frühstadium).

Störungen der Prosodie

Störungen der Prosodie sind unter anderem im Autismusspektrum geläufig, besonders beim Asperger-Syndrom.