Kettenregel

Aus besserwiki.de

In der Infinitesimalrechnung ist die Kettenregel eine Formel, die die Ableitung der Zusammensetzung zweier differenzierbarer Funktionen f und g durch die Ableitungen von f und g ausdrückt. Genauer gesagt, wenn eine solche Funktion ist, dass für jedes x, dann lautet die Kettenregel in der Lagrangeschen Schreibweise

oder, äquivalent dazu,

Die Kettenregel kann auch in der Leibnizschen Notation ausgedrückt werden. Wenn eine Variable z von der Variablen y abhängt, die ihrerseits von der Variablen x abhängt (d. h. y und z sind abhängige Variablen), dann hängt z auch von x ab, und zwar über die Zwischenvariable y. In diesem Fall wird die Kettenregel ausgedrückt als

und

um anzugeben, an welchen Punkten die Ableitungen ausgewertet werden müssen.

Bei der Integration ist das Gegenstück zur Kettenregel die Substitutionsregel.

Die Kettenregel bildet einen Spezialfall der mehrdimensionalen Kettenregel für den eindimensionalen Fall.

Intuitive Erklärung

Intuitiv besagt die Kettenregel, dass man, wenn man die momentane Änderungsrate von z relativ zu y und die von y relativ zu x kennt, die momentane Änderungsrate von z relativ zu x als Produkt der beiden Änderungsraten berechnen kann.

Wie George F. Simmons sagte: "Wenn ein Auto doppelt so schnell fährt wie ein Fahrrad und das Fahrrad viermal so schnell ist wie ein gehender Mann, dann fährt das Auto 2 × 4 = 8 mal so schnell wie der Mann."

Die Beziehung zwischen diesem Beispiel und der Kettenregel ist wie folgt. Seien z, y und x die (variablen) Positionen des Autos, des Fahrrads bzw. des gehenden Mannes. Die Änderungsrate der relativen Positionen des Autos und des Fahrrads ist Gleichermaßen, Die Änderungsrate der relativen Positionen des Autos und des gehenden Mannes ist also

Die Änderungsrate der Positionen ist das Verhältnis der Geschwindigkeiten, und die Geschwindigkeit ist die Ableitung der Position nach der Zeit, d.h.,

oder, äquivalent dazu,

was ebenfalls eine Anwendung der Kettenregel ist.

Geschichte

Die Kettenregel wurde anscheinend erstmals von Gottfried Wilhelm Leibniz verwendet. Er benutzte sie zur Berechnung der Ableitung von als Kompositum aus der Quadratwurzelfunktion und der Funktion . Er erwähnte sie erstmals in einer Denkschrift von 1676 (mit einem Vorzeichenfehler in der Berechnung). Die gängige Schreibweise der Kettenregel geht auf Leibniz zurück. Guillaume de l'Hôpital verwendete die Kettenregel implizit in seiner Analyse des infiniment petits. Die Kettenregel kommt in keinem der Analysis-Bücher von Leonhard Euler vor, obwohl sie über hundert Jahre nach Leibniz' Entdeckung geschrieben wurden.

Aussage

Die einfachste Form der Kettenregel gilt für reellwertige Funktionen einer reellen Variablen. Sie besagt, dass, wenn g eine Funktion ist, die in einem Punkt c differenzierbar ist (d.h. die Ableitung g′(c) existiert) und f eine Funktion ist, die in g(c) differenzierbar ist, dann ist die zusammengesetzte Funktion differenzierbar nach c, und die Ableitung ist

Die Regel wird manchmal wie folgt abgekürzt

Wenn y = f(u) und u = g(x) ist, dann wird diese abgekürzte Form in der Leibniz-Notation als geschrieben:

Die Punkte, an denen die Ableitungen ausgewertet werden, können auch explizit angegeben werden:

Führt man die gleiche Überlegung weiter, so sind für n Funktionen mit der zusammengesetzten Funktion , wenn jede Funktion an ihrem unmittelbaren Eingang differenzierbar ist, dann ist auch die zusammengesetzte Funktion durch die wiederholte Anwendung der Kettenregel differenzierbar, wobei die Ableitung (in Leibnizscher Notation) ist:

Anwendungen

Komposita von mehr als zwei Funktionen

Die Kettenregel kann auf Komposita von mehr als zwei Funktionen angewendet werden. Um die Ableitung eines Komposits aus mehr als zwei Funktionen zu bestimmen, muss man beachten, dass das Kompositum von f, g und h (in dieser Reihenfolge) das Kompositum von f mit g ∘ h ist. Die Kettenregel besagt, dass es zur Berechnung der Ableitung von f ∘ g ∘ h ausreicht, die Ableitung von f und die Ableitung von g ∘ h zu berechnen. Die Ableitung von f kann direkt berechnet werden, und die Ableitung von g ∘ h kann durch erneute Anwendung der Kettenregel berechnet werden.

Zur Konkretisierung betrachten wir die Funktion

Diese kann als Kompositum von drei Funktionen zerlegt werden:

Ihre Ableitungen sind:

Die Kettenregel besagt, dass die Ableitung ihres Komposits im Punkt x = a ist:

In der Leibniz'schen Notation ist dies:

oder kurz gesagt,

Die Ableitungsfunktion ist also:

Eine andere Möglichkeit, diese Ableitung zu berechnen, besteht darin, die zusammengesetzte Funktion f ∘ g ∘ h als das Kompositum von f ∘ g und h zu betrachten:

Dies ist dasselbe wie das, was oben berechnet wurde. Dies ist zu erwarten, weil (f ∘ g) ∘ h = f ∘ (g ∘ h).

Manchmal ist es notwendig, eine beliebig lange Komposition der Form zu differenzieren . In diesem Fall definiert man

wobei und wenn . Die Kettenregel hat dann die Form

oder, in der Lagrange-Notation, die Form

Quotientenregel

Die Kettenregel kann zur Ableitung einiger bekannter Differenzierungsregeln verwendet werden. Die Quotientenregel zum Beispiel ist eine Folge der Kettenregel und der Produktregel. Um dies zu sehen, schreiben Sie die Funktion f(x)/g(x) als das Produkt f(x) - 1/g(x). Wenden Sie zunächst die Produktregel an:

Um die Ableitung von 1/g(x) zu berechnen, beachte, dass es sich um das Kompositum von g mit der reziproken Funktion handelt, d. h. der Funktion, die x zu 1/x macht. Die Ableitung der reziproken Funktion ist . Durch Anwendung der Kettenregel wird der letzte Ausdruck zu:

Dies ist die übliche Formel für die Quotientenregel.

Ableitungen von Umkehrfunktionen

Nehmen wir an, dass y = g(x) eine Umkehrfunktion hat. Nennen Sie die Umkehrfunktion f, so dass wir x = f(y) haben. Es gibt eine Formel für die Ableitung von f in Bezug auf die Ableitung von g. Um dies zu sehen, beachten Sie, dass f und g die Formel

Und da die Funktionen und x gleich sind, müssen auch ihre Ableitungen gleich sein. Die Ableitung von x ist die konstante Funktion mit dem Wert 1, und die Ableitung von wird durch die Kettenregel bestimmt. Daher haben wir das:

Um f' als Funktion einer unabhängigen Variablen y auszudrücken, ersetzt man für x, wo immer es erscheint. Dann können wir für f' lösen.

Betrachten wir zum Beispiel die Funktion g(x) = ex. Sie hat eine Umkehrfunktion f(y) = ln y. Da g′(x) = ex ist, besagt die obige Formel, dass

Diese Formel ist immer dann wahr, wenn g differenzierbar ist und seine Umkehrfunktion f ebenfalls differenzierbar ist. Diese Formel kann fehlschlagen, wenn eine dieser Bedingungen nicht erfüllt ist. Betrachten wir zum Beispiel g(x) = x3. Seine Umkehrung ist f(y) = y1/3, was bei Null nicht differenzierbar ist. Wenn wir versuchen, die obige Formel zu verwenden, um die Ableitung von f nach Null zu berechnen, müssen wir 1/g′(f(0)) berechnen. Da f(0) = 0 und g′(0) = 0 ist, müssen wir 1/0 berechnen, was undefiniert ist. Daher versagt die Formel in diesem Fall. Das ist nicht überraschend, denn f ist bei Null nicht differenzierbar.

Höhere Ableitungen

Die Formel von Faà di Bruno verallgemeinert die Kettenregel auf höhere Ableitungen. Angenommen, y = f(u) und u = g(x), dann sind die ersten Ableitungen:

Beweise

Erster Beweis

Ein Beweis der Kettenregel beginnt mit der Definition der Ableitung der zusammengesetzten Funktion f ∘ g, wobei wir den Grenzwert des Differenzenquotienten für f ∘ g nehmen, wenn x sich a nähert:

Nehmen wir für den Moment an, dass nicht gleich Dann ist der vorherige Ausdruck gleich dem Produkt zweier Faktoren:

Wenn in der Nähe von a oszilliert, dann kann es passieren, dass, egal wie nahe man a kommt, es immer ein noch näheres x gibt, so dass g(x) = g(a) ist. Dies geschieht zum Beispiel in der Nähe von a = 0 für die stetige Funktion g, die durch g(x) = 0 für x = 0 und g(x) = x2 sin(1/x) ansonsten definiert ist. In diesem Fall ist der obige Ausdruck undefiniert, da er eine Division durch Null beinhaltet. Um dies zu umgehen, führen Sie eine Funktion wie folgt ein:

Wir werden zeigen, dass der Differenzenquotient für f ∘ g immer gleich ist:

Wann immer g(x) ungleich g(a) ist, ist dies klar, weil sich die Faktoren von g(x) - g(a) aufheben. Wenn g(x) gleich g(a) ist, dann ist der Differenzquotient für f ∘ g gleich Null, weil f(g(x)) gleich f(g(a)) ist, und das obige Produkt ist Null, weil es gleich f′(g(a)) mal Null ist. Das obige Produkt ist also immer gleich dem Differenzenquotienten, und um zu zeigen, dass die Ableitung von f ∘ g nach a existiert, und um ihren Wert zu bestimmen, müssen wir nur zeigen, dass der Grenzwert des obigen Produkts, wenn x nach a geht, existiert, und seinen Wert bestimmen.

Dazu sei daran erinnert, dass der Grenzwert eines Produkts existiert, wenn die Grenzwerte seiner Faktoren existieren. Wenn dies der Fall ist, ist der Grenzwert des Produkts dieser beiden Faktoren gleich dem Produkt der Grenzwerte der Faktoren. Die beiden Faktoren sind Q(g(x)) und (g(x) - g(a)) / (x - a). Letzterer ist der Differenzenquotient für g bei a, und da g bei a per Annahme differenzierbar ist, existiert sein Grenzwert, wenn x gegen a tendiert, und ist gleich g′(a).

Für Q(g(x)) gilt, dass Q überall dort definiert ist, wo f ist. Außerdem ist f in g(a) durch die Annahme differenzierbar, so dass Q in g(a) durch die Definition der Ableitung stetig ist. Die Funktion g ist stetig bei a, weil sie bei a differenzierbar ist, und daher ist Q ∘ g stetig bei a. Ihr Grenzwert, wenn x nach a geht, existiert also und ist gleich Q(g(a)), was f′(g(a)) ist.

Dies zeigt, dass die Grenzen beider Faktoren existieren und dass sie gleich f′(g(a)) bzw. g′(a) sind. Daher existiert die Ableitung von f ∘ g nach a und ist gleich f′(g(a))g′(a).

Zweiter Beweis

Eine andere Möglichkeit, die Kettenregel zu beweisen, besteht darin, den Fehler in der linearen Approximation zu messen, der durch die Ableitung bestimmt wird. Dieser Beweis hat den Vorteil, dass er sich auf mehrere Variablen verallgemeinern lässt. Er stützt sich auf die folgende äquivalente Definition der Differenzierbarkeit in einem Punkt: Eine Funktion g ist differenzierbar an a, wenn es eine reelle Zahl g′(a) und eine Funktion ε(h) gibt, die gegen Null tendiert, wenn h gegen Null tendiert, und außerdem

Dabei stellt die linke Seite die wahre Differenz zwischen dem Wert von g bei a und bei a + h dar, während die rechte Seite die Annäherung darstellt, die durch die Ableitung plus einen Fehlerterm bestimmt wird.

Im Fall der Kettenregel existiert eine solche Funktion ε, weil angenommen wird, dass g bei a differenzierbar ist. Nennen wir diese Funktion η, so haben wir

Die obige Definition legt keine Einschränkungen für η(0) fest, obwohl angenommen wird, dass η(k) gegen Null tendiert, wenn k gegen Null geht. Wenn wir η(0) = 0 setzen, dann ist η bei 0 stetig.

Der Beweis des Satzes erfordert die Untersuchung der Differenz f(g(a + h)) - f(g(a)), wenn h gegen Null geht. Der erste Schritt besteht darin, g(a + h) durch die Definition der Differenzierbarkeit von g bei a zu ersetzen:

Der nächste Schritt besteht darin, die Definition der Differenzierbarkeit von f in g(a) zu verwenden. Dies erfordert einen Term der Form f(g(a) + k) für ein gewisses k. In der obigen Gleichung variiert das richtige k mit h. Setzen Sie kh = g′(a) h + ε(h) h und die rechte Seite wird zu f(g(a) + kh) - f(g(a)). Die Anwendung der Definition der Ableitung ergibt:

Um das Verhalten dieses Ausdrucks zu untersuchen, wenn h gegen Null tendiert, erweitern Sie kh. Nach Umgruppierung der Terme ergibt sich die rechte Seite:

Da ε(h) und η(kh) gegen Null tendieren, wenn h gegen Null tendiert, tendieren die ersten beiden eingeklammerten Terme gegen Null, wenn h gegen Null tendiert. Unter Anwendung desselben Satzes über Produkte von Grenzwerten wie im ersten Beweis tendiert auch der dritte Term in Klammern gegen Null. Da der obige Ausdruck gleich der Differenz f(g(a + h)) - f(g(a)) ist, ist nach der Definition der Ableitung f ∘ g nach a differenzierbar und seine Ableitung ist f′(g(a)) g′(a).

Die Rolle von Q im ersten Beweis wird in diesem Beweis von η gespielt. Sie sind durch die Gleichung miteinander verbunden:

Die Notwendigkeit, Q bei g(a) zu definieren, ist analog zu der Notwendigkeit, η bei Null zu definieren.

Dritter Beweis

Constantin Carathéodorys alternative Definition der Differenzierbarkeit einer Funktion kann verwendet werden, um einen eleganten Beweis der Kettenregel zu liefern.

Nach dieser Definition ist eine Funktion f in einem Punkt a dann und nur dann differenzierbar, wenn es eine Funktion q gibt, die in a stetig ist und für die gilt: f(x) - f(a) = q(x)(x - a). Es gibt höchstens eine solche Funktion, und wenn f in a differenzierbar ist, dann ist f ′(a) = q(a).

Angesichts der Annahmen der Kettenregel und der Tatsache, dass differenzierbare Funktionen und Zusammensetzungen von stetigen Funktionen stetig sind, müssen wir feststellen, dass es Funktionen q gibt, die stetig in g(a) sind, und r, die stetig in a sind, und zwar so, dass,

und

daher,

aber die Funktion, die durch h(x) = q(g(x))r(x) gegeben ist, ist stetig in a, und wir erhalten für dieses a

Ein ähnlicher Ansatz gilt für kontinuierlich differenzierbare (Vektor-)Funktionen mit vielen Variablen. Diese Methode der Faktorisierung ermöglicht auch eine einheitliche Herangehensweise an stärkere Formen der Differenzierbarkeit, wenn die Ableitung Lipschitz-stetig, Hölder-stetig usw. sein muss. Die Differenzierung selbst kann als Polynomrestsatz (der kleine Bézout-Satz oder Faktorsatz) betrachtet werden, der auf eine geeignete Klasse von Funktionen verallgemeinert wurde.

Beweis durch Infinitesimale

Für die Berechnung der Ableitung von ist der Differenzenquotient zu berechnen. Erweitert man diesen Bruch mit , so erhält man:

.

Durch den Grenzübergang werden aus den Differenzenquotienten die Differentialquotienten. Geht gegen Null, dann auch . Man erhält dann insgesamt für die Ableitung der verketteten Funktion:

Multivariabler Fall

Die Verallgemeinerung der Kettenregel auf multivariable Funktionen ist recht technisch. Es ist jedoch einfacher, sie für den Fall von Funktionen der Form

Da dieser Fall bei der Untersuchung von Funktionen mit einer einzigen Variablen häufig auftritt, lohnt es sich, ihn gesondert zu beschreiben.

Fall von f(g1(x), ... , gk(x))

Zur Aufstellung der Kettenregel für eine Funktion der Form

f(g1(x), ... , gk(x)),

benötigt man die partiellen Ableitungen von f in Bezug auf seine k Argumente. Die üblichen Schreibweisen für partielle Ableitungen beinhalten Namen für die Argumente der Funktion. Da diese Argumente in der obigen Formel nicht genannt werden, ist es einfacher und klarer, sie mit

die partielle Ableitung von f nach ihrem i-ten Argument und mit

den Wert dieser Ableitung nach z zu bezeichnen.

Mit dieser Schreibweise lautet die Kettenregel

Beispiel: Arithmetische Operationen

Wenn die Funktion f eine Addition ist, d. h. wenn

dann und . Die Kettenregel ergibt also

Für die Multiplikation

sind die Teilfunktionen und . Somit,

Der Fall der Potenzierung

ist etwas komplizierter, da

und, da

Daraus folgt, dass

Allgemeine Regel

Die einfachste Art, die Kettenregel im allgemeinen Fall zu schreiben, ist die Verwendung der totalen Ableitung, einer linearen Transformation, die alle gerichteten Ableitungen in einer einzigen Formel zusammenfasst. Man betrachte differenzierbare Funktionen f : Rm → Rk und g : Rn → Rm, und einen Punkt a in Rn. Da g bezeichne die totale Ableitung von g nach a und Dg(a) f die totale Ableitung von f nach g(a). Diese beiden Ableitungen sind lineare Transformationen Rn → Rm bzw. Rm → Rk, so dass sie zusammengesetzt werden können. Die Kettenregel für totale Ableitungen besagt, dass ihre Zusammensetzung die totale Ableitung von f ∘ g nach a ist:

oder kurz gesagt,

Die höherdimensionale Kettenregel kann mit einer Technik bewiesen werden, die dem zweiten oben genannten Beweis ähnelt.

Da die totale Ableitung eine lineare Transformation ist, können die in der Formel vorkommenden Funktionen als Matrizen umgeschrieben werden. Die Matrix, die einer Gesamtableitung entspricht, wird Jacobimatrix genannt, und das Kompositum zweier Ableitungen entspricht dem Produkt ihrer Jacobimatrizen. Unter diesem Gesichtspunkt besagt die Kettenregel also:

oder kurz gesagt,

Das heißt, die Jacobi einer zusammengesetzten Funktion ist das Produkt der Jacobi der zusammengesetzten Funktionen (bewertet an den entsprechenden Punkten).

Die höherdimensionale Kettenregel ist eine Verallgemeinerung der eindimensionalen Kettenregel. Wenn k, m und n gleich 1 sind, so dass f : RR und g : RR, dann sind die Jakobimatrizen von f und g 1 × 1. Genauer gesagt sind sie das:

Die Jakobi von f ∘ g ist das Produkt dieser 1 × 1-Matrizen, also f′(g(a))⋅g′(a), wie es die eindimensionale Kettenregel erwartet. In der Sprache der linearen Transformationen ist Da(g) die Funktion, die einen Vektor um einen Faktor von g′(a) skaliert, und Dg(a)(f) ist die Funktion, die einen Vektor um einen Faktor von f′(g(a)) skaliert. Die Kettenregel besagt, dass das Kompositum dieser beiden linearen Transformationen die lineare Transformation Da(f ∘ g) ist, und daher ist es die Funktion, die einen Vektor um f′(g(a))⋅g′(a) skaliert.

Eine andere Schreibweise der Kettenregel wird verwendet, wenn f und g in Form ihrer Komponenten ausgedrückt werden als y = f(u) = (f1(u), ..., fk(u)) und u = g(x) = (g1(x), ..., gm(x)). In diesem Fall wird die obige Regel für Jacobimatrizen normalerweise wie folgt geschrieben:

Die Kettenregel für totale Ableitungen impliziert eine Kettenregel für partielle Ableitungen. Erinnern Sie sich daran, dass, wenn die Gesamtableitung existiert, die partielle Ableitung in der i-ten Koordinatenrichtung durch Multiplikation der Jacobimatrix mit dem i-ten Basisvektor gefunden wird. Indem wir dies mit der obigen Formel tun, finden wir:

Da die Einträge der Jacobimatrix partielle Ableitungen sind, können wir die obige Formel vereinfachen und erhalten:

Aus konzeptioneller Sicht drückt diese Regel die Tatsache aus, dass eine Änderung in der Richtung xi alle Werte von g1 bis gm ändern kann, und jede dieser Änderungen kann sich auf f auswirken.

In dem speziellen Fall, in dem k = 1 ist, so dass f eine reellwertige Funktion ist, vereinfacht sich diese Formel sogar noch weiter:

Sie kann in ein Punktprodukt umgeschrieben werden. Da u = (g1, ..., gm) ist, ist die partielle Ableitung ∂u / ∂xi ebenfalls ein Vektor, und die Kettenregel besagt, dass:

Beispiel

Gegeben u(x, y) = x2 + 2y mit x(r, t) = r sin(t) und y(r,t) = sin2(t), bestimme den Wert von ∂u / ∂r und ∂u / ∂t unter Verwendung der Kettenregel.

und

Höhere Ableitungen von multivariablen Funktionen

Faà di Brunos Formel für Ableitungen höherer Ordnung von einvariablen Funktionen lässt sich auf den Fall der Multivariablen verallgemeinern. Wenn y = f(u) eine Funktion von u = g(x) wie oben ist, dann ist die zweite Ableitung von f ∘ g:

Weitere Verallgemeinerungen

Alle Erweiterungen des Kalküls haben eine Kettenregel. In den meisten dieser Erweiterungen bleibt die Formel dieselbe, obwohl die Bedeutung dieser Formel sehr unterschiedlich sein kann.

Eine Verallgemeinerung gilt für Mannigfaltigkeiten. In diesem Fall stellt die Kettenregel die Tatsache dar, dass die Ableitung von f ∘ g das Kompositum der Ableitung von f und der Ableitung von g ist. Dieser Satz ist eine unmittelbare Folge der oben genannten höherdimensionalen Kettenregel und hat genau dieselbe Formel.

Die Kettenregel gilt auch für Fréchet-Ableitungen in Banach-Räumen. Auch hier gilt die gleiche Formel wie zuvor. Dieser Fall und der vorherige lassen eine gleichzeitige Verallgemeinerung auf Banach-Mannigfaltigkeiten zu.

In der Differentialalgebra wird die Ableitung als ein Morphismus von Modulen von Kähler-Differentialen interpretiert. Ein Ringhomomorphismus von kommutativen Ringen f : R → S bestimmt einen Morphismus von Kähler-Differentialen Df : ΩR → ΩS, der ein Element dr zu d(f(r)), dem äußeren Differential von f(r), schickt. Die Formel D(f ∘ g) = DfDg gilt auch in diesem Zusammenhang.

Das gemeinsame Merkmal dieser Beispiele ist, dass sie Ausdruck der Idee sind, dass die Ableitung Teil eines Funktors ist. Ein Funktor ist eine Operation auf Räumen und Funktionen zwischen ihnen. Er ordnet jedem Raum einen neuen Raum und jeder Funktion zwischen zwei Räumen eine neue Funktion zwischen den entsprechenden neuen Räumen zu. In jedem der oben genannten Fälle sendet der Funktor jeden Raum an sein Tangentenbündel und jede Funktion an ihre Ableitung. Im Fall der Mannigfaltigkeit sendet die Ableitung zum Beispiel eine Cr-Mannigfaltigkeit an eine Cr-1-Mannigfaltigkeit (ihr Tangentenbündel) und eine Cr-Funktion an ihre Gesamtableitung. Damit dies ein Funktor ist, muss die Ableitung eines Kompositums das Kompositum der Ableitungen sein. Dies ist genau die Formel D(f ∘ g) = DfDg.

Es gibt auch Kettenregeln in der stochastischen Kalkulation. Eine davon, das Itō-Lemma, drückt das Kompositum eines Itō-Prozesses (oder allgemeiner eines Semimartingals) dXt mit einer zweifach differenzierbaren Funktion f aus. Im Itō-Lemma hängt die Ableitung der zusammengesetzten Funktion nicht nur von dXt und der Ableitung von f ab, sondern auch von der zweiten Ableitung von f. Die Abhängigkeit von der zweiten Ableitung ist eine Folge der von Null verschiedenen quadratischen Variation des stochastischen Prozesses, was im Großen und Ganzen bedeutet, dass sich der Prozess sehr grob nach oben und unten bewegen kann. Diese Variante der Kettenregel ist kein Beispiel für einen Funktor, da die beiden Funktionen, die zusammengesetzt werden, von unterschiedlichem Typ sind.

Beispiel

Es wird die durch definierte Funktion betrachtet.

Diese lässt sich darstellen als Verkettung der Funktion

mit der Funktion

denn es gilt . Hierbei nennt man äußere und innere Funktion.

Für die Anwendung der Kettenregel benötigen wir die Ableitungen (äußere Ableitung) und (innere Ableitung):

und

Da sowohl als auch differenzierbar sind, ist nach der Kettenregel auch differenzierbar, und es gilt für ihre Ableitung:

Nun ist , so dass wir insgesamt erhalten:

Unter Zuhilfenahme von Farbe lässt sich die eingangs formulierte Merkregel auch im Formelbild wiedererkennen.

Man beachte, dass die Darstellung einer Funktion als Verkettung einer äußeren mit einer inneren Funktion keineswegs eindeutig sein muss. So lässt sich die Beispielfunktion auch als Verkettung der Funktionen und auffassen, denn auch für diese beiden Funktionen gilt:

Die Anwendung der Kettenregel ist in diesem Fall rechnerisch aufwendiger, da zumindest der Term ausmultipliziert werden muss.

Insgesamt lässt sich an diesem Beispiel die Kettenregel im Sinne der konstruktivistischen Didaktik selbst entdecken. Ausmultiplizieren ergibt:

.

Nach Ableiten wird durch Ausklammern die innere Funktion herauspräpariert:

.

Hieraus lässt sich dann die Kettenregel vermuten, die dann noch in ihrer Allgemeingültigkeit bewiesen werden muss.

Beweis

Man definiert

Weil in differenzierbar ist, gilt

das heißt, die Funktion ist an der Stelle stetig. Außerdem gilt für alle :

Wegen folgt daraus:

Verallgemeinerung auf mehrfache Verkettungen

Etwas komplizierter wird das Differenzieren, wenn mehr als zwei Funktionen verkettet sind. In diesem Fall wird die Kettenregel rekursiv angewendet. Beispielsweise ergibt sich bei Verkettung von drei Funktionen u, v und w

die Ableitung

Im Allgemeinen besitzt die Funktion

die Ableitung

wie sich durch vollständige Induktion beweisen lässt. Beim praktischen Berechnen der Ableitung multipliziert man also Faktoren, die sich folgendermaßen ergeben: Den ersten Faktor erhält man dadurch, dass man die äußerste Funktion durch eine unabhängige Variable ausdrückt und ableitet. Anstelle dieser unabhängigen Variablen ist der Rechenausdruck für die restlichen (inneren) Funktionen einzusetzen. Der zweite Faktor wird entsprechend berechnet als Ableitung der zweitäußersten Funktion, wobei auch hier der Rechenausdruck für die zugehörigen inneren Funktionen einzusetzen ist. Dieses Verfahren setzt man fort bis zum letzten Faktor, der innersten Ableitung.

Als Beispiel kann wiederum die Funktion dienen. Diese lässt sich darstellen als Verkettung der drei Funktionen:

denn es gilt:

Damit liefert die auf mehrfache Verkettungen verallgemeinerte Kettenregel mit

die Ableitung

Verallgemeinerung auf Funktionen und Abbildungen mehrerer Veränderlicher

Hier betrachtet man differenzierbare Funktionen (Abbildungen) . Die Ableitung einer solchen Abbildung im Punkt ist dann eine lineare Abbildung , die durch eine -Matrix, die Jacobi-Matrix dargestellt werden kann.

Die Kettenregel besagt, dass die Verkettung von zwei differenzierbaren Abbildungen wieder differenzierbar ist. Ihre Ableitung erhält man, indem man die einzelnen Ableitungen verkettet. Die zugehörige Jacobi-Matrix ist das Matrizenprodukt der einzelnen Jacobi-Matrizen.

Im Detail: Sind die Abbildungen im Punkt und im Punkt differenzierbar, so ist auch die Verkettung im Punkt differenzierbar, und es gilt

und

In ähnlicher Form lässt sich eine Kettenregel für Fréchet-Ableitungen von Abbildungen zwischen Banachräumen und für die Ableitungen (Differentiale, Tangentialabbildungen) von Abbildungen zwischen differenzierbaren Mannigfaltigkeiten formulieren.

Abweichende Notationen in der Physik und anderen Wissenschaften

In vielen Naturwissenschaften wie der Physik sowie in der Ingenieurwissenschaft findet die Kettenregel breite Anwendung. Allerdings hat sich hier eine besondere Notation entwickelt, die von der mathematischen Notation der Kettenregel deutlich abweicht.

Vorstellung der Notation

In physikalischer Literatur wird für die Ableitung einer Funktion nach der Variable in der Regel die Schreibweise

bevorzugt. Ist eine Verkettung zweier Funktionen: mit , so präsentiert sich die Kettenregel in dieser Notation:

Es ist zusätzlich gängige Konvention, die unabhängige Variable der Funktion mit dem Funktionssymbol der inneren Funktion zu identifizieren, dafür aber sämtliche Argumentklammern auszulassen:

Letztlich wird für die Verkettung kein neues Symbol eingeführt, sondern die gesamte Verkettung mit der äußeren Funktion identifiziert: .

Die Kettenregel nimmt dann das folgende Aussehen an:

Formal stellt sich die Kettenregel hier als eine Erweiterung des „Bruches“ mit dar, so dass es in physikalischer Fachliteratur (und auch in anderen Natur- und Ingenieurwissenschaften) gängig ist, die Kettenregel bei Anwendung nicht namentlich zu erwähnen. Stattdessen findet man oft Ersatzformulierungen, so ist etwa von der „Erweiterung von mit “ die Rede, teilweise fehlt eine Begründung vollständig. Auch wenn dies für das ungeübte Auge nicht immer auf den ersten Blick erkennbar ist, steckt hinter all diesen Formulierungen ausnahmslos die Kettenregel der Differentialrechnung.

Obwohl die vorgestellte Notation mit einigen mathematischen Konventionen bricht, erfreut sie sich großer Beliebtheit und weiter Verbreitung, da sie es ermöglicht, mit Ableitungen (zumindest salopp) wie mit „normalen Brüchen“ zu rechnen. Viele Rechnungen gestaltet sie außerdem übersichtlicher, da Klammern entfallen und nur sehr wenige Symbole verwendet werden müssen. Vielfach stellt auch die durch eine Verkettung beschriebene Größe eine bestimmte physikalische Variable dar (z. B. eine Energie oder eine elektrische Spannung), für die ein bestimmter Buchstabe „reserviert“ ist (etwa E für Energie und U für Spannung). Die obige Notation ermöglicht es, diesen Buchstaben in der gesamten Rechnung durchgängig zu verwenden.

Beispiel

Die kinetische Energie eines Körpers hängt von seiner Geschwindigkeit ab: . Hängt die Geschwindigkeit wiederum von der Zeit ab, , so ist auch die kinetische Energie des Körpers eine Funktion der Zeit, die durch die Verkettung

beschrieben wird. Möchten wir die Änderung der kinetischen Energie nach der Zeit berechnen, so gilt nach der Kettenregel

In physikalischer Literatur würde man die letzte Gleichung in folgender (oder ähnlicher) Gestalt vorfinden:

Klarer Vorteil ist die durchgängige Verwendung von Funktionssymbolen, deren Buchstaben mit denen der zugrunde liegenden physikalisch relevanten Größe ( für Energie, für Geschwindigkeit) übereinstimmen.