Boltzmann-Statistik
In der statistischen Mechanik und Mathematik ist die Boltzmann-Verteilung (auch Gibbs-Verteilung genannt) eine Wahrscheinlichkeitsverteilung oder ein Wahrscheinlichkeitsmaß, das die Wahrscheinlichkeit angibt, dass sich ein System in einem bestimmten Zustand befindet, in Abhängigkeit von der Energie dieses Zustands und der Temperatur des Systems. Die Verteilung wird in der folgenden Form ausgedrückt:
Dabei ist pi die Wahrscheinlichkeit, dass sich das System im Zustand i befindet, εi ist die Energie dieses Zustands, und die Konstante kT der Verteilung ist das Produkt aus der Boltzmann-Konstante k und der thermodynamischen Temperatur T. Das Symbol steht für die Proportionalität (siehe § Die Verteilung für die Proportionalitätskonstante). ⓘ
Der Begriff System hat hier eine sehr weite Bedeutung; er kann von einer Ansammlung einer "ausreichenden Anzahl" von Atomen (aber nicht eines einzelnen Atoms) bis zu einem makroskopischen System wie einem Erdgastank reichen. Daher kann die Boltzmann-Verteilung zur Lösung einer Vielzahl von Problemen verwendet werden. Die Verteilung zeigt, dass Zustände mit niedrigerer Energie immer eine höhere Wahrscheinlichkeit haben, besetzt zu sein. ⓘ
Das Verhältnis der Wahrscheinlichkeiten zweier Zustände wird als Boltzmann-Faktor bezeichnet und hängt charakteristischerweise nur von der Energiedifferenz der Zustände ab:
Die Boltzmann-Verteilung ist nach Ludwig Boltzmann benannt, der sie erstmals 1868 im Rahmen seiner Studien zur statistischen Mechanik von Gasen im thermischen Gleichgewicht formulierte. Boltzmanns statistische Arbeiten sind in seiner Abhandlung "Über die Beziehung zwischen dem zweiten Hauptsatz der mechanischen Wärmetheorie und den Wahrscheinlichkeitsberechnungen über die Bedingungen des thermischen Gleichgewichts" festgehalten. Die Verteilung wurde später in ihrer modernen allgemeinen Form von Josiah Willard Gibbs im Jahr 1902 eingehend untersucht. ⓘ
Die Boltzmann-Verteilung sollte nicht mit der Maxwell-Boltzmann-Verteilung oder der Maxwell-Boltzmann-Statistik verwechselt werden. Die Boltzmann-Verteilung gibt die Wahrscheinlichkeit an, dass sich ein System in einem bestimmten Zustand befindet, und zwar in Abhängigkeit von der Energie dieses Zustands, während die Maxwell-Boltzmann-Verteilung die Wahrscheinlichkeiten von Teilchengeschwindigkeiten oder Energien in idealen Gasen angibt. ⓘ
Die systematische Herleitung der Boltzmann-Statistik erfolgt in der statistischen Physik. Dabei repräsentiert das ans Wärmebad gekoppelte System ein kanonisches Ensemble. ⓘ
Mathematisch ist die Boltzmann-Verteilung eine univariate diskrete Verteilung einer unendlichen Menge. Auf ihr basiert zum Beispiel das künstliche neuronale Netz der Boltzmann-Maschine. ⓘ
Die Verteilung
Die Boltzmann-Verteilung ist eine Wahrscheinlichkeitsverteilung, die die Wahrscheinlichkeit eines bestimmten Zustands in Abhängigkeit von der Energie dieses Zustands und der Temperatur des Systems angibt, auf das die Verteilung angewendet wird. Sie ist gegeben als ⓘ
wobei pi die Wahrscheinlichkeit des Zustands i, εi die Energie des Zustands i, k die Boltzmann-Konstante, T die absolute Temperatur des Systems und M die Anzahl aller für das interessierende System zugänglichen Zustände ist. Der Normalisierungsnenner Q (von einigen Autoren mit Z bezeichnet) ist die kanonische Partitionsfunktion ⓘ
Sie ergibt sich aus der Bedingung, dass die Wahrscheinlichkeiten aller zugänglichen Zustände sich zu 1 addieren müssen. ⓘ
Die Boltzmann-Verteilung ist die Verteilung, die die Entropie maximiert ⓘ
maximiert, vorbehaltlich der Normalisierungsbedingung und der Bedingung, dass gleich einem bestimmten mittleren Energiewert ist (was mit Hilfe von Lagrange-Multiplikatoren nachgewiesen werden kann). ⓘ
Die Verteilungsfunktion kann berechnet werden, wenn die Energien der Zustände, die für das interessierende System zugänglich sind, bekannt sind. Für Atome können die Werte der Verteilungsfunktion in der NIST Atomic Spectra Database gefunden werden. ⓘ
Die Verteilung zeigt, dass Zustände mit niedrigerer Energie immer eine höhere Wahrscheinlichkeit haben, besetzt zu sein, als Zustände mit höherer Energie. Sie kann uns auch die quantitative Beziehung zwischen den Wahrscheinlichkeiten, dass die beiden Zustände besetzt sind, aufzeigen. Das Verhältnis der Wahrscheinlichkeiten für die Zustände i und j ist gegeben als ⓘ
wobei pi die Wahrscheinlichkeit für den Zustand i, pj die Wahrscheinlichkeit für den Zustand j und εi und εj die Energie der Zustände i bzw. j sind. Das entsprechende Verhältnis der Populationen von Energieniveaus muss auch deren Entartungen berücksichtigen. ⓘ
Die Boltzmann-Verteilung wird häufig verwendet, um die Verteilung von Teilchen, wie z. B. Atomen oder Molekülen, über die ihnen zugänglichen gebundenen Zustände zu beschreiben. Wenn ein System aus vielen Teilchen besteht, ist die Wahrscheinlichkeit, dass sich ein Teilchen im Zustand i befindet, praktisch die Wahrscheinlichkeit, dass es sich im Zustand i befindet, wenn wir ein zufälliges Teilchen aus diesem System auswählen und prüfen, in welchem Zustand es sich befindet. ⓘ
wobei Ni die Anzahl der Teilchen im Zustand i und N die Gesamtzahl der Teilchen im System ist. Wir können die Boltzmann-Verteilung verwenden, um diese Wahrscheinlichkeit zu ermitteln, die, wie wir gesehen haben, gleich dem Anteil der Teilchen ist, die sich im Zustand i befinden. Die Gleichung, die den Anteil der Teilchen im Zustand i als Funktion der Energie dieses Zustands angibt, lautet also ⓘ
Diese Gleichung ist für die Spektroskopie von großer Bedeutung. In der Spektroskopie beobachten wir eine Spektrallinie von Atomen oder Molekülen, die von einem Zustand in einen anderen übergehen. Damit dies möglich ist, muss es im ersten Zustand einige Teilchen geben, die den Übergang durchlaufen. Wir können feststellen, ob diese Bedingung erfüllt ist, indem wir den Anteil der Teilchen im ersten Zustand ermitteln. Wenn er vernachlässigbar ist, wird der Übergang bei der Temperatur, für die die Berechnung durchgeführt wurde, sehr wahrscheinlich nicht beobachtet. Im Allgemeinen bedeutet ein größerer Anteil von Molekülen im ersten Zustand eine höhere Anzahl von Übergängen in den zweiten Zustand. Dies führt zu einer stärkeren Spektrallinie. Es gibt jedoch noch andere Faktoren, die die Intensität einer Spektrallinie beeinflussen, z. B. ob sie durch einen erlaubten oder einen verbotenen Übergang verursacht wird. ⓘ
Die beim maschinellen Lernen häufig verwendete Softmax-Funktion ist mit der Boltzmann-Verteilung verwandt:
Annahme: Die Wahrscheinlichkeit, dass ein Zustand mit Energie im thermischen Gleichgewicht besetzt ist, ist durch eine stetige Funktion gegeben. Das Verhältnis der Besetzung von zwei beliebigen Zuständen ist dann eine Funktion , die wegen der beliebigen Wahl des Energienullpunkts nur von der Energiedifferenz abhängen kann:
- .
Betrachten wir jetzt drei Zustände, so ist , also
- .
Diese Funktionalgleichung wird nur von der Exponentialfunktion mit einem freien Parameter gelöst:
- .
Mithin
- ,
und es folgt für die Form der gesuchten Funktion das Endergebnis
- .
Die Bedeutung des Parameters erweist sich, wenn mithilfe dieser Gleichung die Gesamtenergie eines Systems aus vielen Massenpunkten berechnet wird und mit dem Wert gleichgesetzt wird, der für das 1-atomige ideale Gas gilt. Resultat:
Verallgemeinerte Boltzmann-Verteilung
Eine Verteilung der Form
wird von einigen Autoren als verallgemeinerte Boltzmann-Verteilung bezeichnet. ⓘ
Die Boltzmann-Verteilung ist ein Spezialfall der verallgemeinerten Boltzmann-Verteilung. Die verallgemeinerte Boltzmann-Verteilung wird in der statistischen Mechanik verwendet, um das kanonische Ensemble, das große kanonische Ensemble und das isothermisch-isobare Ensemble zu beschreiben. Die verallgemeinerte Boltzmann-Verteilung wird in der Regel aus dem Prinzip der maximalen Entropie abgeleitet, aber es gibt auch andere Ableitungen. ⓘ
Die verallgemeinerte Boltzmann-Verteilung hat die folgenden Eigenschaften:
- Sie ist die einzige Verteilung, bei der die durch die Gibbs-Entropie-Formel definierte Entropie mit der in der klassischen Thermodynamik definierten Entropie übereinstimmt.
- Sie ist die einzige Verteilung, die mathematisch mit der grundlegenden thermodynamischen Beziehung übereinstimmt, bei der die Zustandsfunktionen durch einen Ensemble-Mittelwert beschrieben werden. ⓘ
In der statistischen Mechanik
Die Boltzmann-Verteilung taucht in der statistischen Mechanik auf, wenn man geschlossene Systeme mit fester Zusammensetzung betrachtet, die sich im thermischen Gleichgewicht befinden (Gleichgewicht in Bezug auf den Energieaustausch). Der allgemeinste Fall ist die Wahrscheinlichkeitsverteilung für das kanonische Ensemble. Einige Spezialfälle (ableitbar aus dem kanonischen Ensemble) zeigen die Boltzmann-Verteilung in verschiedenen Aspekten:
- Kanonisches Ensemble (allgemeiner Fall)
- Das kanonische Ensemble gibt die Wahrscheinlichkeiten für die verschiedenen möglichen Zustände eines geschlossenen Systems mit festem Volumen an, das sich im thermischen Gleichgewicht mit einem Wärmebad befindet. Das kanonische Ensemble hat eine Zustandswahrscheinlichkeitsverteilung mit der Boltzmann-Form.
- Statistische Häufigkeiten der Zustände von Teilsystemen (in einer nicht interagierenden Ansammlung)
- Handelt es sich bei dem interessierenden System um eine Ansammlung vieler nicht wechselwirkender Kopien eines kleineren Teilsystems, ist es manchmal nützlich, die statistische Häufigkeit eines bestimmten Teilsystemzustands in der Ansammlung zu ermitteln. Das kanonische Ensemble hat die Eigenschaft der Trennbarkeit, wenn es auf eine solche Sammlung angewandt wird: Solange die nicht interagierenden Teilsysteme eine feste Zusammensetzung haben, ist der Zustand jedes Teilsystems unabhängig von den anderen und wird ebenfalls durch ein kanonisches Ensemble charakterisiert. Infolgedessen hat die erwartete statistische Häufigkeitsverteilung der Teilsystemzustände die Boltzmann-Form.
- Maxwell-Boltzmann-Statistik klassischer Gase (Systeme aus nicht wechselwirkenden Teilchen)
- In Teilchensystemen teilen sich viele Teilchen denselben Raum und tauschen regelmäßig die Plätze miteinander; der von ihnen besetzte Einzelteilchen-Zustandsraum ist ein gemeinsamer Raum. Die Maxwell-Boltzmann-Statistik gibt die erwartete Anzahl der Teilchen an, die sich in einem bestimmten Einteilchenzustand in einem klassischen Gas aus nicht wechselwirkenden Teilchen im Gleichgewicht befinden. Diese erwartete Anzahlverteilung hat die Boltzmann-Form. ⓘ
Obwohl diese Fälle starke Ähnlichkeiten aufweisen, ist es hilfreich, sie zu unterscheiden, da sie sich auf unterschiedliche Weise verallgemeinern, wenn die entscheidenden Annahmen geändert werden:
- Befindet sich ein System sowohl hinsichtlich des Energie- als auch des Teilchenaustauschs im thermodynamischen Gleichgewicht, wird die Anforderung einer festen Zusammensetzung gelockert und man erhält ein großes kanonisches Ensemble anstelle eines kanonischen Ensembles. Sind hingegen sowohl die Zusammensetzung als auch die Energie fixiert, so gilt stattdessen ein mikrokanonisches Ensemble.
- Wenn die Teilsysteme innerhalb einer Sammlung miteinander interagieren, dann folgen die erwarteten Häufigkeiten der Teilsystemzustände nicht mehr einer Boltzmann-Verteilung und haben möglicherweise nicht einmal eine analytische Lösung. Das kanonische Ensemble kann jedoch immer noch auf die kollektiven Zustände des gesamten Systems als Ganzes angewendet werden, sofern sich das gesamte System im thermischen Gleichgewicht befindet.
- Bei Quantengasen aus nicht wechselwirkenden Teilchen im Gleichgewicht folgt die Anzahl der Teilchen, die sich in einem bestimmten Einzelteilchenzustand befinden, nicht der Maxwell-Boltzmann-Statistik, und es gibt keinen einfachen Ausdruck in geschlossener Form für Quantengase im kanonischen Ensemble. Im großen kanonischen Ensemble wird die Zustandsfüllungsstatistik von Quantengasen durch die Fermi-Dirac-Statistik oder die Bose-Einstein-Statistik beschrieben, je nachdem, ob es sich bei den Teilchen um Fermionen bzw. Bosonen handelt. ⓘ
In der Mathematik
In allgemeineren mathematischen Zusammenhängen ist die Boltzmann-Verteilung auch als Gibbs-Maß bekannt. In der Statistik und beim maschinellen Lernen wird sie als log-lineares Modell bezeichnet. Beim maschinellen Lernen wird die Boltzmann-Verteilung in der Sampling-Verteilung von stochastischen neuronalen Netzen wie der Boltzmann-Maschine, der eingeschränkten Boltzmann-Maschine, den energiebasierten Modellen und der tiefen Boltzmann-Maschine verwendet. Beim Deep Learning gilt die Boltzmann-Maschine als eines der unbeaufsichtigten Lernmodelle. Bei der Entwicklung der Boltzmann-Maschine im Deep Learning wird die Implementierung in Echtzeitanwendungen mit zunehmender Knotenzahl immer schwieriger, weshalb eine andere Art von Architektur, die eingeschränkte Boltzmann-Maschine, eingeführt wurde. ⓘ
In den Wirtschaftswissenschaften
Die Boltzmann-Verteilung kann für die Zuteilung von Emissionsrechten im Emissionshandel eingesetzt werden. Die neue Zuteilungsmethode, die die Boltzmann-Verteilung verwendet, kann die wahrscheinlichste, natürlichste und unvoreingenommenste Verteilung der Emissionsrechte auf mehrere Länder beschreiben. ⓘ
Die Boltzmann-Verteilung hat die gleiche Form wie das multinomiale Logit-Modell. Als diskretes Entscheidungsmodell ist es in den Wirtschaftswissenschaften sehr bekannt, seit Daniel McFadden die Verbindung zur zufälligen Nutzenmaximierung hergestellt hat. ⓘ
Bedeutung
Anwendungsbeispiele
- Barometrische Höhenformel ⓘ
Die potentielle Energie eines Gasmoleküls der Luft mit Masse in der Höhe ist . Die Häufigkeitsverteilung der Moleküle in Abhängigkeit Höhe ist proportional zu ⓘ
- . ⓘ
Für den Beginn einer chemischen Reaktion zwischen zwei Molekülen müssen diese mindestens die zu dieser Reaktion gehörige Aktivierungsenergie besitzen. Die Geschwindigkeitskonstante der makroskopischen chemischen Reaktion ist daher proportional zu ⓘ
- . ⓘ
- Dampfdruckkurve ⓘ
Der Übergang eines Moleküls von der Flüssigkeit in die Gasphase erfordert eine Mindestenergie, die auf die Stoffmenge bezogen durch die molare Verdampfungsenthalpie ausgedrückt wird. Der Sättigungsdampfdruck ist daher proportional zu
- . ⓘ
Herleitung
Statistische Physik
Gegeben seien Zustände oder Phasenraumzellen mit Energien , und ein System mit einer Anzahl darin verteilter Teilchen und einer Gesamtenergie . Die Besetzungszahlen der einzelnen Zustände bilden eine Folge, die zwei Nebenbedingungen erfüllt:
Die Anzahl der Möglichkeiten, bei Vertauschen der Teilchen dieselbe Folge zu erhalten, ist
(denn es gibt insgesamt Vertauschungen, von denen aber jeweils ein Bruchteil die Vertauschungen innerhalb der i-ten Zelle betrifft, die an der Folge nichts ändern). Nach dem allgemeinen Vorgehen der statistischen Physik ist der Gleichgewichtszustand durch diejenige Folge gegeben, bei der oder auch maximal wird. Nach der Stirling-Formel gilt bis auf Korrekturen der Ordnung , die bei den in der Thermodynamik üblichen Teilchzahlen zu vernachlässigen sind. Weiter wird vorausgesetzt, dass auch alle .
Für die gesuchte Verteilung muss gelten, dass Variationen der um kleine in linearer Näherung keine Änderung von verursachen, wobei als Nebenbedingungen die Teilchenzahl und die Gesamtenergie konstant bleiben:
Zur Lösung werden die zweite und dritte Gleichung nach der Methode der Lagrangeschen Multiplikatoren mit Konstanten multipliziert und zur (negativ genommenen) ersten addiert. In der so entstehenden Summe kann man alle Variationen als unabhängig voneinander behandeln, weshalb alle Summanden einzeln Null sein müssen:
- .
Daraus folgt:
- .
Zur weiteren Bestimmung der Lagrangesche-Multiplikatoren wird zunächst die letzte Gleichung über alle summiert, wobei links die Teilchenzahl herauskommt:
- .
Darin wird
- .
als die (kanonische) Zustandssumme bezeichnet. Damit gilt
- . ⓘ
Die thermodynamische Bedeutung von ist die inverse Temperatur
- . ⓘ
Es folgt nämlich wegen der Beziehung zwischen der Entropie und der Anzahl der Möglichkeiten aus den obigen Gleichungen
und damit
- .
Damit folgt die endgültige Gleichung der Boltzmannstatistik:
- . ⓘ
Herleitung mit dem kanonischen Ensemble
Hierzu siehe Herleitung des Boltzmann-Faktors im betreffenden Artikel. ⓘ
Numerische Simulation der Verteilung
Stichproben, die der Boltzmann-Verteilung genügen, werden standardmäßig mit Markov-Chain-Monte-Carlo-Verfahren erzeugt. Insbesondere wurde der Metropolisalgorithmus extra für diesen Zweck entwickelt. ⓘ