YY

曲線座標系のベクトル解析と微分形式

はじめに

Wathematicaアドベントカレンダー12/19担当のY・Yです。
ベクトル解析で用いられるガウスの法則やストークスの法則、ベクトル解析の最大の応用先とも言える電磁気学などは、微分形式を用いた方が統一的に表すことが出来る、というのはかなり有名な話です。例えば、\mathbb{R}^3のベクトル場の発散div \vec{A}は、2-formの外微分として捉えることが出来ます。しかし、実用上はユークリッド座標だけでなく、極座標その他の直交曲線座標で考えることも多いです。また、一般相対論では、曲がった時空上にMaxwell方程式は拡張されます。この時、ベクトル場の微分はどのように変換されるのか、というのが今回の主題です。

ホッジ双対

n次元微分多様体では、p-form全体のなすベクトル空間\Omega^p\Omega^{n-p}は同じ次元になります。リーマン多様体の場合、
\star:\Omega^p\rightarrow \Omega^{n-p}
なる線形写像をうまく定義することが出来ます。

ユークリッド空間の場合のホッジ双対

まずは、最も簡単なユークリッド空間にホッジ双対をどう定義するかを見ていきましょう。
\mathbb{R}^nでのホッジ双対は
\star(dx^{i_1}\wedge dx^{i_2}\wedge \dots \wedge dx^{i_p})=sgn\begin{pmatrix}\begin{array}{lll}1&\dots&n\\i_1&\dots&i_n\end{array}\end{pmatrix}dx^{i_{p+1}}\wedge \dots \wedge dx^{i_n}
によって定義されます。
例えば、\mathbb{R}^3では、
\star 1=dx\wedge dy\wedge dz
\star dx = dy \wedge dz
等が成立します。
また、一般のp-form\alphaに対し、
\star\star\alpha=(-1)^{p(n-p)}\alpha
が成立します。

極座標でのホッジ双対

上で述べたホッジ双対の定義は基底に依存するものですが、実は互いに向きが同じ正規直交基底に対しては、上の定義はwell-defined になっています。*1
さて、3次元極座標を用いたとき、基底ベクトル
\frac{\partial}{\partial r},\frac{\partial}{\partial \theta},\frac{\partial}{\partial \varphi}
は正規直交基底ではありませんが、計量が
g=\begin{pmatrix}\begin{array}{lll}1&&\\&\frac{1}{r^2}&\\&&\frac{1}{r^2\sin^2\theta}\end{array}\end{pmatrix}
と対角型であるため、
dx^1=dr
dx^2=rd\theta
dx^3=r\sin\theta d\varphi
は正規直交基底になり、上の定義を適用できます。また、線形性を使うと、
\star(dr\wedge rd\theta\wedge r\sin\theta d\varphi)=1
より
\star(dr\wedge d\theta\wedge d\varphi)=\frac{1}{r^2\sin\theta}\big(=\frac{1}{\sqrt{g}}\big)
という関係が分かります。ここで出てきたr^2\sin\thetaはベクトル解析では「体積要素」と呼ばれます。(要するにヤコビアンなのですが)
同様の計算により、
\star(dr)=r^2\sin\theta d\theta \wedge d\varphi
 \star(d\theta)=\sin\theta d\varphi \wedge dr
\star(d\varphi)=\frac{1}{\sin\theta} dr\wedge d\theta
となります。ここで出てきた右辺の各係数は、面積要素と呼ばれます。

微分とベクトル解析

微分

念のため、外微分について簡単に書いておきます。(詳しくは他の文献を参照してください)
微分微分形式に対して定義される微分でp-formA=\sum_{I}A_Idx^I(ただし、I=(i_1,i_2,i_3\dots i_p))の外微分
dA=\frac{\partial}{\partial x^i}A_I dx^i\wedge dx^I
と計算できます。

スカラー場の勾配

スカラー\phi(\vec{x})の勾配ベクトルは、1-formd\phiに対応するベクトル(1-formを共変ベクトルだと思ったときの反変ベクトル)g(d\phi,\cdot)です。極座標系では
grad\phi=g^{ij}\frac{\partial\phi}{\partial x^j}\frac{\partial}{\partial x^i}=\frac{\partial\phi}{\partial r}\frac{\partial}{\partial r}+\frac{1}{r}\frac{\partial\phi}{\partial \theta}\frac{1}{r}\frac{\partial}{\partial \theta}+\frac{1}{r\sin\theta}\frac{\partial\phi}{\partial \varphi}\frac{1}{r\sin\theta}\frac{\partial}{\partial \varphi}
となります。

ベクトル場の湧き出し

p-form\alphaに対し、余微分
\delta \alpha \equiv (-1)^{n(p+1)+1}\star d\star\alpha
で定義します。
ベクトル場\tilde{A}(\vec{x})に双対な1-formAに対して、
-\delta A=\star d \star A
は0-form、つまりスカラー量を返す演算になっていて、ユークリッド座標で計算すると、div\tilde{A}に一致することが分かります。
極座標系では、物理の慣習に倣い正規直交基底で
\tilde{A}=A_r\frac{\partial}{\partial r}+A_\theta\frac{1}{r}\frac{\partial}{\partial \theta}+A_\varphi\frac{1}{r\sin\theta}\frac{\partial}{\partial \varphi}
と書くと、
A=A_rdr+A_\theta rd\theta+A_\varphi r\sin\theta d\varphi
となり、先ほどの極座標のホッジ双対のルールに気を付けると
div\tilde{A}=\star d\star A=\frac{1}{r^2\sin\theta}\big\{\frac{\partial}{\partial r}(r^2\sin\theta A_r)+\frac{\partial}{\partial\theta}(\sin\theta rA_\theta)+\frac{\partial}{\partial \varphi}\big(\frac{1}{\sin\theta} r\sin\theta A_\varphi\big)\big\}
となります。*2rot \tilde{A}も、1-form\star dAに対応するベクトル場を求めればよいことが分かるのですが、今回は割愛します。

ラプラシアン

p-formに対するLaplacianは先ほどの余微分を用いて
\triangle \equiv -(\delta d+d\delta)
で定義されます。(Laplace-De Rham作用素)(符号は物理に合わせました。)
とりあえず今回は0-formに関してだけ考えるとすると、
\triangle f=\star d\star f=\frac{\partial}{\partial x}\frac{\partial}{\partial x}f+\frac{\partial}{\partial y}\frac{\partial}{\partial y}f+\frac{\partial}{\partial z}\frac{\partial}{\partial z}f
となり、ユークリッド座標ではちゃんとよく知るラプラシアンの表式が出てきます。
気持ちとしては、
\Omega^0\xrightarrow{d}\Omega^1\xrightarrow{\star}\Omega^2\xrightarrow{d}\Omega^3\xrightarrow{\star}\Omega^0
という風に演算を作用させています。
極座標では、
\triangle f=\frac{1}{r^2\sin\theta}\big\{\frac{\partial}{\partial r}(r^2\sin\theta \frac{\partial}{\partial r})+\frac{\partial}{\partial\theta}\big(\sin\theta\frac{\partial}{\partial\theta}\big)+\frac{\partial}{\partial \varphi}\big(\frac{1}{\sin\theta} \frac{\partial}{\partial \varphi}\big)\big\}f
となり、極座標形式のラプラシアンが求まりました。*3

重力中のMaxwell方程式

(\star A)\\muA^\muの関係

ここで、一般のリーマン多様体の直交曲線座標系で\star Aを成分表示しておこうと思います。1-formについては
\begin{align*}
  \star A &=\star(A_\mu dx^\mu)=\sum_\mu \frac{\sqrt{g}}{\sqrt{g_{\mu\mu}}}A_\mu dx^1\wedge\dots\wedge\widehat{dx^\mu}\wedge\dots\wedge dx^n\\
  &=\sum_\mu \sqrt{g}A^\mu dx^1\wedge\dots\wedge\widehat{dx^\mu}\wedge\dots\wedge dx^n
\end{align*}
となります(Einsteinの縮約とそうでない項があるのはすみません)ここで、\widehat{dx^\mu}dx^\muを除いたことを意味します。同様に2-formについても
\star F=\sqrt{g}F^{\mu\nu} dx^1\wedge\dots\wedge\widehat{dx^\mu}\wedge\dots\wedge\widehat{dx^\nu}\wedge\dots\wedge dx^n
が成立します。*4

4次元微分形式を用いたMaxwell方程式

ミンコフスキー空間では
F=F_{\mu\nu} dx^\mu\wedge dx^\nu=E_x dx^0\wedge dx^1+E_y dx^0\wedge dx^2+E_z dx^0 \wedge dx^3+B_z dx^1\wedge dx^2+B_x dx^2\wedge dx^3+B_y dx^3\wedge dx^1
および
j=j_\mu dx^0\wedge\dots\wedge\widehat{dx^\mu}\wedge\dots\wedge dx^4
を用いて、Maxwell方程式は
dF=0
 d\star F =\frac{4\pi}{c}j
と書けます。*5
微分形式で書けたことの嬉しさの一つとして、座標系に依存しない方程式になっていることがあげられます。すなわち、この式は曲がった時空へとそのまま拡張できます。(重力場中も局所慣性系を取ることが出来るため。)このときの成分表示を調べてみましょう。

曲がった時空におけるMaxwell 方程式

Maxwell方程式の第1式はF_{\mu\nu}についてのビアンキ恒等式を示したもので、これは成分表示しても曲がった時空でもミンコフスキー時空でも変わりません。問題は第2式です。
jに対応するベクトル場\tilde{j}と3-formjの関係は
j=\star(g(\tilde{j},\cdot))
であるから、上で導いた公式より、\mu>\nuのときMaxwell方程式の第2式は
\frac{\partial}{\partial x^\mu}\sqrt{-g}F^{\mu\nu} dx^1\wedge\dots\wedge\widehat{dx^\nu}\wedge\dots\wedge dx^n=\frac{4\pi}{c}\sqrt{-g}j^\nu
dx^1\wedge\dots\wedge\widehat{dx^\nu}\wedge\dots\wedge dx^n
となります。\mu<\nuの時は左辺の符号が逆になりますが、F^{\mu\nu}=-F^{\nu\mu}というテンソルとして考えると成立します。成分だけ取り出すと、
\frac{\partial}{\partial x^\mu}\sqrt{-g}F^{\mu\nu}=\frac{4\pi}{c}\sqrt{-g}j^\nu
となり、共変微分に関する公式
\nabla_\mu F^{\mu\nu}=\frac{1}{\sqrt{-g}}\frac{\partial}{\partial x^\mu}\sqrt{-g}F^{\mu\nu}
を用いると、
\nabla_\mu F^{\mu\nu}=\frac{4\pi}{c}j^\nu
となり、曲がった時空におけるマクスウェル方程式を導くことが出来ました。

参考文献

1)本間泰史(2022),多様体論II(幾何学B2授業ノート)
2)坪井俊(2008),幾何学III 微分形式.東京大学出版
3)小林昭七(1989),接続の微分幾何ゲージ理論,裳華房
4)高間俊至(2023),微分幾何学ノート
event.phys.s.u-tokyo.ac.jp
5)エリ=デ=ランダウ・イェ=エム=リフシッツ著,恒藤俊彦・広重徹訳(1978),場の古典論原書第6版,東京図書
6)松尾衛(2019)相対論とゲージ場の古典論をかみ砕く-ゲージ場の量子論を学ぶ準備として-,現代数学社
7)谷村省吾(数理科学2023年8月号)「微分形式と電磁気学」,サイエンス社
8)北野正雄(数理科学2023年5月号)「電磁気と数学」,サイエンス社

*1:基底を用いない定義もありますが、今回は省略します。

*2:ベクトル解析の教科書では、体積要素と面積要素の幾何学的意味を考えることでこの式を導出していたりします。実際計算するのにはこの方が速いですが、幾何学的な意味が分かると微分形式に対する理解も深まるので、知っておくとよいです。

*3:ここまでくると、極座標ラプラシアンの一見ややこしく見える各項の係数は、単なるホッジ双対をとったときの係数であることが分かります。

*4:これらは一般相対論の本で「ベクトル密度」や「テンソル密度」と呼ばれているものとほとんど同じ(?)です。

*5:これについては参考文献[6][7][8]などをご覧ください。

直感的に理解する!! 軌跡と領域のトポロジー

はじめに

 みなさんこんにちは。Wathematica Advent Calendar 12/9担当、応用物理学科3年のY・Yです。私は高校生の時、軌跡や領域の問題がちょっと苦手でした。(よく条件を見落としていたり、除外点を除き忘れていたりしたためです。)さらに、1年生の時「数学概論B」という授業で位相空間が何を言いたいのかなにも理解できずに絶望しました。しかし、軌跡や領域の問題は集合のトポロジカルな性質を考えるうえで絶好の例であること、そして位相空間を理解していれば位相的に絶対にありえない軌跡や領域を描いてしまうことはないということを今更になって気づきました。位相空間に苦しんでいる1,2年生、そして軌跡と領域に苦しんでいる高校生(?)の役に立てれば幸いです。
 (注意:この記事は位相空間を直感的に理解できる手助けになるよう書いているので、ところどころ議論が荒いかもしれません)

軌跡の問題の例

家に残っていた高校数学の本が青チャートしかなかったのですが、このなかに、こんな問題がありました。

mが実数全体を動くとき、
\left\{ \begin{array}{ll}  mx-y=0 & \dots (a)\\ x+my-m-2=0 & \dots (b)\end{array} \right.
の交点Pが動く軌跡を求めよ。

解答:円\displaystyle(x-1)^2+(y-\frac{1}{2})^2=\frac{5}{4},ただし点(0,1)をのぞく。

求める軌跡は図1のようになります。

図1 点Pの軌跡

さて、この問題の本筋の解答としては、(a),(b)からmを消去する方法が考えられますが、図形的に考えても、軌跡が円C:\displaystyle(x-1)^2+(y-\frac{1}{2})^2=\frac{5}{4}の一部であることはわかります。(この記事の目的はそれを解説することではないので省きます。)それでは、除外点がただ一つ存在することはどのように直感的にわかるでしょうか?

軌跡を写像の像として見る

今回の軌跡は写像
f :m\in\mathbb{R}\rightarrow \mathbb{R}^2\ni P(x,y)
の像f(\mathbb{R})を求めるということに対応しています。逆に、図を見ると明らかなように、円C上の点Pを一つ決めると、直線OP:y=mxの傾きmが一意に定まります。
すなわち、f全単射になります。
さらに、点Pは円C上を連続的に動き、直線OPの傾きも連続的に変化するので、fおよびf^{-1}全単射連続写像になる、すなわちf同相写像になります。
さて、ここから円C全体が求める軌跡でないことは次の定理から分かります。

定理 その1
X,X位相空間で、Xがコンパクトであるとき連続写像f:X\rightarrow X'の像f(X)もコンパクト

これは、1次元の最大値最小値の定理の一般化になっています。さて、円Cは明らかにコンパクト(有界閉)ですので、f(\mathbb{R})が円Cだと仮定すると、f^{-1}(円C)=\mathbb{R}もコンパクトであることになり、実数がコンパクトでないことに矛盾します。
実際
f(m)\rightarrow (0,1) ,(m\rightarrow \pm\infty)
となり、点(0,1)が除外点であることが分かります。これがただ一つの除外点であることは中間値の定理を一般化した次の定理より従います。

定理 その2
X,X'位相空間で、Xが連結であるとき、連続写像f:X\rightarrow X'による像f(X)は連結

領域の問題の例

同じく青チャートから

x,y\in\mathbb{R}x^2+y^2\leq 1を満たすとき、
 (\star)\left\{\begin{array}{l}u=x+y \\v=xy\end{array}\right.
としたときの (u,v)の領域を求めよ。
解答:\frac{1}{2}u^2-\frac{1}{2}\leq v \leq\frac{1}{4}u^2(図2の斜線部分)

図2 (u,v)の領域

この問題を初めて見た人がよくする間違いとして、x^2+y^2=u^2-2v\leq1から
v\geq\frac{1}{2}u^2-\frac{1}{2}
としてしまうというものです。実際には、(\star)を満たす(u,v)の組が存在する必要十分条件として、v\leq\frac{1}{4}u^2が必要です。
この問題も、位相空間が分かっていればこのような間違いはしません。

領域のトポロジーを考える

この問題も連続写像
g:(x,y)\in D\rightarrow \mathbb{R}^2\ni (u,v)
の像g(D)を求める問題と考えることが出来ます。
ただしDは定義域
D:=\{(x,y)\in\mathbb{R}^2 | x^2+y^2\leq1\}
です。
領域Dは明らかにコンパクト(有界閉)なので、定理その1からg(D)もコンパクト(有界閉)になるということが分かり、先ほどの間違いでは領域が無限に発散してしまっているので、何か条件が足りていないことが分かります。*1

領域の「かたち」はトポロジーでどこまでわかるか

皆さんお気づきでしょうが、上の問題で出てきた写像g全単射ではありません。(x,y)(y,x)gで同じ点に移ります。そこで、領域E
E:=\{(x,y)|y\geq x\}
を考え、写像gD\cap Eへの制限
 g|_{D\cap E}:D\cap E\rightarrow g(D)
を考えると、証明は省きますが、これは全単射連続写像になります。
領域D\cap Eは図3のようになります。

図3 D\cap E

実はこれは、次の定理から同相写像になっています。

定理その3
Xがコンパクト空間、X'ハウスドルフ空間であるとき、f\rightarrow X'が連続な全単射写像ならば、f同相写像である。

さらに、gのヤコビ行列を考えると、
Dg:=\begin{pmatrix}\frac{\partial u}{\partial x}&  \frac{\partial v}{\partial x}\\\frac{\partial u}{\partial y} & \frac{\partial v}{\partial y} \\ \end{pmatrix}=\begin{pmatrix}1&1\\y & x\\\end{pmatrix}
となり、y>xでは正則になります。
したがってgC^\infty級であることと逆写像定理から、g(D\cap E)^og^{-1}C^\inftyであることが分かります。
このことから、g|_{D\cap E}微分同相写像になっていることが分かります。
実際図3の境界は図2の境界に移り、図3の尖点は図2の尖点に移っていることが確かめられます。

まとめ

位相空間論はどうしても集合の形式的な論理が多く、苦手に思う人も多くいると思います。しかし、こういう軌跡・領域の問題等と組み合わせることで、直感的に摑みやすくなってくれたらいいなと思います。( \mathbb{R}^nの位相が性質が良すぎるんじゃないかと言われたらそれはそうですが……)

参考文献

1) チャート研究所(2017),改訂版 チャート式 基礎からの数学II+B,数研出版
2)松坂和夫(2018) 新装版 集合・位相入門,岩波書店
3)坪井俊(2005)幾何学I 多様体入門, 東大出版

*1:領域が有界であっても閉集合でなければ像が有界になるとは限りません。

確率分布と頻度分布の関係

みなさんこんにちは。YYです。
今回は、確率分布と頻度について話していきたいと思います。
当然のことですが、確率が1/6だからと言って、6回さいころを投げれば必ず1回1の目が出るかと言われるとそんなことはありません。しかし、60000回さいころを振れば、そのうちおよそ10000回は1の目が出るはずです。
しかし、確率論の公理を勉強された方ならわかると思うのですが、上のような感覚的な”確率”と、数学で定義されている確率には、隔たりがあります。ところが、一般に(公理的)確率がpであるような事象を伴う試行の回数を大きくしていくと、その事象が起こる頻度はpに漸近します。この点において、私たちが持っている確率の感覚と、公理的に定めた確率は一致します。これは大数の法則から割と簡単に導出できることなのですが、このことについて書いてない本も結構あります。今回は特に、確率密度関数と頻度密度関数(こんな呼び方はしないかもしれませんが)が一致するという話をします。
統計力学量子論を勉強しているときに、思えばこの問題をちゃんと考えたことが無かったことに気が付いたので、もしかすると同じような人がいるかもしれないと思い、ここに書いておきます。
間違いがあれば指摘をお願いします。

確率変数と確率分布の記法の整理

考えている全事象を含む集合\Omegaを標本空間といい、
確率変数Xを、試行\omega\in\Omegaを特徴づける変数とします。
事象Aが起こる確率をP(A)で表します。
Xが離散的なとき、X=xとなる確率を確率関数p(x)で表し、その期待値 \langle X\rangle:=\sum_xxp(x)で表します。
Xが連続的な時は、x_1\leq X\leq x_2となる確率を確率密度関数f(x)を使って、\int_{x_1}^{x_2}f(x)dxで表します。期待値は\langle X\rangle:=\int_{-\infty}^{\infty}f(x)dxです。
また、累積分布関数をF(x):=\int_{-\infty}^xf(x)dxで定義します。
以下、簡単のため確率分布と確率関数及び確率密度関数を同一視します。
確率変数X_1,X_2,\dots X_nを、確率分布f(x)からのランダムなサンプルとするとき、X_1,X_2,\dots X_n, i.i.d. \sim f(x)と表します。(independently and identically distributed)
また、期待値\mu,分散\sigma^2のある分布からのランダムサンプルを、X_1,X_2,\dots X_n, i.i.d. \sim (\mu,\sigma^2)と表します。

大数の法則の主張

大数の法則と呼ばれる法則には、実は2種類あります。大数の弱法則(証明は簡単)と大数の強法則(証明は難しい)です。正直、大数の強法則と弱法則の違いがよく分かっていないのですが、参考のため載せておきます。大数の弱法則は強法則に含まれるらしいです。
大数の法則の仮定は、弱法則、強法則ともに同じで、確率変数X_1,X_2,\dots X_n, i.i.d. \sim (\mu,\sigma^2)で、分散\sigma^2<\inftyであることです。
ここでは証明は省きますが、弱法則の証明ならほとんどの確率・統計の本に載っています。
大数の法則は、どちらも、標本平均\overline{X}:=\displaystyle \sum_{i=1}^nX_nと期待値\muの関係を示した法則です。(\bar Xも確率変数であることに注意)

大数の弱法則

標本平均[TeX:]は期\overline{X}待値\muに確率収束する。
即ち、任意の\varepsilon>0に対し、
\displaystyle\lim_{n\to\infty}P(|\overline{X}-\mu|<\varepsilon)=1

大数の強法則

標本平均\overline{X}は期待値\muに概収束する。
即ち、
\displaystyle P(\lim_{n\to\infty}|\overline{X}-\mu|=0)=1

ベルヌーイ分布の例

ここで、我々が考えうる最もシンプルな確率分布の一つ、ベルヌーイ分布を考えたいと思います。
ベルヌーイ分布とは、確率変数X=1,0に対し、
P(X=1)=p
P(X=0)=1-p
という確率を与えるような分布です。(ただし0\leq p\leq 1)
\langle X\rangle = p+0=p
\sigma^2=(1-p)^2p+(0-p)^2(1-p)=p(1-p)
より、大数の法則の仮定を満たします。
ベルヌーイ分布からのランダムなサンプルを、X_1,X_2\dots X_n i.i.d.でとると、標本平均\overline{X}n\rightarrow \inftypに確率収束します。
\overline{X}\rightarrow_p p ( n\rightarrow \infty)

頻度分布と確率分布の対応

今までみてきたように、大数の法則は標本平均の標本数を増やした挙動についてしか教えてくれず、標本数を増やしていった時の分布の漸近的挙動の情報は含まれていません。しかし、実はこれだけで頻度分布が確率分布に近づいていくことが分かります。
確率分布f(x)に従う確率変数をランダムに取ります。すなわち、
X_1,X_2\dots X_N i.i.d.\sim f(x)
ここで、x\in Xを(添え字によらず)任意に取り、次のような確率変数の変換を行います。
Y_i=\left\{\begin{array}{ll}
 1& (X_i\leq x)\\
0 & (X_i> x)\\
\end{array}
\right.
するとY_1,Y_2,\dots Y_Nは、
p(Y)=\left\{\begin{array}{ll}
 F(x)& (Y=1)\\
1-F(x) & (=0)\\
\end{array}
\right.
なるベルヌーイ分布からのランダムサンプルになっています。(ここで、F(x)=\int_{-\infty}^{x}f(x')dx'は累積分布関数)
ここで、N個のサンプルの内、X_i\leq x\Leftrightarrow Y_i=1を満たすようなX_iの個数を、n(X\leq x)とし、頻度\eta(X\leq x)を、
\eta(X\leq x):=\displaystyle \frac{n(x)}{N}
で定義します。
\eta(X\leq x)=\displaystyle \frac{1}{N}\sum_{i=1}^NY_i=\overline{Y}
であることから、上述のベルヌーイ分布に対する大数の法則により、
\eta(X\leq x)\rightarrow_p F(x) (n\rightarrow \infty)
が成立します。
つまり、Nが十分大きければ、データがx以下の値を取るような頻度は、累積分布関数であるとほぼみなせます。
ランダムサンプルがx_1\leq X\leq x_2の間にある値をとるような頻度は、
\eta(x_1\leq X\leq x_2)\approx \int_{x_1}^{x_2}f(x)dx
となり、確率密度関数は、頻度の密度を表していると考えることが出来ます。

おわりに

この証明の肝は、公理的に定められた確率を、ベルヌーイ分布に従う確率変数に帰着させるところにあります。ベルヌーイ分布というある種簡単すぎる確率分布が、一般の確率分布の性質の証明に深くかかわっているのは、驚きだと思います。

参考文献

1)石谷健介(2021)「ガイダンス 確率統計―基礎から学び本質の理解へー」、サイエンス社
この本では、累積分布関数を用いる方法ではなく、ヒストグラムを使う方法で証明していました。
2)久保川達也(2017)[共立講座 数学の魅力11 現代数理統計学の基礎」、共立出版
基本的に用語はこの本を参考にしました。
3)高校物理の備忘録 大数の法則
physnotes.jp

表面張力あれこれ

2022年Wathematica アドベントカレンダー12/15担当のYY(Twitter: @YY71742817)です。(アドベントカレンダーのはずなのに未だに全体のページが出来てないっぽいですが……)
TLの皆さんや、ワセマの皆さんはきっと小学生の時から科学大好き少年・少女で、夏休みなんかは自由研究で実験なんかをやっていたことだろうと思います。そういう小学生向けの実験で、やたらと出てくるワードに「表面張力」があります。何となく、無重力では表面張力で水は球状になるとか、洗剤の界面活性剤は表面張力を破壊するとか(正確に言えば、水と油間の表面張力なのですが)聞いたことはあると思います。しかし、多くの人にとって分子間力と表面張力の違いはなぁなぁなのではないでしょうか。そこで、マクロな観点から表面張力を定義し、それによっておこる現象についていくつか紹介していきたいと思います。

表面張力の熱力学的定義

熱力学の復習

 今回必要になる熱力学の知識は、熱力学関数と示強変数の関係と、2つの系の平衡状態の知識です。田崎の7章及び付録F、清水の9章及び13章に相当します。
 熱力学関数U[S,V,N]をもちいて、示強変数である温度T、および圧力pは、次のように表せました。
p=\left( \dfrac{\partial U}{\partial V} \right )_{N,S}
T=\left ( \dfrac{\partial U}{\partial S} \right )_{N,V}
ここで、Sエントロピーです。
また、熱を通す可動な壁で分けられた2つの系が平衡状態にあるときの平衡条件は、
T_1=T_2
p_1=p_2
でした。これらは、熱力学関数の凸性から、例えば
\dfrac{\partial}{\partial v}U[S_1,S_2,V_1+v,V_2-v,N_1,N_2]=0
などから導かれました。
熱力学関数の微分
dU=TdS-pdV+\mu dN
のようにも表されました。
これをエントロピーに関して一回ルジャンドル変換するとヘルムホルツの自由エネルギー
dF=-SdT-pdV+\mu dN
が得られ、さらに体積に関してルジャンドル変換するとギブズの自由エネルギー
dG=-SdT+pdV+\mu dN
が得られました。

示量変数に「面積A」を追加する。

今まで熱力学関数としてのヘルムホルツエネルギーの変数は(T;V,N)でした。しかし、例えば二つの流体相が互いに平衡状態にあるとき、その状態は温度と体積だけでは決定できません。そこで、二つの界面の面積Aを新しく示量変数として加えます。そして、表面張力\gamma
\gamma \equiv \left ( \dfrac{\partial F}{\partial A}\right )_{T,V,N}
として定義します。
ヘルムホルツエネルギーの全微分
dF=-SdT-pdV+\gamma dA+\mu dN
となります。ルジャンドル変換の性質から、
 \gamma = \left ( \dfrac{\partial U}{\partial A}\right )_{S,V,N}=\left ( \dfrac{\partial G}{\partial A}\right )_{T,p,N}
が成り立ちます。

表面張力の直感的意味

ここで、表面張力の直感的な意味を考えるために、等温状態の下、体積V=0であるような液膜を、幅Lのコの字型のフレームと棒に張り、平衡状態を保ったまま図のように\Delta Xだけ広げることを考えます。

図1 表面張力のする仕事

この時、膜がする仕事Wは、
 W=-\Delta F =-\gamma\Delta A =-\gamma L\Delta x
になります。すなわち、膜が棒を引っ張る力は \gamma Lとなります。つまり、表面張力\gammaは、膜を縮める方向に働く、単位長さ当たりの力だと考えることが出来ます。

Young-Laplaceの関係式

ここまでの話を読まれて、「ヘルムホルツの自由エネルギーはVAを変数に持っているが、本当にこの二つは独立なのか」と気になった方もいると思います。実を言うと、これらは必ずしも独立に動くとは限りません。体積を大きくすると、当然表面積も大きくなってしまうからです。

図2 液滴の微小変分

図のように、液相1の中で液相2が平衡状態にあるとします。(気体と液体でもいいです。)液相1の体積をV_1、液相2の体積をV_2とし、その界面の面積をAとします。ここから、法線ベクトル \vec{n}方向に\varepsilonだけ微小に体積を増大させます。すると、体積V_2及び面積Aの微小変化は次のようになることが、微分幾何を使うとわかります。
\Delta V =\varepsilon \oint dA
 \Delta A =\varepsilon \oint 2H(\vec{r})dA
ここで、Hは平均曲率と呼ばれるもので、第一基本形式(曲面のRiemann計量)
g_{ij}=\dfrac{\partial\vec{r}}{\partial u_i}\cdot \dfrac{\partial\vec{r}}{\partial u_j}
及び第二基本形式
h_{ij}=\dfrac{\partial\vec{r}}{\partial u_i}\cdot \dfrac{\partial\vec{n}}{\partial u_j}
を用いて、
H=\dfrac{g_{11}h_{11}-g_{22}h_{22}-2g_{12}h_{12}}{det(g_{ij})}
と表されます。((u_1,u_2)は局所座標)
実は、各点での極大曲率半径R_1と、極小曲率半径R_2を用いて、
H=\dfrac{1}{2}\left ( \dfrac{1}{R_1}+\dfrac{1}{R_2} \right )
と表せます。この2つの相が平衡状態にあるためには、ヘルムホルツの自由エネルギーが\varepsilon =0で最小である必要があります。そこで、
\dfrac{\partial}{\partial \varepsilon}F[T;V_1-\Delta V,V_2+\Delta V,A+\Delta A,N_1,N_2]=\left(\dfrac{\partial F}{\partial  V_2}-\dfrac{\partial F}{\partial V_1}\right)\dfrac{\partial \Delta V}{\partial \varepsilon}+\dfrac{\partial F}{\partial A}\dfrac{\partial \Delta A}{\partial \varepsilon}=0
とすると、圧力差\delta p = p_2-p_1と表面張力の間にYoung-Laplaceの関係式
\delta p = \gamma \left ( \dfrac{1}{R_1}+\dfrac{1}{R_2} \right )
が成り立ちます。
特に、内側と外側の圧力差がないとき、表面は極小曲面を作ります。cf)針金に張ったシャボン膜

追記(2022/12/27)

12/25日分のアドカレ
mathlog.info
で首藤さんがこれと関連したテーマを扱ってます。
ここで出てきた平均曲率はshape operator のトレースを2で割ったものになります。

表面張力あれこれ

ここからは、導出抜きで、(今までもだいぶあってないようなものでしたが)諸々の結果だけ紹介していきたいと思います。

濡れと表面張力

図3 濡れと表面張力

図のように、重力の影響が小さい液滴を考えます。これは、水、空気、固体の3相平衡になっていて、水と空気の間の表面張力を\gamma_{lv}、水と固体の間の表面張力を\gamma_{ls}、空気と固体の間の表面張力を\gamma_{sv}とすると、これらと接触\thetaの間には、Youngの関係式
 \gamma_{sv} = \gamma_{sl}+\gamma_{lv}\cos\theta
が成り立ちます。
濡れによる仕事はDupreの式
 W_A=\gamma_{sv} +\gamma_{lv}-\gamma{sl}
により求まります。この二つを組み合わせた
 W_A = \gamma_{lv}(1+\cos\theta)
をYoung-Dupreの式と呼び、\thetaが小さいほど濡れやすいということを示しています。\theta >150°を超撥水、 \theta = 0を超親水と言います。

毛細管現象

図4 毛細管現象

半径Rが十分小さい毛細管を水中にいれたときの現象を考えます。この時、浸透仕事W_I\equiv \gamma_{sv}-\gamma_{lv}>0の時、毛細管現象が発生します。重力ポテンシャルを含んだヘルムホルツエネルギーを最小にすることを考えると、水面が持ち上がる高さは近似的に
H=\dfrac{2\gamma_{lv}\cos\theta}{\rho gR}
となり、半径に反比例します。(\theta接触角)

表面張力のミクロスコピックな説明

図5 液体分子に働く分子間力

図のように、液体内部の分子と界面近くの分子のエネルギーの安定性を考えます。液体内部は周りに分子が等方的にいるため、分子間力が等方的に働きます。一方液体表面は分子間力がほとんど内側からしか働きません。これにより、界面近くの分子の方がエネルギー的に不安定になり、表面積が大きいほどエネルギーも大きくなります。この寄与がどのくらいのものになるのかはちょっとまだ調べ切れてません……が、面積Aはほぼほぼ表面の分子数Nに比例すると考えられるので、\gamma =F_{surface}/Aとなり、ほとんどTのみに依存すると考えてよい気がします。

終わりに

大学に入って初めて表面張力に出くわしたのは巽流体力学ゼミでの表面張力波だったのですが、ネットを調べてもなかなかちゃんとしたことが書いてあるページが少なく、困った思い出があります。(ほぼ一年前)
導出をできるだけ省いて結果を並べようと思ったら、気づいたら数式マシマシの読みにくいブログになっていました……ごめんなさい……
質問があったらTwitterまでお願いします。

参考文献

1)田崎晴明(2000)『熱力学ー現代的な視点からー』(培風館
2)清水明(2021)『熱力学の基礎I 熱力学の基本構造』第2版(東大出版)
言わずと知れた熱力学の定番書。表面張力の勉強中に何度もひっくり返しながら復習しました。
3)中島章(2014)『化学の要点シリーズ12 固体表面の濡れ性―超親水性から超撥水性まで—』(共立出版
Wikipediaの表面張力のページの参考文献として一番上くらいに上がるのがこの本です。表面張力関係で今売られてる本で一番手に入りやすいかも?撥水についてやたら詳しいのですが、そこまでは読めていません……
4)ピエール ジル ドゥジェンヌ他、奥村剛 訳、(2003)『表面張力の物理学―しずく、あわ、みずたま、さざなみの世界—』第2版 (吉岡書店)
表面張力について書いてある本で見た感じ一番いろんなトピックを扱っていて、説明も物理寄りでわかりやすいです。英語版は早稲田だと無料で全文ダウンロードできるみたいです(今知った)
5)久保亮五(1961)『大学演習 熱学・統計力学』修訂版第56版(裳華房
表面張力の熱力学も扱っていて、一応YoungーLaplaceの式のお気持ち導出があります。(第4章問題【7】)
6)本間泰史(2022)『幾何学B1(曲面論)講義ノート
7)小磯憲史(1998)『共立講座 21世紀の数学12 変分問題』(共立出版
微分幾何パートの参考にしました。多分曲面論の本なら何でも載ってると思います。