投票と確率の話(大阪市住民投票の結果を例に)

非常に簡単な仮定のもとでの計算なので、正当性は全く保証できません。

お遊び程度におつきあいください。

<二項分布>
確率変数XX=1,2,\cdots,nの値をとるとき

P(X=k)=\displaystyle\binom{n}{k}p^k(1-p)^{n-k}

となる。ただし0\leq p\leq 1

このときXは二項分布B(n,p)に従うという。

例えば、投票による採決などの場面で二項分布を考えることができます。

 

それぞれの投票者が確率pで賛成票を投じ、確率1-pで反対票を投じるという仮定をおけば

n人の全投票者の内で賛成票を投じた人数Xは二項分布B(n,p)に従います。

(無効票は考えていません。投票者とは有効な投票をした人と定義しておきます)

さて、これを先日の大阪市住民投票の結果に当てはめてみましょう。

投票結果として以下を用います。

<平成27年5月17日 執行 大阪市における特別区の設置についての投票の開票結果>

投票者数:1400429
賛成者数:694844
反対者数:705585

賛成者数と反対者数の差は10741人で、約10000票程反対者数のほうが多いです。

それでは二項分布のモデルで考えた場合、賛成者数と反対者数の差が10000人以内となる確率はどれくらいになるので
しょうか?

以下のような仮定をして考えてみます。

この住民投票における賛成票数Xを確率変数と考えるとき、

XB(1400429,0.5)に従うと考えます。

つまり、各投票者が賛成に投じるか反対に投じるかは独立な確率\frac{1}{2}で決まるという仮定を置きます。

(かなり雑な仮定です)

B(n,p)において10000人いないとなる確率は全投票者数の半分より、5000票以内の範囲で賛成者数のほ
多くなるまたは少なくなる確率です。

つまり

P(\frac{1400429}{2}-5000\leq X\leq \frac{1400429}{2}+5000)を求めることになります。

ところがこれは結構大変な計算です。

端をガウス記号を使って書き表してやるとすると、

B(1400429,0.5)の条件から、i\leq X\leq jとなる確率は

\displaystyle\sum_{k=\left[ \frac{1400429}{2}-5000 \right]}^{\left[ \frac{1400429}{2}+5000\right]}\binom{1400429}{k}0.5^k(1-0.5)^{n-k}

となり、膨大な数の二項係数の和を計算しないといけません。

そこで正面から計算するのはやめて、次の性質を利用して考えていきたいと思います。

nが非常に大きいとき

二項分布B(n,p)は正規分布N(\mu,{\sigma}^2)で近似できて、

np\cong\mu,np(1-p)\cong\sigma^2

が成立する。

正規分布N(\mu,{\sigma}^2)とはxを確率変数とするとき、確率密度関数f(x)

f(x)=\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)

となるような確率分布のことです。

投票者数がnが非常に大きいと考えると、この近似を使うことができて

\mu=1400429*0.5=700214.5,\sigma=\sqrt{14500*0.5*(1-0.5)}=591.6986

というように求めることができます。

正規分布における確率を計算するには、確率密度関数を積分すればいいので

\displaystyle\int^{\frac{n}{2}+5000}_{\frac{n}{2}-5000}\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)dx

n,\mu,\sigmaを代入して計算すると、

\displaystyle\int^{\frac{n}{2}+5000}_{\frac{n}{2}-5000}\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)dx\\ \\ \\ =0.99999999999999997

(正規分布の確率計算をしてくれるサイトhttp://keisan.casio.jp/exec/system/1402634507を利用しました)

となり、このモデルにおいては10000票以内に票差が収まるのは全く起こってもおかしくないことといえます。

同じようにして、1000票以内に票差が収まる確率を求めると、

\displaystyle\int^{\frac{n}{2}+500}_{\frac{n}{2}-500}\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)dx\\ \\ \\ =0.60190301578688123

となりそこまで高い確率ではないですが、

票差が2000票以内に収まる確率は

\displaystyle\int^{\frac{n}{2}+1000}_{\frac{n}{2}-1000}\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)dx\\ \\ \\ =0.90898153985181337

となり、結構高い確率です。

以上の話から意見が拮抗しているときには、票決をとると一方が僅差で勝つということはよく起こるといえそうです。

gnuplotは楽しい。

gnuplotは楽しい。それだけです。

課題で媒介変数表示で表されたグラフの概形を描くようなものがあったんですが、さっぱりわからなくて、ついつい描画ソフトに頼ってしまいました。

gnuplotでググってインストールして起動すれば、

すぐに使うことができます。

使い方なんかはこれまたググると親切なサイトがたくさん出てくるのでとても参考になります。

今回出された問題はこれです。

\begin{cases} x_1=(a+u\cos (\frac{v}{2}))\cos(v) \\ x_2=(a+u\cos (\frac{v}{2}))\sin(v) \\ x_3=u\sin(\frac{v}{2})&(a>0,-1\leq u\leq 1,0\leq v\leq 2\pi)  \end{cases}

のグラフの概形を描け。

全く分からなかったのでgnuplotに描かせたところ、このようになりました。

https://drive.google.com/file/d/0BwevNvX3ByPAZ3VvYTZTbkprR3c/view?usp=sharing

メビウスの輪ですね。

このときちょうど講義では曲面の裏表の話をしていたので、向き付け不可能な曲面があらわれたのはなんだかおもしろいです。

これを見てから、後出し的に概形の描き方がわかりました。(ずるい)

行列による線形変換がリプシッツ条件を満たすことの証明(備忘録)(この後使う用)

めっちゃかんたんだけど、忘れんうちに書いておこうと思います。

リプシッツ条件とは次のような条件のことです。

<n変数関数のリプシッツ条件>

n変数実関数f:\mathbb{R}^n\to\mathbb{R}^nに対して

\forall {\bf x},{\bf y}\in\mathbb{R}^n

\|f({\bf x}-{\bf y})\|\le L\|{\bf x}-{\bf y}\|

となるLが存在する。

ただし、ベクトル{\bf x}=(x_1,x_2,\cdots,x_n)\in\mathbb{R}^{n}

のノルム \|{\bf x}\|

\|{\bf x}\|=\sqrt{\displaystyle\sum_{i=1}^{n}x_i^2}

で定めます。

行列の線形変換がリプシッツ条件を満たしていることをいうには次を示すことになります。

行列A=\{ a_{ij}\}に対して、

\|A({\bf x}-{\bf y})\|\le L\|{\bf x}-{\bf y}\|(\forall {\bf x},{\bf y}\in\mathbb{R}^n)

を満たすLが存在する。

<証明>
\|A{\bf x}\|\le L\|{\bf x}\|

を満たすLが存在することを示せば十分である。

{\bf x}=(x_1,x_2,\cdots,x_n)\in\mathbb{R}^{n}とおけば

\|A{\bf x}\|\\  \\  \\  =\sqrt{ \left(\displaystyle\sum_{j=1}^{n}a_{1j}x_j\right)^2+  \left(\displaystyle\sum_{j=1}^{n}a_{2j}x_j\right)^2+\cdots+\left(\displaystyle\sum_{j=1}^{n}a_{nj}x_j\right)^2 }\\  \\  \\  \le\sqrt{ \left(\displaystyle\sum_{j=1}^{n}{a_{1j}}^2\right)\left(\displaystyle\sum_{j=1}^{n}{x_j}^2\right)+\left(\displaystyle\sum_{j=1}^{n}{a_{2j}}^2\right)\left(\displaystyle\sum_{j=1}^{n}{x_j}^2\right)+\cdots+\left(\displaystyle\sum_{j=1}^{n}{a_{nj}}^2\right)\left(\displaystyle\sum_{j=1}^{n}{x_j}^2\right) }\\
(各々の\sumの項に対してシュワルツの不等式を用いました)

=\sqrt{\left( \displaystyle\sum_{1\le i,j\le n}^{}{a_{ij}}^2 \right)\left( \displaystyle\sum_{j=1}^{n}{x_{j}}^2 \right)}\\  =\sqrt{\left( \displaystyle\sum_{1\le i,j\le n}^{}{a_{ij}}^2 \right)}\|{\bf x}\|

したがって

L=\sqrt{\left( \displaystyle\sum_{1\le i,j\le n}^{}{a_{ij}}^2 \right)}

とすれば、成り立つことが示せました。

よって

行列による線形変換はリプシッツ条件を満たします。

開いた系の熱力学第1法則ー熱力学備忘録

今受けている講義を元に僕が個人的にまとめた備忘録です。

よくわかってないところを整理する目的で書いているので、たくさん間違うと思います。

あやまりなどがあればどうぞご指摘ください。

はじめに、これから式を導出していくうえで必要となりそうな法則をいくつか認めておきます。

「熱力学第0法則」
系に対して、熱力学的平衡を実現するような状態が存在する。
熱力学的な平衡状態とは、熱平衡、力学平衡、相平衡、化学平衡が実現されている状態である。
「熱力学第1法則」
系がある状態1から状態2へ変化するとき、系の持っているエネルギーをそれぞれE_1E_2とし、
系が得た熱をQ_{12}、系のする仕事をL_{12}とすると、
次のような式が成立する。

{\bf E_2-E_1=Q_{12}-L_{12}}\cdots(1)

熱力学第1法則はエネルギー保存則を熱力学的に記述したものです。

以下の議論では上記2つを認めたものとして進めていきます。

開いた系とは系の流体(作動流体)が密閉されておらず、流れているような系のことです。

さて、開いた系の例として次のような装置{\bf M}を考えます。

{\bf M}は吸入弁と排出弁とピストンを持っており、それぞれの弁の高さはz_1,z_2とします。

内部の体積をV、圧力をPとします。

また、{\bf M}のもつエネルギーをE_tとします。

{\bf M}において次のような過程を考えます。

これらは本来同時に起こっていますが、このように過程に分けて考えるほうがわかりやすいのでそのように考えることにします。

はじめは、吸入弁、排出弁ともに閉じているとします。

また、各過程においては熱力学的平衡状態が保たれているものとします。

「装置{\bf M}における操作過程」


過程1:吸入弁を開き、単位時間当たり圧力p_1、体積v_1、速さw_1、質量m_1の作動流体を外部から入れる。その後、吸入弁を閉じる。

過程2:熱Q_{12}を吸収させ、ピストンに仕事L_{12}をさせる。

過程3:排出弁を開き、単位時間当たり圧力p_2、体積v_2、速さw_2、質量m_2の作動流体を外部へ出す。 その後、排出弁を閉じる。

過程1、過程3があるのが閉じた系との違いです。これが時間的な作動流体の流入と流出を表しています。

装置の模式図を示しておきます。

SnapCrab_NoName_2015-5-3_23-38-12_No-00

さて、ここで系のエネルギーE_tをについて考察しておきます。

装置{\bf M}に単位時間当たり圧力p、体積v、速度w、質量mの作動流体が高さzから

流入してくるとします。(流出する場合は速度w<0です)

このときE_tは、装置内部の作動流体そのものの持つエネルギーをUとして、重力加速度をgとすると、

装置内の作動流体が受ける仕事、流入する作動流体の運動エネルギーと位置エネルギーを考慮して、

E_t=U+pv+\frac{mw^2}{2}+mgz\cdots(2)

と表せます。

ここで、作動流体の運動エネルギーと位置エネルギーの項\frac{mw^2}{2}+mgzは、装置がとてつもなく大きくない限り、他の項に対

して非常に小さくなるので、無視することができます。

これは実際に例を作って計算して比べて見ればわかります。例えば0度の水を100度にするために必要なエネルギーで、

高度一万メートル以上の高さにその水を持ち上げることができます。装置はそんなに大きくはありません。

よって、H=U+pvと置くことによって、

E_{t1}=H_1=U_1+p_1v_1,E_{t2}=H_2=U_2+p_2(-v_2)

とすることができます。U_1,U_2は過程1、3における作動流体の内部エネルギ―です。

このように定めたHをエンタルピーといいます。

さて過程1、過程3における{\bf M}のエネルギーをそれぞれE_{t1},E_{t2}とすると、

熱力学第1法則より

E_{t2}-E_{t1}=Q_{12}-L_{12}\cdots(2)^{\prime}

が成り立ちます。

エンタルピーを用いて書き換えると

H_2-H_1=Q_{12}-L_{12}\cdots(2)

が成立します。

さて系が行う仕事としてすべてを捉えた場合、ピストンのする仕事L_{12}に加えて、

流出入に際して仕事p_2v_2-p_1v_1を系は外部に行っているといえます。

したがって、外部にした正味の仕事をL_{a}とすれば、L_{a}=\int_{1}^{2}pdV(定義式)から、

L_{a}=\int_{1}^{2}pdV=L_{12}+(p_2v_2-p_1v_1)\cdots(3)

とできて、これはp-Vグラフにおける面積を考えることによって

L_{12}=\int_{1}^{2}pdV-p_2v_2+p_1v_1\\  =\int_{1}^{2}Vdp=Q_{12}-(H_2-H_1)\cdots(4)

がいえます。

開いた系において、系が外部にした仕事を考える場合には、内部エネルギーUに加えて、

閉じた系における仕事\int_{1}^{2}pdV(絶対仕事)ではなく、

\int_{1}^{2}Vdp(工業仕事)を考えたほうが都合がよいです。

もちろん工業仕事は本来の仕事の定義とは外れていますので、便宜的にそのような名前がついているだけです。

絶対仕事L_{a}、工業仕事L_{12}を用いると

閉じた系、開いた系において熱力学第一法則をそれぞれ次のように記述することができます。

系が状態1から状態2に変化するとき

[閉じた系に対する熱力学第1法則] : {\bf U_2-U_1=Q_{12}-L_{a}}

[開いた系に対する熱力学第1法則] : {\bf H_2-H_1=Q_{12}-L_{12}}

風景画と聖地めぐり

 僕は風景画が好きです。

理由は二つあります。

ひとつは風景画を見ることによって、ここからは遠くてとてもいけないような世界の光景を間接的に見ることができるからです。

世界中のいろいろな人達が描いた絵を集めたような画集はとても好きです。

しかし、もし世界中の風景が見たいなら、写真のほうがより正確に見ることができるし、

インターネットで検索すれば、世界中の名所の動画を見ることができるじゃないかという人がいるかもしれません。

確かにそうです。僕は風景の写真や動画を見るのも同じく好きです。

ただ、風景画が好きなのにはもう一つの理由があります。

それは風景画にはその絵を描いた人の視点から見た風景というものが直に反映されるからです。

風景の解釈といってもいいかもしれません。

空の色一つとっても、どのような青で描くか、そもそも青を使うのかなど人によって様々です。

なじみのある地域の風景画や、自分の行ったことがある場所の風景画などをみるとこれがとてもよくわかります。

同じ世界に生きて、同じ風景をみていたはずなのに描く世界はこうも違い、その場所の色はその人にはこのように見えているのか

と、あるいはこのように描こうとしたのかということを感じることができてとても面白いです。

 では逆に、誰かの描いた風景画をみて、その場所に実際に行ってみるという行為はどうでしょうか?

例えば、聖地めぐりという活動があります。

アニメ・映画・ドラマ・小説など、その作品の舞台となった地を訪れる活動のことです。

その作品の舞台、背景となった場所へ行くことは、その作品をより深く楽しむという意味だけでなく、

人によるものの見え方の違い、解釈の違いを浮き彫りにしてくれるでしょう。

元となった風景をみて、作者が加えた加工やデフォルメに気づくでしょう。

また、それと同時に作者がその風景を見て、なにを描こうとしたか、作品と実際の風景はどこが共通しているのか

ということを考えることができるでしょう。

そのように、現実を下敷きにして作り出した作品がリアリティを持つのではないかと、僕は考えています。

どこかで現実とつながっているけれども、やはり現実そのもを映し出しているわけではない。

風景画はそこが面白く、素晴らしいと思います。

線形微分方程式と解空間について

線形微分方程式の解の集合を解空間といいますが、実はこの解空間は線形空間になっています。

今日はそれを確かめます。あまり厳密な議論はしません。

次のような線形微分方程式を考えます。

y^{(n)}+a_{n-1}y^{(n-1)}+\cdots+a_0y=0\cdots(1)

y^{(i)}yの第i次導関数を表します。y

さてy_1,y_2(1)の解であるとすると、

それらの線形結合c_1y_1+c_2y_2(1)の解になっています。

なぜなら、微分演算の線形性から

(c_1y_1+c_2y_2)^{(n)}+a_{n-1}(c_1y_1+c_2y_2)^{(n-1)}+\cdots+a_0(c_1y_1+c_2y_2)\\  \\  = c_1(y_1^{(n)}+y_1^{(n-1)}+\cdots+y_1)+c_2(y_2^{(n)}+y_2^{(n-1)}+\cdots+y_2)\\  \\  =c_10+c_20\\  \\  =0

ここではスカラー倍と和に関しての公理しか確認しませんが、他の線形空間であるための公理についても解空間はその条件を満たしていることが確かめられます。

詳しくは線形代数の教科書を参照してください。

線型空間ではその次元の数だけの線形独立なベクトルをとってくることができて、

線形空間の任意のベクトルはそれらの線形結合で表せるということが知られています。

線形空間上の元a_1,a_2,\cdots,a_kが線形独立であるとは

c_1a_1+c_2a_2+\cdots+c_ka_k=0\to c_1=c_2=\cdots=c_k=0

が成り立つことをいいます。

線形空間の次元とは、その空間上で線形独立なベクトルの組の最大数のことです。

(1)の解空間にこの線形空間の定理を適用すると、

解空間にはある線形独立な解の組が存在して、それらの線形結合によって

任意の元は表される!ということがいえます。

さてそれではそのような基底となる解の組はいったいいくつ必要なのでしょうか?

すなわち解空間の次元はいくつなのでしょうか?

実は n階線形微分方程式の解空間の次元はちょうどnになることが知られています。

その証明はまた後ほど。

チョコレートと数学の話

チョコレートの定義って、どういうものなんでしょうか?

天下のお菓子会社、江崎グリコさんのサイトの情報によると

日本の法律では次のように定められているようです。

「チョコレート」とはチョコレート生地だけか、チョコレート生地を全重量の60%以上使用した加工品のことです。チョコレート生地とはカカオ分が35%以上、或いはカカオ分が21%以上でそれを合わせた乳固形分が35%以上のものです。
「チョコレート菓子」とはチョコレート生地が全重量の60%未満で、ナッツやフルーツなど他の食材とを組合わせたチョコレート加工品のことです。
「準チョコレート」とは準チョコレート生地単独か、準チョコレート生地の比率が60%以上の加工品のことです。準チョコレート生地とはカカオ分が15%以上或いはカカオ分が7%以上でそれを合わせた乳固形分が12.5%以上のものとなっています。
「準チョコレート菓子」とは準チョコレート生地が全重量の60%未満で、ナッツや、ビスケットなど他の食材とを組合わせたチョコレート加工品のことです。
引用元: http://www.ezaki-glico.com/qa/products/candy/answer/a23.html

さて、上の定義こそがチョコレートの定義だ!と主張したいのではありません。

このような食品表示の定義は国によって様々ですし、さらに言えば最初はその

ような区別は特になくて、カカオを含むようなお菓子をなんでもかんでも

チョコレートと呼んでいたでしょう。時代が進むにつれて、チョコレートを

しっかりと分類する必要が出てきて、世の中にある様々なチョコレートの性質

を考慮して、上のような便宜上の定義が定まったのです。

さて、上の定義を「チョコレートの公理」と呼ぶことにしましょう。

公理という言葉は聞きなれない言葉かもしれませんが、これは数学の世界で

「議論の出発点としての仮定」のことを指します。

議論の出発点というけど、じゃあその公理の正当性はどこからくるのかと考え

る人がいるでしょう。

実はどのような公理たちを定めるかということは、それらを定めると今まで

考えてきたモノがうまく説明できたり、それらを認めることで面白いモノにつ

いて議論できたり、などという観点から決めるのです。

ちょうど「チョコレートの公理」と同じように、先人の様々な数学の議論がう

まく説明できたり、そこから発展して面白い議論をしたりするために、

便宜的に公理を定めます。

だから逆に言えば、どのような公理を定めてもよく、

公理から論理的に導かれたことがらは公理によってその正当性が保証されるのです。

僕が数学が厳密で、ある意味すごく自由な学問であると思うのにはこのような理由があります。

公理以外の仮定を議論に持ち込まなかったり、定めた公理の上で議論できる限りのことをやりつくそうとする行為はすごく自由な行為だと僕は思うんです。

行列式を微分しよう!

試みとして、ですます調で書いてみようと思います。書きにくかったら戻します。

行列式を微分すると、普通の関数の積の微分公式のような、きれいな公式が出てくるでしょうか?

実際にやってみましょう。

いまxで微分可能な関数のみを成分とするn\times n行列A=\{a_{ij}\}を考えます。

Aに対して行列式 |A|

\displaystyle\sum_{\sigma\in S}^{}sgn(n)a_{1\sigma (1)}a_{2\sigma (2)}\cdots a_{n\sigma (n)} \cdots (1)

と定義されます。

\sigma1,2,\cdots,nを並べ替えた順列を表していて、Sはそのような\sigma全体の集合です。

\sigma(i)\sigmai番目の要素を取り出す関数で、sgn(\sigma)\sigmaが偶置換なら1,奇置換なら-1となる関数です。

次の公式を後で使います。証明は帰納法でできます。

n個の積に関する微分の公式)
f_1,f_2,\cdots,f_nをxで微分可能な関数とするとき、f_ix微分を
f_i^{\prime}と表すことにすると

\frac{d}{dx}(f_1f_2\cdots f_n) =(f_1^{\prime}f_2\cdots f_n) +(f_1f_2^{\prime}\cdots f_n) +\cdots +(f_1f_2\cdots f_n^{\prime}) \cdots (2)

(2)の公式を使って、|A|を微分すると

\frac{d}{dx}|A|= \displaystyle\sum_{\sigma\in S}^{}sgn(n)a_{1\sigma (1)}^{\prime}a_{2\sigma (2)}\cdots a_{n\sigma (n)}\\ +\displaystyle\sum_{\sigma\in S}^{}sgn(n)a_{1\sigma (1)}a_{2\sigma (2)}^{\prime}\cdots a_{n\sigma (n)}\\ +\cdots\\ +\displaystyle\sum_{\sigma\in S}^{}sgn(n)a_{1\sigma (1)}a_{2\sigma (2)}\cdots a_{n\sigma (n)}^{\prime}\\

行列式の定義から、

各項 \displaystyle\sum_{\sigma\in S}^{}sgn(n)a_{1\sigma (1)}a_{2\sigma (2)}\cdots a_{i\sigma}^{\prime} \cdots a_{n\sigma (n)}

Aの 第i行の成分すべてをxで微分した行列の行列式になっています。

これより、次の公式が導けました。

(行列式の微分公式)

\frac{d}{dx}\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\  a_{21}&a_{22}&\cdots&a_{2n}\\  \vdots&\cdots&\vdots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}=  \begin{vmatrix} a_{11}^{\prime}&a_{12}^{\prime}&\cdots&a_{1n}^{\prime}\\  a_{21}&a_{22}&\cdots&a_{2n}\\  \vdots&\cdots&\vdots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}  +  \begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\  a_{21}^{\prime}&a_{22}^{\prime}&\cdots&a_{2n}^{\prime}\\  \vdots&\cdots&\vdots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}  +\cdots  +  \begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\  a_{21}&a_{22}&\cdots&a_{2n}\\  \vdots&\cdots&\vdots&\vdots\\ a_{n1}^{\prime}&a_{n2}^{\prime}&\cdots&a_{nn}^{\prime} \end{vmatrix}

実はこの公式はあとで証明したい事柄があって、そのために導いておきました。

その事柄についてはまとまり次第、書きたいと思います。

n階線形微分方程式を行列形式にして解くやり方。

この前友達にいろいろ聞いて、納得できたので書いてみます。 次のようなn階線形微分方程式を考えることにします。

\frac{d^{n}x}{dt^{n}}+a_{n-1}\frac{d^{n-1}x}{dt^{n-1}}+\cdots+a_0{x}=0\cdots (1)

ただし、a_i\in\mathbb{R}(i=1,2,\cdots,n)としておきます。

行列形式で考えるために、ここでn個の成分を持った次のようなベクトルを考えます。

{\bf x}=(\frac{d^{n-1}x}{dt^{n-1}},\cdots,\cdots,\frac{dx}{dt},x)^T\cdots (2)

Tは転置記号。 {\bf x}はn成分のベクトル。

(1)をつかい

いま、ベクトルに関する時間微分の演算子を\frac{d}{dt} と書くことにすると、

\frac{d}{dt}{\bf x}=A{\bf x}となる行列Aを次のように定めることができます。

A=\left(  \begin{array}{ccccccc}  0&1&0&\cdots&0&\cdots&0\\  0&0&1&\cdots&\cdots&\cdots&0\\  \vdots&\vdots&\vdots&\ddots&\vdots&\vdots&\vdots\\  \vdots&\vdots&\vdots&\vdots&\ddots&\vdots&\vdots\\  \vdots&\vdots&\vdots&\vdots&\vdots&\ddots&\vdots\\  0&\cdots&\cdots&\cdots&\cdots&0&1\\  -a_{n-1}&-a_{n-2}&\cdots&\cdots&\cdots&-a_1&-a_0\\  \end{array}  \right)

\frac{d}{dt}{\bf x}=A{\bf x}\cdots (5)

と書きかえることができます。

実はA=\{a_{ij}\} が相異なる固有値をn個持つとき、(5) の解は指数行列e^{tA} を用いて形式的に

{\bf x}={\bf c}e^{tA} \cdots (6)

と書けることが知られています。ただし{\bf c} は定ベクトルです。

e^{tA}の定義は

e^{tA}=\displaystyle\sum_{k=0}^{\infty}\frac{(tA)^k}{k!}\cdots (7)

です。

(6)(5)の解になっていることを確かめておきましょう。

いま正則な行列U を用いて

\Lambda=U^{-1}AU=\left( \begin{array}{cccc} \lambda_{1} & & &0\\ & \lambda_{2} & & \\ & & \ddots & \\ 0 & & & \lambda_{n} \end{array} \right)\cdots (8)

と表されているとします。 ただし\lambda_1,\cdots,\lambda_nAの固有値で、全て相異なるとします。

このときA=U\Lambda U^{-1},A^k=U\Lambda^{k}U^{-1}であるから

e^{tA}=\displaystyle\sum_{k=0}^{\infty}U\frac{(t\Lambda)^k}{k!}U^{-1}\\ =U\left( \begin{array}{cccc} \displaystyle \sum_{k=0}^{\infty}\frac{(t\lambda_1)^k}{k!} & & &0\\ & \displaystyle \sum_{k=0}^{\infty}\frac{(t\lambda_2)^k}{k!}& & \\ & & \ddots & \\ 0 & & & \displaystyle \sum_{k=0}^{\infty}\frac{(t\lambda_n)^k}{k!} \end{array} \right)U^{-1}\\ \\ =U\left( \begin{array}{cccc} e^{\lambda_{1}t} & & &0\\ & e^{\lambda_{2}t} & & \\ & & \ddots & \\ 0 & & & e^{\lambda_{n}t} \end{array} \right)U^{-1}

よって

\frac{d}{dx}e^{tA}=U\left( \begin{array}{cccc} \lambda_{1}e^{\lambda_{1}t} & & &0\\ & \lambda_{2}e^{\lambda_{2}t} & & \\ & & \ddots & \\ 0 & & & \lambda_{n}e^{\lambda_{n}t} \end{array} \right)U^{-1}\\    =U\Lambda \left( \begin{array}{cccc} e^{\lambda_{1}t} & & &0\\ & e^{\lambda_{2}t} & & \\ & & \ddots & \\ 0 & & & e^{\lambda_{n}t} \end{array} \right)U^{-1}\\    =U\Lambda U^{-1}U \left( \begin{array}{cccc} e^{\lambda_{1}t} & & &0\\ & e^{\lambda_{2}t} & & \\ & & \ddots & \\ 0 & & & e^{\lambda_{n}t} \end{array} \right)U^{-1}\\    =Ae^{tA}

よって、(6) (5) の解になっていることが確かめられました。

つまり上のようにn個の相異なる固有値を持つ場合には、n階線型微分方程式は行列の固有値を求めることに帰着させることができます。