投票と確率の話(大阪市住民投票の結果を例に)

非常に簡単な仮定のもとでの計算なので、正当性は全く保証できません。

お遊び程度におつきあいください。

<二項分布>
確率変数XX=1,2,\cdots,nの値をとるとき

P(X=k)=\displaystyle\binom{n}{k}p^k(1-p)^{n-k}

となる。ただし0\leq p\leq 1

このときXは二項分布B(n,p)に従うという。

例えば、投票による採決などの場面で二項分布を考えることができます。

 

それぞれの投票者が確率pで賛成票を投じ、確率1-pで反対票を投じるという仮定をおけば

n人の全投票者の内で賛成票を投じた人数Xは二項分布B(n,p)に従います。

(無効票は考えていません。投票者とは有効な投票をした人と定義しておきます)

さて、これを先日の大阪市住民投票の結果に当てはめてみましょう。

投票結果として以下を用います。

<平成27年5月17日 執行 大阪市における特別区の設置についての投票の開票結果>

投票者数:1400429
賛成者数:694844
反対者数:705585

賛成者数と反対者数の差は10741人で、約10000票程反対者数のほうが多いです。

それでは二項分布のモデルで考えた場合、賛成者数と反対者数の差が10000人以内となる確率はどれくらいになるので
しょうか?

以下のような仮定をして考えてみます。

この住民投票における賛成票数Xを確率変数と考えるとき、

XB(1400429,0.5)に従うと考えます。

つまり、各投票者が賛成に投じるか反対に投じるかは独立な確率\frac{1}{2}で決まるという仮定を置きます。

(かなり雑な仮定です)

B(n,p)において10000人いないとなる確率は全投票者数の半分より、5000票以内の範囲で賛成者数のほ
多くなるまたは少なくなる確率です。

つまり

P(\frac{1400429}{2}-5000\leq X\leq \frac{1400429}{2}+5000)を求めることになります。

ところがこれは結構大変な計算です。

端をガウス記号を使って書き表してやるとすると、

B(1400429,0.5)の条件から、i\leq X\leq jとなる確率は

\displaystyle\sum_{k=\left[ \frac{1400429}{2}-5000 \right]}^{\left[ \frac{1400429}{2}+5000\right]}\binom{1400429}{k}0.5^k(1-0.5)^{n-k}

となり、膨大な数の二項係数の和を計算しないといけません。

そこで正面から計算するのはやめて、次の性質を利用して考えていきたいと思います。

nが非常に大きいとき

二項分布B(n,p)は正規分布N(\mu,{\sigma}^2)で近似できて、

np\cong\mu,np(1-p)\cong\sigma^2

が成立する。

正規分布N(\mu,{\sigma}^2)とはxを確率変数とするとき、確率密度関数f(x)

f(x)=\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)

となるような確率分布のことです。

投票者数がnが非常に大きいと考えると、この近似を使うことができて

\mu=1400429*0.5=700214.5,\sigma=\sqrt{14500*0.5*(1-0.5)}=591.6986

というように求めることができます。

正規分布における確率を計算するには、確率密度関数を積分すればいいので

\displaystyle\int^{\frac{n}{2}+5000}_{\frac{n}{2}-5000}\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)dx

n,\mu,\sigmaを代入して計算すると、

\displaystyle\int^{\frac{n}{2}+5000}_{\frac{n}{2}-5000}\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)dx\\ \\ \\ =0.99999999999999997

(正規分布の確率計算をしてくれるサイトhttp://keisan.casio.jp/exec/system/1402634507を利用しました)

となり、このモデルにおいては10000票以内に票差が収まるのは全く起こってもおかしくないことといえます。

同じようにして、1000票以内に票差が収まる確率を求めると、

\displaystyle\int^{\frac{n}{2}+500}_{\frac{n}{2}-500}\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)dx\\ \\ \\ =0.60190301578688123

となりそこまで高い確率ではないですが、

票差が2000票以内に収まる確率は

\displaystyle\int^{\frac{n}{2}+1000}_{\frac{n}{2}-1000}\displaystyle\frac{1}{\sqrt{2\pi{\sigma}^2}}\exp\left(-\frac{(x-\mu)^2}{2{\sigma}^2}\right)dx\\ \\ \\ =0.90898153985181337

となり、結構高い確率です。

以上の話から意見が拮抗しているときには、票決をとると一方が僅差で勝つということはよく起こるといえそうです。

コメントを残す