ヘヴィテールの話

はじめに

試験週間にこんばんは.

試験勉強をサボって適当にブラウジングしていたら,たまたまヘヴィテールに関する情報へ行き当たりました.ちょっと面白い分布のことを知ったので書き記しておきます.

おそらくですが,この分布は多少なりとも統計を学んだことのある人にとっては常識だと思います.当然,この記事に特筆性はありません*1.個人的に興奮したから書くだけです.許してください.

Cauchy 分布

Cauchy というのはあの Cauchy 列とか Cauchy-Riemann の式とかの Cauchy です.

確率密度関数
 \displaystyle{ f(x) = \frac{1}{\pi (1 + x^2)} }
で与えられるような分布を標準 Cauchy 分布と呼びます.こいつはこんな↓感じの見た目をしています.
f:id:villach:20190727223515p:plain
ね,かわいいでしょ.こいつの性質について見ていきます.


まず,大雑把な感想として,Cauchy 分布は正規分布に形が似ています.平均を中心として左右対称だし.
そんでもってこいつの最頻値は見ての通り  0 です.


で,ここからが面白いんですが,Cauchy 分布は期待値を定義できません.どう見ても平均は0なのに.素直に計算してみましょう.

 \displaystyle{ \mu = \int_{-\infty}^\infty \frac{x}{\pi (1 + x^2)} dx }

あーめんどくさい でも頑張って積分しましょう(置換するだけです)

 \displaystyle{ =\lim_{C_1 , C_2 \to \infty } \frac{1}{2 \pi} \{ \log (1 + C_1^2) - \log (1 - C_2^2) \} }

これは  C_1, C_2 の持っていき方によって任意の値を取ります. C_1, C_2 は独立なので.

なぜこんなことになるのでしょうか.正規分布はあれほど素直だったのに.理由は Cauchy 分布がヘヴィテールであることらへんに存在しているらしいです.つまり,外れ値の生じる確率がそれなりにあるので無視できないということっぽい.

期待値が定義できないので当然分散と標準偏差も考えられません.中心極限定理も成り立ちません.


こんな分布を考えて何が嬉しいかというと,たとえば株価や為替の分布に使われているそうです.相場が極端に動くことはそこまで珍しい現象でもなく,正規分布よりこっちを使うほうが良い近似になるとか.それから,年間最大1時間降雨量のような,これまた極端に動き得る数値の分布にも使われるみたいです.

おまけ

ここまで読んでくれた同クラスのみんなのためにおまけをつけました.Poisson 分布  P_0 (\lambda) の平均が  \lambda に等しいことの証明です.なぜこれを書くかと言えば,確率統計前期末試験の最終(証明)問題として持ってこられるのはこのくらいしかないと考えたからです.でも少しテクニカルなので出ないかもしれません.まあ出なくても手の運動になるのでよいでしょう.

Poisson 分布の確率密度関数
 \displaystyle{ f(k) = \frac{\lambda^k}{k!} e^{-\lambda} \; ( k \ge 0 ) }
で与えられます.また素直に計算してみます.

 \displaystyle{ \begin{eqnarray} \mu &=& \sum_{k = 0}^\infty k \frac{ \lambda^k}{k!} e^{-\lambda}  \\ &=& \sum_{k = 1}^\infty \frac{\lambda^k}{(k-1)!} e^{-\lambda} \\ &=& \sum_{k = 1}^\infty \frac{\lambda \; \lambda^{k-1}}{(k-1)!}  e^{-\lambda} \\ &=& \lambda   e^{-\lambda} \sum_{k = 1}^\infty \frac{\lambda^{k-1}}{(k-1)!} \\ &=& \lambda   e^{-\lambda} e^\lambda \\ &=& \lambda \end{eqnarray}}

よし(適当)*2

分散も似たような感じで求まります.


ちなみにですが,これが出題されなかった場合は正規分布の平均・分散を求めさせるやつが出ると踏んでいます.よろしくおねがいします.

追記(2019/09/16)

応用数学(Fourier 変換)の試験で Cauchy 分布と関連した問題が出たので,今更ながら詳しく書いておきます.係数とか問題文はうろ覚えなので適当です*3

問題の内容は要するに  \displaystyle{ \int_{-\infty}^{\infty} \frac{1 + ix}{x^2 + 4} dx} を求めさせるもので,まあ普通にやっていけばよいのですが,問題用紙に書いてあった一文が非常に怪しかった.

ただし, f(x) が奇関数ならば  \displaystyle{  \int_{-\infty}^{\infty} f(x) dx = 0 } であることを利用してよい.

これはなんだぁ~? 証拠物件として押収するからなぁ~?(ねっとり)

 f(x) が奇関数なのに  ( -\infty, \infty) 積分しても決まった値に収束しない関数があるのはこの記事で書いてきた通りです.というか Cauchy 分布の確率密度関数がまんま問題の関数になってます.

この問題の場合は  \displaystyle{ \int_{-\infty}^{\infty} \frac{ix}{x^2 + 4} dx} 積分値が  0 になるとか言っちゃわずに解決できるのでそっちを使いましょう. {x}/{(x^2 + 4)} は実関数なので,

 \displaystyle{ \int_{-\infty}^{\infty} \frac{1 + ix}{x^2 + 4} dx = \int_{-\infty}^{\infty} \frac{1}{x^2 + 4} dx + i\int_{-\infty}^{\infty} \frac{x}{x^2 + 4} dx}

とすれば実部同士虚部同士を比較することで計算できます.言い忘れてましたが積分値自体は Fourier 積分定理を使って既出の状態になってます.

もうちょっと捕捉しとくと,積分区間 \lim_{C \to \infty} (-C, C) のように固めてしまえば確かに積分の結果を  0 にできます.しかし,こうして出てきた値は Cauchy の主値と呼ばれ,厳密な積分値とは通常区別されます(ここでも Cauchy の名前が登場しましたね).

余談ですがこの問題は正答率が非常に低かったそうです.問題文に Fourier 積分定理を使えと書いてあり,誘導もバリバリあったにもかかわらず,です.まあこの辺は慣れが必要だと思うので,単純に学生の演習量不足が原因ではないでしょうか*4


あと確率統計の試験に Poisson 分布の平均を求めさす問題は出ませんでした.正規分布の平均・分散も出なかった.ごめんね.

*1:いつものことです.

*2:念のため書いておきますが,最後らへんでは  k - 1 k によって取りかえ Maclaurin 展開を使っています.

*3:問題用紙も解答用紙も試験終了後一定期間で捨ててしまうため.

*4:教科書に類題あったけどやれとは言われなかったのでやってなかった人がたくさんいたらしい.課題として出されたプリントをやれば足れりという態度には賛同しかねますが…….