『統計学におけるZ変換』
『次に何らかの条件のもとで採取した nヶのデータを考えましょう。
このnヶのデータを標本とかサンプルと呼びます。
データ一つ一つのことは、標本とかサンプルとか呼ばないのが普通のようです。
nヶのデータの平均を平均値(mean)、
平均値を中心にしたデータのバラツキ
具合を表す量を分散(variance)と呼びます。
分散の平方根が標準偏差(standard deviation)です。
ところで誤差ですが、本来誤差と表すより残差と表したほうがよいのでは、
と記しましたが、一般的には残差よりも誤差という言葉がよく使用されますので、
あえて誤差という言葉を使いましょう。
誤差を大別すると、偏り誤差と偶然誤差になります。
基本的に統計で相手にする誤差は偶然誤差だけです。
データに含まれる誤差が偶然誤差だけであれば、
そのデータを無限個採取すると、そのデータの分布は平均値を中心とする
正規分布と呼ばれる分布になります。
統計では正規分布に基づいて多くのことが理論展開されている。
ということはそれらの理論を理論的に正しく使うには、
採取するデータに含まれてよい誤差(残差)は
偶然誤差だけということになる。これ以外の誤差が含まれているデータは
統計処理してはならないのである。
さて、統計の基本は何であろうか?まず一番最初に出てくる基本事項は、
平均と分散であろう。平均については説明するまでもないだろうから、分散について
説明する。
分散は、偏差の2乗和の平均である。偏差にはプラスとマイナスの値があるので
そのままで和をとるのではなく、二乗してから和をとる。
分散の求め方は、電気の分野における実効値を求めるのと似たようなものである。
このようにして分散を求め、その平方根をとったものを標準偏差と呼んでる。
多くのかたが聞いたことがある標準偏差はこのようにして求められる。
分散では単位も二乗になるが、標準偏差にすることにより単位がもとに戻る。
さて、正規分布の話に戻ろう。今までの正規分の考え方では無限の数の正規分布
の図ができあがってしまうことになる。これでは大変ということで、
1ケの標準的な正規分布の図をつくり、
これにより他の全ての正規分布の図を代表することを考える。
これを正規分布の正規化(normalize)と呼ぶ。
正規化された正規分布を標準正規分布と呼ぶ。この正規化を行うのに、
Z変換と呼ばれる変数変換を行う。
統計の分野でのZ変換は、離散系の電子分野で使うZ変換とは全く異なる。実にまぎらわしい。
統計ではこのZ変換により、基準になるたった一つの正規分布として平均値がゼロ、
分散が1の標準化正規分布が得られる。
電気・電子分野の方はZ変換というと、ディジタルフィルタの設計等に使用するものを思い
浮かべることでしょう。この様に分野が違うと同じ専門用語でも全く違った意味になることがある。
恐ろしいですね。
電気電子分野におけるZ変換は、アナログ領域でのラプラス変換を離散領域(ディジタル領域)
に置き換えたものである。
今回の締めくくりとして、統計学におけるZ変換はこの変換により、いろいろな正規分布を
標準正規分布に集約することができるといった点で画期的なものであると記しておこう。』
/ 博士(工学)/技術コンサルタント
理論と経験の両方を蓄積してきています。
世界でどこもなしえていないテーマでも積極的に技術指導させて頂いており、世界初の実績も多数出してきています。
このとき、発生する特許などの工業所有権はすべてクライアント側に提供しています。
難解なこともわかりやすく解説する能力にたけていますので、技術コンサルティングのクライアント、技術セミナーの受講者から大好評を頂いております。