コラム・特集

8.2 時系列

IEハンドブック
第13部 IE技術者の定量的方法論

第8章 時系列予測

8.2 時系列

時系列の数学的な定義

データを時間の関教として図示した後(とのような計算を行う場合にも,その前にしておくべき手順であるが),予測を行う者はデータを時間の関数にあてはめようとするであろう当然,その曲線はすべてのデータの点を通るとは限らないそこで,データと曲線との差について解析できるように,統計的なアプローチをとることが望ましい。それゆえ,確率論の援用が必要である 。本節では,予測したい変数を表わすのに用いられる数学的な諸概念の定義を示す

まず,Zt,t=1,2,… ,Tを確率変数の集合とする独立変数tは時間(または時点)を表わし,Ztの観測値が予測したい変数のために用いられるデータである。したがって,確率変数Zt,t=1,2,¨¨の列は確率過程とも呼ばれる確率変数の集合はt,t=1,2,……のすべての値について同時確率密度関数をもつとする。

次に ,z̄T( ℓ)は時点t=Tに おいて , 時点先のt=T+について求めたZTの予測値を表わすとする。したがって ,予測値は予測期間(またはリードタイム) ( ℓ>0)を定めて求められる。なお,ZT+ は連続的な確率変数であるから,どのような予測値も不正確なものになる。それは,ZT+ℓ がちょうどある値をとる 確率が0であるためである。それゆえ,誤差の規準を定めて期待される誤差規準を最小にする手順を選ぶ必要がある 誤差ε T(ℓ )を時点Tで求めた予測値との偏差 ,

∈T(ℓ)=27(ℓ)― ZT+        (1)

とおく,一般に用いられる2種の規準は,絶対偏差の期待値 ,

El∈T(ℓ)|=E|ZT(ℓ)― ZT+ 1|    (2)

と,2乗偏差の期待値 (平均2乗誤差),

E∈^2T(ℓ)=E(zT(ℓ)― ZT+ℓ)^2   (3)

である。時系列の同時確率密度関数が既知であれば,式 (2)または(3)を最小にするZT(ℓ)の値が計算できる。たとえば,平均2乗誤差を最小にする予測値は,(Z1,Z2, ……,ZT)を与えたときのZT+ℓ の条件付期待値であることが証明されている。 実際には,未来の同時確率密度関数は未知であり,予測を行う者は,候補となる同時確率密度関数の検定をするのに,十分なデータをもたな いことがしばしばある。それゆえ,時系列の最初の2つのモメントに基づいた予測モデルを使うのが現実的である。というのは.これらの統計量は,ふつうは適当な数のデータから推定できるからである。

時系列の1次モメントは,μt=EZt,t=1,2,……と定義される平均であり,2次モメントは共分散で,rt,s=E(Zt-μt)(Zs-μs),s,t=1,2,……と定義される。

共分散は対称,すなわちrs,t=rt,sであり,s=tではσ t^2=E(Zt-μt)^2,t=1,2,…… と定義される分散になる。

長さ T の時系列には,T個の平均とT(T+1)/2個の共分散(T個の分散を含む)が存在する。実際には,これはデータから推定するパラメータの個数としてあまりにも大きすぎる。

定常時系列

時間の関数としての動きが,観測者が系列を観測し始める時間に関して,不変であるような性質をもつ時系列を考えよう。そのような時系列は,平均が定数μで共分散が観測時点の差のみの関数,すなわちj=t-sとおいて,

ϒj=ϒt,t+j, j=0,1,2,…

であるとき,(共分散)「定常」と呼ばれる 共分散関数の対称性により,ϒj=ϒt,t+j, j=0,1,2,.. である。

観測時点 の差は「遅れ」と呼ばれ,遅れ0の共分散,すなわち ϒ0は定数の分散σ ^2であり,それゆえ平均と同様に時点に独立である。定常でない時系列は「非定常」 と呼ばれる 。

T個の観測値からなる定常時系列は,推定すべき1個の平均とT個の共分散をもつ。これでもまだパラメータが多すぎであるが,共分散が少数のパラメータのモデルで表わされるならば,その推定問題は妥当なものとなる。

データを調べる場合,共分散の代わりに無次元化した統計量を用いるのがより 容易である。それは「自己相関関数」と呼ばれ,定常時系列では遅れをjとするとρj= ϒj /ϒo,j=0,1,…… と定義される。 |ρj |<1であることは,すぐに示すことができる。 予測を行う者が,その時系列を定常とみなせば,平均に対する 推定量は標本平均、

z̄=T∑t=1・zT/T                    (4)

である。ここに,Tは時系列中の観測値の個数である 遅れjの共分散に対する推定量は,

ϒj=T-1∑t=1・(zT-z̄)(zt+j-z̄),j=0,1,2,..       (5)

である。さらに,遅れ jの 自己相関関数の推定量は,

Pj=ϒj/ϒo                                (6)

で与えられる 13部 6章より,2つの確率変数の相関係数は,一方の変数の観測値を与え,他方の変数の値を,平均2乗誤差規準により予測する,線形回帰モデルの適切さの尺度であることが知られている。それゆえ ,「自己コレログラム」と呼ばれるρ jと jの関係を表わす図, すなわち自己相関関数の図は,時系タリ 中のj時点だけ離れた2つの観測値に対して,線形予測モデルを用いることの適切さの尺度を予測を行う者に与える。一般には,遅れが増大すると,自己相関関数の大きさはゼロに近づく。
確率過程におけるいくつかのモデルの自己相関関数は以下に示す。

自色雑音 (ホワイトノイズ)
Zt,t=1,2,……を期待値が0で分散がσw^2の互いに独立な確率変数の列とする 。このときϒo=σw^2,ρo=1, j≠ 0ではρj=0である。Ztは正規確率変数であるとも仮定されるため,白色雑音はutと表わされる。白色雑音は定常時系列で,ただひとつのパラメータだけが推定されればよいことが分かる。

自己回帰モデル
Ztは 差分方程式 ,

Zt+1=ΦZrt+ut+1 , t=0,1,2,…            (7)

で生成されるものとする ここに,Zoは既知でΦは定数である。式(7)は逐次に代入することにより解くことが でき,次の結果になる。

Zr=ZoΦ^t′+t∑i=1 Φ^t-i・ui、t=1,2,…   (8)

lΦl<1であれば,式(8)の両辺の期待値をとり,tを無限大にすれば μ=0となる 同様に,tを無限大におけば,

pj=Φ^j, j=0,1,2,…                 (9)

となることも証明できる したがって,lΦl<1であれば,初期条件Zoの影響は無視できるようになるので,Ztは定常過程である。これに対し,lΦl≧ 1であれば,Ztの分散がtの増加につれて無限に大きくなるので,Ztは非定常である。

このモデルには,推定すべき2つのパラメータ,Φとσ^2wがある。Φ=1ならば,モデルは酔歩 (ランダム・ウォーク)である。

観測値と時点の関係を示す図は,しばしばデータが明らかな上昇や下降の傾向をもち,それゆえ非定常系列であることを表わす。しかし,この図でも状況が明らかにされない場合もある。ρjと jの 関係を示す図 (標本コレログラムと呼ばれる)が,式(4),Dおよび(6)を用いて得られれば,jが増加するにつれてρjが 減少 していく割合は,定常性を表わす良い指標となる。式(9)でpjが減少するほど速 くにはρjが減少しない場合,非定常モデルを用いなければならないことはほとんど確実である。観測値の集合から非定常性を除去する方法とは,差分をとることによって新しい系列を作ることである。こうして得られた新しい系列はWt=Zt-(Zt-1)である。

Wtが非定常であれば,それをさらに差分をとることができる。 d階の差分は時点tについて d次の多項式を除去する。

非定常性が他の原因,たとえば式(7)でlΦl>1となることなどによるものであれば,差分をとることでは系列を定常にすることはできない。しかし,Φ=1の場合 は1階の差分により定常系列になる。

補 足
共分散定常時系列について2点ほど補足するのが適当であろう。その第1は,多変量で正規の同時確率密度関数は,平均と共分散行列で定義されるので,データを正規モデルにあてはめるには, 1次と2次のモメントを用いてモデルを選べる点である。第2には,定常時系列の自己相関関数のフーリエ変換は「スペクトル密度」と呼ばれ,モデルを選定する際に役立つことである。スペクトル密度を用いればノンパ メトリックなモデルが得られるが,それはデータから直接に推定できる。時間領域ではなく周波数領域で得られるモデルの解釈は,ここで紹介するには複雑すぎるので,関心のある諸者は文献リストにあげられている他の論文を参照されたい。

 本コラムは絶版となっている「IEハンドブック(サルベンティ編・日本能率協会訳・1986)」をアーカイブとして掲載するものです。このハンドブックの各章は多くの事例と理論を通して生産性向上に対するアイデアを提供するべく専門家によって執筆されています。基盤をなしているIEの考え方・原則はインダストリアル・エンジニアリングにかかわるすべてのひとに有用でしょう。

関連記事一覧

2019ものづくり公開セミナーガイド

B2Bデジタルマーケティングセミナー

ものづくり人材育成ソリューション

マーケティング分野オンラインセミナー