コラム・特集

8.3 経験的な方法

IEハンドブック
第13部 IE技術者の定量的方法論

第8章 時系列予測

8.3 経験的な方法

データが与えら れていれば,予測を行うための理想的な手順は,まずモデルを選ぶことである。すなわち,適当な許容水準にて,モデルを採用するための統計的な手続きを実行する。次に,モデルを用いて予測値だけでなく ,その信頼区間も 求める。しかし ,多くの場合には, 何らかの意味のある水準にて統計的仮説検定の手順を行うには,データが少なすぎる。さらに,過去の条件は急激に変化しうるので,過去は未来のための良い指標であるとは信じられない。いずれの場合にも,データを追従するような予測値を与える方法が望ましいが,そのような 方法は,時系列に対するモデルが未知であるため,経験的なものにならざるをえない。ここでは,一般に用いられる方法のいくつかを紹介する。

移動平均による予測
単純移動平均モデルは,もっとも 最近のN個の観測値の算術平均を予測値とするものである。予測値は予測期間がいくらであっても,あてはまると仮定されている。それゆえ,時点tにおいて得られた予測値は

z̄t(ℓ)=N∑i=1/(Zt-i+1)/N, N≧1、t≧N,  ℓ≧1

となる。このモデルでは最新のN個の観測値が必要であり, 最初の予測値を得るには最低N個のデータがあればよい。新しい観測値が得られれば,新しい予測値は,新しい観 測値と t 時点前に求めた予測値とで表わすことができる。この公式は「予測値更新の式」として知られる移動平均モデルでは,この式は再帰的に用いることができて,

z̄t =z̄t-1+(zt-zt-N)/N,   t>N     (10)

となり ,そ の手 順は ,

z̄tN=N∑i=1 zi/N

から始まる 式(10)は N=3とおいて図表13.8.1に示されているデータに適用されている。それゆえ,z̄3は最初の3つのデータの平均であり,z̄4は式(10)で t=4とおいて次のように計算される。

 

z̄N=N∑i=1 zi/N 

から始まる式(10)は N=3とおいて図表13.8.1に示されているデータに適用されている。それゆえ,z̄3は最初の3つのデータの平均であり,z̄4は式(10)で t=4とおいて 次のように計算される。

z̄4=66.7+(51-40)/3=70.3 

この手順は,t=T=9になるまで繰り返される t=9ではZ12を予測することができ,そ の結果z̄9(3)= 86.0が得られる t=10の新しいデータ が使えるようになれば,この 予測値はz̄10(2)=81.0に更新される。この例と以下の例では,求めたい予測値は データの集合の最後の時点(t=T=9)で,ℓ =3と予測期間を定め得られるものとしている。ただし,図表13.8.1では1時点先の予測値,すなわちz̄t(1)も同時に計算され ている。これはモデルの各データヘの当てはまりの良さを評価するために,一時点先の予測値を次の時点のデータZt+1と比較できるからである。

時系列モデルが一定の水準と白色雑音の和でできていて,予測値が最新のN個の観測値のみを使うように限定されている場合には,単純移動平均モデルは,最小平均2乗誤差の予測であると示すことができる。 それゆえ,傾向が無視できるデータに用いるには適当であると考えられる。データの水準が変動する場合は,予測値はいくつかのデータの間だけ変化するのが遅れ,Nが大きくなるほど,予測値が新しい水準に達するまで時間がかかるようになる。したがって,Nの値が大きければ,時系列の変動を平滑化してなくすようになるが,水準の変化に予測値が対応するのは遅くなる。

データに線形傾向がある 場合には,二重移動平均に基づく予測値を求めることができる。まず,Mtを単純移動平均{式(10)の右辺を用いて計算する}で得られるとし, 次に Mi^(2)をMtの単純移動平均として次のように与える。

Mt^(2)=Mt-1^(2)+(M1-Mt-N)/N, t≧2N                 (11)

時系列は,時間の線形関数であると仮定しているので , 代入により ,次式で与えられる予測値,

z̄t(ℓ)=2Mt-Mt^(2)+2ℓ{Mt-Mt^(2)}/ N-1, t≧2N-1    (12)

は,直線傾向のデータを追従できることが分かる その手順は図表13.8.1のデータを用いて示されている 図表 13.8.1にて「z̄t=Mt」と見出しのついた列は,式(10)に よる結果である「Mt^(2)」と見出しのついた列は,式(11)でMtの値を与えて求めたものであるさらに,両者は式 (12)で一時点先予測値(ℓ=1)を求めるために用いられ る。したがって,たとえばM5^(2)は M3,M4,M5の平均であり、

z̄5(1)=2(67.0)-68.0+2(1)(67-68)/2=65.0

となる新しい観測値が得られたら,同じくt+ ℓ 時点を予測するための再帰式は,

z̄t(ℓ)=z̄t-1(ℓ+1)-2/N-1・{(Mt-1)-Mt-1^(2)}+1/N∇^N(2zt-Mt)+2ℓ/(N-1)N ∇^N(zt-Mt), t≧2N        (13)

である。ここに,▽^N (・)は 次数Nの後退差分演算子, すなわち▽^N(z1 )=z′1― z2-N である。それゆえ,式(13)を使うには過去N時点にわたるデータと単純移動平均の系列が最新の予測値に加えて必要である。たとえば,式(12)によりz̄9(3)=74.4が得られたとする。次の時点のデータが得られたなら,M10が計算され,式(13)よりz̄10(2)=65.0 となる。

指数平滑による予測
非常に多くの予測値を頻繁に求めなければならない場合,移動平均モデルでは,データを数多く保持する必要があるため,その実現はむずかしい。直前の予測値だけを保持しておけばよいような予測モデルは指数平滑モデルであり,時点 t における予測値が次の再帰式から求められる。

z̄t=αzt+(1+α )z̄t- 1, r>2, 0<α <1           (14)

予測値は最新の観測値と直前の予測値だけに関係し, すべての予測期間 ℓ≧1 について当てはまるとする。そのため, ℓ は式の中には現われていない。 予測の手順を開 始するために,z̄1は最初の観測値z1の値とする 。T個の観測値がある場合,式(14) がt=Tとなるまで繰り返し用いられ,それによってt=T+ℓ までのすべての予測値が得られる。より優れた方法は,z1をT個の観測値の標本平均において,式(14) をt=Tになるまで繰り返し用いるものである。その結果,式(14)は,

z̄T=(1-α)^T-1・z̄1+α∑(1-α)^i zT-1, T≧2      (15)

となり,予測値が過去の観測値の加重平均値であることを示している。加重係数は1-α のべき乗であり,Tが大きくなれば予測値に対するz̄1の寄与は無視しうるほどになる。この変数αは 「平滑定数」と呼ばれる。αの値が小さければ,データ中の大きな変化に対応するのが遅くなる。一般的には,αの値として0.01から0.30が用いられる 推奨すべきαの値の決め方は以下のとおりである。

時点tで εt=zt― z̄と定義される残差を実際の観測値と予測モデルで計算して,時系列へ当てはめた値との誤差とする。誤差平方和,Sを次のように定義する。

S=T∑t=1・∈t^2

よって,Sは種々のαについて計算され,そのSを最小にするαが用いられる。時系列モデルが定数と白色雑音の和からなっていれば, 指数平滑モデルは,次のような加重平方誤差の和を最小にすることがわかる。

DS=T∑t=1・(1-α)^T-t(zt-zT)^2         (16)

さらに ,zt=zt-1+ut- θut-1 ,lθ|<1とした非定常時系列モデルが与えられた場合 ,指数平滑モデルは,誤差平方和を最小にすることも確かめられている。

式(14)を用いて,図表13.8.1のデータについて,α =0.10, z̄1=z1=40とおいて計 算した結果は,「指数平滑」の見出しのついた列に示されている 。したがって,式(14) より,

z̄2=0.1(65)+0.9(40)=42.5

となる。式(14)を繰り返し用いるとz̄9(3)≡z̄9=61.1が得られ,t=10の新しいデータが使えるようになれば,更新された予測値はz̄10(2)≡ z̄10=65.9となる z̄1を9個のデータの平均とおいた場合は,予測値はかなり異なったものになる。それは,データが増加傾向にあると,z1よりもz̄1の値のほうが大きくなるからである。このことは,データ数が少ないときは,初期値が予測値に大きな影響を与えることを表わしている。

時系列モデルに線形の傾向があると考えられるときは, 二重指数平滑モデルを用いることができる。まず,Stを指数平滑の式に従うものとし,

St=α Zt+(1-α )St-1, t>2               (17)

とおく、ここに

S1=z1-(1-α)z2/α

であり ,Si(2)をS1を平滑したもの ,すなわち,

Si^(2)=α St+(1-α)Si-1^(2), t≧2      (18)

である。これより、予測モデルは、

z̄t(ℓ)=(2+αℓ/β)St-(1+αℓ/β)St^(2)             (19)

にて与えられる。ここに,β =1-αである 単純指数平滑による 予測値の場合と同様に ,式(18)と(19)が t=Tのデータまで繰り返し用いられ,t=T+ℓ に対する予測値が求められる。

式(17)と(18)を用いるときの初期値を求めるためのより優れた方法は,線形回帰モデルを用いてデータ に直線を当てはめることである。したがって,当てはめた直 線の式より z1とz2を求め,その値を式(17)と(18)で用いれずよい。 t=Tの時点で, t=T+ℓでについて求めた予測値を新しいデータZT+1が使えるようになったた めに更新するには,まず式(17)を用いてST+1を,次の式(18)にて ST=1^(2) を 計算し,そして式(19) は t=T+1とおき ,ℓ をℓ-1に置き換えるという手順をふむ。これは具体的には次のように説明される。まず ,図表13.8.1に示されている最初 の9個のデータは ,線形回帰モデルに当てはめられ ,Zt=54.83+3.50tという結果 が得られる。

次に ,式(17)と (18)でz1=58.33,z2=61.83とおき ,α=0.10としてS1とS1(2)を求める。それらの値は図表13.8.1に示されているとおりである。式式(17)と (18)は t=T= 9となるまで繰り返し用いられる。1期先予測値は式(19)で計算される。予測値z̄t9(3)=97.0は 式(19)より得られ, 更新された予測値z̄10(2)=101.0も S10と S10(2)が得られたのちに式(19)にて求められる。

季節要素をもつ時系列の予測

多くの商品の需要は,季節的な山や谷をもつことが知られているが,そのような季節変動は,データをプロットして調べれば明らかになる。必要ならば,拡張指数平滑モデルを三角関数の項の和を作るために使うこともできるが,ふつうは他のモデルが用いられる。

Wintersの モデルによる予測
Winters によるモデルは,Zt=(b1+ b2t)C(t)+Utと定義される。ここに,C(t)は乗法性の季節要素であるデータに増加傾向がみられなければ,b2は0とすることができる。季節の周期をLとすると,Ztとtの関係を示す図は,L時点の間隔で山と谷が繰り返すパターンを示すはずである。なお ,季節要素はつぎの条件,

ϒ+L-1∑t=1 C(t)=L                (20)

に従うように制約される。ここに,C(t)=C(t+SL)である。予測値は

z^1(ℓ)=〔â1(t)+â2(t)ℓ]c^(t+ℓーL)t≧L    (21)

で与えられ ,パラメータについての再帰関係は、

â(t)=azt/c^(t-L)+(1-a)[â1-t-1)+â2(t-1),t≧2    (22)

â2(t)=δ [â1(t)-â1(t-1)]+(1-δ)â2(t-1),  t≧2         (23)

c^(t)=ϒ^zt/â1(t)+(1-ϒ)c^(t-L), t > L                      (24)   

である。式(22)ら(24)においては,α,δ ,ϒはすべて別個の平滑定数である 式(21)では,ℓ>Lならば最後に得られた推定値C(・)を用いる。以下に示す手順において は,L+2個のパラメータの初期値を求めるために,少なくとも始めから2L個の観測値を使う必要がある。まず,t=SL+u, 0<uくL, S>0とおく。

次にmL個 (m>1)の観測値を使うことができれば,方程式は次のように解ける。すなわち、

となる。式(22)から(24)は ,最後のデータになるまで繰り返して解くことができ,その結果予測値が求められる。 C (t)は最新の周期にて推定されたあと,式(20)を 満たすように式(30)を用いて規準化しなければならない。 図表13.8.1のデータを再び取り上げ,L=4とおく。最初の8個の観測値を用いれば,m=2となる。そし て , 式(25)より

が求められ,それより式(26)と(27) にてâ2(1)=5.00とâ1(1)=52.75が得られる 式(21)から(30)までを用いれば,図表13.8.2に与えられているC(t)の値が求められる。この図表の他の数値は,α =δ =ϒ=0.10とおいて,式(21)から例を繰り返し用いた結果,得られたものである。予測値はz^9(3)=79.5であり, t=10での観測値と式(21)より更新された予測値はz^10(2)=79.6である。

モデルの評価
1時点先の予測値と現実の値との大きな差異は,予測を行う者に何か誤りのあることを知らせる信号として用 いることができる。予測誤差についての信頼区間が求められて(予測誤差の分散が分かっている場合), 1個もしくは2個連続して誤差が信頼区間の外にあれば,何らかのアクションをとる必要がある。これは平滑定数もし く はモデルを変更することを意味している 。多くの予測値が必要な状況では,こ れを自動的に行うことが望まれる。

いくつかの候補の中からあるモデルを選ぶ場合,ふつう使われている方法は,誤差平方和や絶対誤差の和などの規準を用いて,そのモデルがデータにどれだけうまく当てはまるかによって順位をつけることである。しかし, 一般には(回帰分析では当然のことであるが)パラメータ数の多いモデルは当てはめはうまくできるが,必ずしも 統計的に意味のある予測値を与えるとは限らない。

モデル選択で通常用いられる他の方法は,データの一部をモデルヘの当てはめに使い,残りのデータを使ってそのモデルで予測を行うものである誤差の和を求める ことと同様に,予測値とデータを図示して比較することは,予測を行う者がモデル選択を行う際の助けとなろう。

その他の経験的なモデル
予測を各種の要素に分解して行うのは別の経験的な方法であり,季節や循環の変動を含むデータに用いられる 読者はShiskin他 や McLaughlinとBoyleの著作を参照されたい。

予測を行う場合に先行指標を使用することはしばしば 価値がある。ひとつの品目の需要が他の製品の生産や需要に関係していて,同時にほとんど定数とみなせるようなある時点だけ遅れて変化する場合,先行する製品の需要の観測値を予測のために用いることができる。先行指標となる変数についての情報は,合衆国商務省より月刊で発行されている『Survey of Current Business』 から見つけることができる。

本節で紹介した経験的方法による予測のためのFORTRANプログラムのリストがすでに用意され,利用できる。

 本コラムは絶版となっている「IEハンドブック(サルベンティ編・日本能率協会訳・1986)」をアーカイブとして掲載するものです。このハンドブックの各章は多くの事例と理論を通して生産性向上に対するアイデアを提供するべく専門家によって執筆されています。基盤をなしているIEの考え方・原則はインダストリアル・エンジニアリングにかかわるすべてのひとに有用でしょう。

関連記事一覧

2019ものづくり公開セミナーガイド

B2Bデジタルマーケティングセミナー

ものづくり人材育成ソリューション

マーケティング分野オンラインセミナー