コラム・特集

4.2 理論の背景

IEハンドブック
第13部 IE技術者の定量的方法論

第4章 IE技術者のための実験計画法

4.2 理論の背景

この10年間の実験計画法についての研究は,うまく計画された実験の3つの基本的要素について考えている。これはAndersonとMcLeanにより考えられたものである。これらの3つの要素とは,重要性の高い順に,(1) 推測空間,(2)無作為化,(3)繰り返しである。

推測空間
「推測空間」というのは ,統計学者たちがふつう用いる「母集団」という用語を置き換えたものである 。著者らの経験では,「推測空間」という用語は,より研究者の注意を引く。推測空間というのは,実験結果を適用できる限界を意味している。いまのところ ,普通に行われているのは,実験を設定するまえに研究者がどれくらい広く結果を適用したいと考えているのかを示すことである。このことには,実験に使用する単位(unit)を定義する必要がある。この単位が推測の基本となる。さらに時間間隔も定義しなければならず,結果を適用したいと考えている領域をも明確にしなければならない。全要因のうち,どの水準を実験でコントロールしたいと考えているのかも決定する必要がある。通常は,他の2つの段階 (無作為化と繰り返し)よりも,この段階に多くの時間が費やされるべきである。というのは,推測空間を明確に定義していなければ,研究者にとって,いわゆる最もうまく計画された実験というのは価値がなくなってしまうからである。われわれは,この要素(推測空間)を実験 計画の一部分と定義する。よって,慎重に定義された推測空間なしには,「最もうまく計画された実験」というのはありえない。

無作為化
無作為化ま,実験計画において次に最も重要な要素である。これは確率的表現を行うためには,実験に欠くべ からさるものである。Fisherは,これが検定の正当性の物理的根拠であるという考え方を示している。これはまた,信頼区間の正当性の根拠でもある。

無作為化の要素の中には,別の概念である無作為化の「制限(restriction)」が含まれている。読者がこの概念を理解しやすいように,最初に「完全無作為化(completely randomized)」 について説明しよう。これは 実験単位の発生源の無作為化に何ら制限を加えないものである。この概念を論じるため, 5水準の要因 t があり, 3つの実験単位があるものとしよう。各単位は要因 t の5つの水準につき完全に無作為に取り扱われる。

実験全体に使用される実験単位として,15個の単位が推測空間からランダムに取り出されているものとしよう。完全無作為化計画の1つの方法は, 1から5までの乱数たとえば2を選ぶことである。このとき,第1番目の実験単位は処理2,すなわち要因 t の第2水準の処理を受ける。次に別の1から5までの乱数,たとえば5を選ぶ,そうすると,第2番目の実験単位は処理5を受ける。このようにして15個の実験単位がすべて“処理される”まで乱数の選択を続ける。このサンプリング手順では,要因tの各水準が実験中3回ずつ出現する必要がある。この実験の計画法は完全に無作為化されている。

このような実験データを分析するための数学モデルは,

y ij =μ +Ti +e(i)j = i=1,2,…,5; j-1,2,3                  (1)

である。 ここに,

yij=要因 t の水準iで処理された実験単位の応答
μ=全平均
Ti=要因 t の第 i 水準の効果
′e(i)j=要因 t の第 i 水準の中に重なった,第 j 実験単位の実験誤差

を表わす。このようなモデルでのデータ解析のための仮定は

1.yijは確率変数である。
2.要因 t の各水準内の応答の分散は等しい。
3.モデルは加法的である。
4.実験誤差は平均値0,分散σ ^2で 独立に正規分布する。すなわちNID(0,σ ^2),である。

である。
この完全無作為化により,推測空間からの実験単位は各処理につき, 3回ずつ選択されることが保障される。各処理のための3つの単位は,その処理内の変動につき測定される。この変動は推測空間全体にわたる変動の代表値である。よって,処理の効果(式1の Ti)についての有意性検定は,処理内から得られた変動の値を越える処理の平均値の極端な変動の値に基づかねばならないことになる。ここで処理内の変動というのは,式 1でのε (i)j による分散によって生じるものである。それゆえ,式 1 で, ε (i)jはTiを評価する適切な誤差である。

しかし,もしサンプリング手順が,第1番目の無作為抽出(水準2)を実験単位の最初の3つ に適用し,第 2 番目のそれ(水準5)を,次の3つ に適用するなどといったものであるとするなら,無作為化の手順が完全無作為化の場合の15回とは違って, 5回しか許されていない ことになるので,無作為化に制限が課せられることになる。普通よくそうであるように,空 間あるいは時間的に相続く単位間に類似性があれば,3つの単位のグループ内部での変動は,グループ間の変動より小さくなるであろう。よって,この計画法では,処理によるための変動は,3つの単位のグループ間の変動とは分離できない (処理はグループと交絡している)。もしグループ間に誤差変動があるなら,モデル ,

yij =μ +Ti+δ (i)+è(i)j                  (2)

によって表わされるように,処理に対する 検定を行うことはできない。ここにδ (i)は 「制限」による 誤差, すなわち第i番目の単位のグループによる,確率要素を表わし(完全に交絡しているので,Tiの添字と同じ添字になっていることに注意せよ), è (i)j はNID(0,σ^2.è) で,第iグループ内の第j単位の誤差項を表わしている。 推測空間にわたる変動の代表値はδ (i)による変動である。しかるに,式 2の è (i)jによる変動は,推測空間にわたる変動の一部分をなしている。

よって処理の効果を検定するには,σ^2δ の推定値が必要である。もちろんδ (i) の自由度はゼロである。このことはこの計画法がまずいものであり,使用すべきでないことを表わしている。

Andersonと McLeanによる平均2乗期待値を求めるアルゴリズムを用いて,処理を検定するための正し誤差項は, δ (i )であることを示すことができる。しかし,全実験を繰り返さない限り,式2のこの誤差を推定することはできない。それゆえ,無作為化の制限はδ (i) を生じたのである。これは観測を行うまえから,このサンプリング手順はよくないことを示している。よってデータを取るまえに,早急に計画法を変更しなければならない。

繰り返し
第3の要素,すなわち繰り返しは,誤差項の推定や, 応答変数に寄与している要因の重要性を決定する基準を提供するために,しばしば必要とされるものである。さらに,ある与えられた処理についての観測値の数が増すにつれ,処理の効果の推定値が,より精密に,すなわちその分散がより小さくなる。

しかし,以前の実験から何らかの情報が得られているなら,たとえば分散が既知とか,モデルの高次項がゼロであるとかが知られているなら,実験全体を繰り返す必要はない。

実際,「 要因分析(factorial)」 実験の中には,要因の水準のすべての数よりも少ない回数の実験でよいようなものが多くある。これらの実験は「一部実施要因分析法(fractional replicated factorials)」と 呼ばれている。

完全な繰り返しをしないうまく計画された実験が多くあるので,繰り返しの要素は推測空間,無作為化の次の第3番目に配置された。

次節の計画法と分析を読む読者は,(1)基礎的統計概念,(2)平均値yの分布やi,χ^2,F分布,(3)分散分析や 回帰モデルを理解しておく必要がある。

 本コラムは絶版となっている「IEハンドブック(サルベンティ編・日本能率協会訳・1986)」をアーカイブとして掲載するものです。このハンドブックの各章は多くの事例と理論を通して生産性向上に対するアイデアを提供するべく専門家によって執筆されています。基盤をなしているIEの考え方・原則はインダストリアル・エンジニアリングにかかわるすべてのひとに有用でしょう。

関連記事一覧

2019ものづくり公開セミナーガイド

B2Bデジタルマーケティングセミナー

ものづくり人材育成ソリューション

マーケティング分野オンラインセミナー