MTシステム

RT法

  • このエントリーをはてなブックマークに追加
  • LINEで送る


RT(Recognition Taguchi)法とは、タグチ流の多変量解析手法の一つであり、認識のための方法です。
一つの正常な母集団(群)を仮定して、その群からのマハラノビス距離を測ることで正常か異常かを判別する手法です。
実はここまで見るとMT法とよく似ていると思います。
では、MT法との違いはどこなのかと言うと、RT法はMT法と比較して2つの長所があります。

①MT法では項目の数(MTシステムでは変数を項目と呼びます。)がサンプルサイズより多くなると多重共線性によって解析出来ませんでした。
一方で、RT法ではその心配がありません。
②MT法と比較して計算コストが非常に小さいです。

なぜ、このような長所が生まれるかを解析方法から確かめていきます。

RT法による解析の手順は以下の通りです。

  1. 正常だと分かっているデータを単位空間とします。単位空間のデータで項目ごとの平均と標準偏差を求めます。
    \begin{eqnarray*}
    m_j&=&\frac{1}{n}\sum_{i=1}^n{X_{ij}}\\
    s_j&=&\sqrt{\frac{1}{n}\sum_{i=1}^n{(X_{ij}-m_j)}^2}\\
    \end{eqnarray*}
  2. 各サンプルにおいて各項目を並べたベクトルと各項目の平均を並べたベクトルをそれぞれ次のように表します。
    \begin{eqnarray*}
    {\bf x}_i&=&{(X_{i1},X_{i2},\cdots,X_{ip})}^T\\
    {\bf m}&=&{(m_{1},m_{2},\cdots,m_{p})}^T\\
    \end{eqnarray*}
  3. 各サンプルで統計量\({Y}_{i1}\)と\({Y}_{i2}\)を求めます。
    \begin{eqnarray*}
    {Y}_{i1}&=&\frac{{\bf m}^T{{\bf x}_i}}{{\bf m}^T{\bf m}}\\
    {Y}_{i2}&=&\sqrt{\frac{S_{ei}}{p-1}}\\
    {S}_{ei}&=&{{\bf x}_i}^T{{\bf x}_i}-\frac{({\bf m}^T{{\bf x}_i})^2}{{\bf m}^T{\bf m}}\\
    \end{eqnarray*}
  4. \({Y}_{i1}\)と\({Y}_{i2}\)を用いて分散共分散行列\(V\)を求めます。
    \begin{eqnarray*}
    \bar{Y}_{1}&=&\frac{1}{n}\sum_{i=1}^n{Y_{i1}}\\
    \bar{Y}_{2}&=&\frac{1}{n}\sum_{i=1}^n{Y_{i2}}\\
    V_{11}&=&\frac{1}{n-1}\sum_{i=1}^n{(Y_{i1}-\bar{Y}_{1})^2}\\
    V_{22}&=&\frac{1}{n-1}\sum_{i=1}^n{(Y_{i2}-\bar{Y}_{2})^2}\\
    V_{12}&=&V_{21}=\frac{1}{n-1}\sum_{i=1}^n{(Y_{i1}-\bar{Y}_{1})(Y_{i2}-\bar{Y}_{2})}\\
    V &=& \left(
    \begin{array}{ccc}
    V_{11} & V_{12} \\
    V_{21} & V_{22} \\
    \end{array}
    \right)\\
    \end{eqnarray*}
  5. 分散共分散行列\(V\)の余因子行列\(A\)を求めます。
    \begin{eqnarray*}
    A = \left(
    \begin{array}{ccc}
    V_{22} & -V_{12} \\
    -V_{21} & V_{11} \\
    \end{array}
    \right)\\
    \end{eqnarray*}
  6. 各サンプルのマハラノビス距離の2乗を求めます。
    \begin{eqnarray*}
    D_{i}^2&=&\frac{1}{2}(Y_{i1}-\bar{Y}_{1},Y_{i2}-\bar{Y}_{2})A
    \left(
    \begin{array}{ccc}
    Y_{i1}-\bar{Y}_{1} \\
    Y_{i2}-\bar{Y}_{2} \\
    \end{array}
    \right)\\
    \end{eqnarray*}

さて、この解析手順を見ると元々はp次元あったデータを2つの統計量に要約してからマハラノビス距離を算出しています。
これが長所の理由です。
RT法は名前の通り認識のための方法であり、特に2値の高次元データへの適用を想定されて提案されました。
もし、画像データなどの判別を行いたいときにはRTを用いると良いかもしれません。

おすすめ書籍

入門MTシステム

RT法の計算過程を細かく記述している書籍はこれ以外にあまり見かけたことはありません。

  • このエントリーをはてなブックマークに追加
  • LINEで送る

コメントを残す

*

CAPTCHA