こんにちは!
ここではT法の改良手法について説明します!
簡便な手法であるT法ですが、予測精度の観点から様々な改良がなされています。
今回は基準化に着目して改良を行った二つの手法について紹介します。
T法
少しT法についておさらいしておきます。
T法は学習データを単位空間と信号空間に分けて、単位空間の平均を用いて信号空間の基準化を行いました。
※T法での基準化とは平均あるいはそれに相当するもので引くことを意味しており、標準偏差あるいはそれに相当するもので割ることはしない。
しかし、それでは各項目で回帰直線は原点を通りません。
また、単位空間にデータを使ってしまうため推定のためのデータが減ってしまうので精度が落ちてしまいます。そこで、Ta法とTb法という二つの改良手法が提案されました。
Ta法
Ta法は単位空間を設定せずに、全データの平均を用いて基準化を行う方法です。
全データの平均を用いることで回帰直線は原点を通るようになりゼロ点比例式として妥当なものとなります。
また、単位空間を設定しないことからデータ数も減ることがないので精度が向上することが考えられます。
Tb法
Tb法は各項目において基準化するのに最適なサンプルを選択する方法です。
各項目においてサンプル毎に基準化を行ってみて最もSN比が大きくなるサンプルを選択します。
この方法は項目×サンプル数の数だけ計算が必要なので計算負荷が大きくなります。
しかし、各項目で当てはまりが良くなることが期待されます。
まとめ
Ta法とTb法について紹介しました。
簡単に言えば、基準化に着目して精度を向上させた方法です。
ちなみに、Ta法のTb法も通常のT法と比べてかなり精度が良いことが報告されています
Ta法とTb法の優劣についてはデータの誤差の大きさや生成モデルによって変わります。
Ta法やTb法もRのMTSYSパッケージで簡単に実装することが出来るので使用してみてください!