一番下へ
このページはPC版を携帯向けに変換して表示しています。

多次元尺度法


多次元尺度法は、様々なものを空間上に配置して、目に見えるようにする方法です。もともとは、知覚や感覚といったジャンルの研究で、刺激がどのように認知されているのか、それを刺激の類似度の散布図として表現するために開発されたものですが、今では様々なモデルに基づいて刺激とか個体などの散布図を描く方法として使われています。

たとえば今、3つの刺激S1、S2、S3があって、このうち、S1とS2の類似度が高く(つまり、2つは似た刺激ってこと)、S1とS3の類似度は低いとします。これを図で表すとこんな感じ。

[triangle+]

この図、似ているものは互いが近く、あんまり似ていないようなら、互いが遠くなってますね? 実は、多次元尺度法がやることはこういうこと。この考え方をしっかり理解できていれば、ここから先の理解も難しくありません。

ということで、ここからは理論的な話。特に、多次元尺度法の中でも古典的な、距離からスカラー積行列を作る「Torgersonの方法」というのを考えてみましょう。

今、n個の刺激間の距離が、N×Nの行列D={dij}で与えられています。で、求めるべき刺激の座標をN×qの行列X={Xia}とします(qは刺激を配置する空間の次元数。線形ならq=1、平面ならq=2、立方ならq=3)。このとき、刺激iと刺激jの間のユーグリッド距離は、

[式1+]

となりますので、この逆、つまり、距離から座標を求めれば、図を描くことができますね。ただ、この辺は少しややこしいので、専門書とか読んでください。結果的に座標行列Xは、B行列の正の固有値に対応する「基準化された」固有ベクトルPに、正の固有値Λの平方根をかけた、

JX=PΛ1/2

となります。

でまあ、この先にも重要なことがいくつかあるんですが、かなり難しいので解説は端折ります。つまり、B行列の正の固有値に対応する固有ベクトルを使って、刺激の座標を求める方法が「Torgersonの方法」ってことだけチェックしておいてください。

なお、このようにして求められた座標は、距離から座標を求める、という特性上、座標軸の原点と方向が一意に定まらない「回転に関する不定性」があります。これは言ってみれば、欠点ですが、逆に、こういう性質があるので、因子分析などでおなじみな、意味のある軸を求める作業、「軸の回転」が行えるという特徴もあります。

この方法は、難しく言えば、2乗距離の固有値分解から解を求める方法です。しかし、多次元尺度法というのは、この方法だけでしか実現されないわけではありません。他にも例えば、非計量的なデータから最小二乗法を用いて座標行列を求めるという方法があります(これはつまり、ズレを2乗して足した残差の2乗和を最小とするような座標行列を求める、ということ)。これらについて説明していると、どんどん難しくなっていきますので、いろいろな方法については、専門書を読んでください。

さて、さっきのところで、ちょっと注意。さっきのような方法を使えば、それなりに表現をすることは可能なわけですが、ただ、例えば、類似度行列が複数あるような場合、すなわち、個人差とかがプロットに影響しそうな場合はそれをどう扱うか?というのがちょっと問題になります。

こういうときには、さっきのユーグリッド距離に重みをかけるという考え方、つまり「重みつきユーグリッドモデル」を使います。

名前はなんだか難しそうですが、話は単純。例えば、個人kさんがaにかける重みをwkaとした場合、さっきの式にこいつを取り入れて、

[式2+]

これで話を考えるということです。ただ、先ほどと違って、こいつになった場合は、いわゆる「回転に関する不定性」というのが成り立たないことに注意が必要です。

ビジュアルで表現する方法としては他にも「多次元展開法」(xが観測されていないときに、データyijを刺激を表す点(=行)と変数を表す点(=列)との距離に関係付ける法)、「バイプロット」(距離ではなくて、ベクトルに関係付ける法)などがあります。例えば、バイプロットは、データ行列を因子分析(主成分分析)して、因子スコアを点、因子パターンをベクトルとして描くとか、そういうことをやります。時と場合で、いろんな方法を使い分けるのが一番よいでしょう。

ということで、わかったようでわからないかもしれない、多次元尺度法でした。とりあえず、データをビジュアルとして表現する方法の一つ、とだけ覚えておけば、オーケーです。

[前へ] [次へ]

[トップページへ] [前へ]


一番上へ TOP