预测网刚刚开张, 接到了网开第一问:
能否简单解释一下该图 (PCA vs MDSM, angle vs. distance)
在那里简单答复道:
多元系统分类/聚类, 要侧重角度, 方向, 而非距离, 量值.
多维空间的角度, 方向, 用两多元向量的夹角余弦值表示.
比如: (1,0)和(0,1)不同, 但和(5,0)相同, 共线. 可推广到多维空间, 多元系统.
由于在那里, 不好修改, 不能存, 回到自己博客, 继续以博文答复:
假如为城市发展定义5个指标: 面积, 人口, 公交总里程, 手机数目, 金融从业人员比例.
在5维指标空间, 一个小城市A的值是: A=(1,2,3,4,5)
而另一个大都市B的数量指标是: B=(10,20,30,40,50)
虽然, 两个城市在规模上有很大差别, 但在组织, 结构, 功能上, 我们可以认为它们在五维指标空间共线, 两者相似 A~B.
计算过程如下:
代表城市A的向量长度:
L(A)= 根号[(1^2 + 2^2 + 3^2 + 4^2 + 5^2 )]
= 根号[(1 + 4 + 9 + 16 + 25)]
= 根号[55]
城市B的向量长度:
L(B)= 根号[(10^2 + 20^2 + 30^2 + 40^2 + 50^2 )]
= 根号[(100 + 400 + 900 + 1600 + 2500)]
= 根号[5500]
城市A的向量在五元指标空间的指向, 余弦值:
余弦值(A)=[(1^2 + 2^2 + 3^2 + 4^2 + 5^2 )]/根号[55]
=(1^2/根号[55] + 2^2/根号[55] + 3^2/根号[55] + 4^2/根号[55] + 5^2/根号[55] )
城市B的向量在五元指标空间的指向, 余弦值:
余弦值(B)=[(10^2 + 20^2 + 30^2 + 40^2 + 50^2 )]/根号[5500]
=(10^2/根号[5500] + 20^2/根号[5500] + 30^2/根号[5500] + 40^2/根号[5500] + 50^2/根号[5500] )
从多元向量分析的角度, 把城市作为多元指标空间的多元向量看, 两者在组织,结构,功能上是相等的。
主要参考文献:
T. Jay Bai et al. Multi-dimensional sphere model and instantaneous vegetation trend analysis. Ecological Modeling 97(1997)75-86.