“预测圈子”第一问

2011-05-24 20:27 · TUGJAYZHAB

预测网刚刚开张, 接到了网开第一问: 能否简单解释一下该图 (PCA vs MDSM, angle vs. distance)

预测网刚刚开张, 接到了网开第一问:

能否简单解释一下该图  (PCA vs MDSM, angle vs. distance)

在那里简单答复道:

多元系统分类/聚类,  要侧重角度, 方向, 而非距离, 量值.

多维空间的角度, 方向, 用两多元向量的夹角余弦值表示.

 比如: (1,0)和(0,1)不同, 但和(5,0)相同, 共线. 可推广到多维空间, 多元系统.  

由于在那里, 不好修改, 不能存, 回到自己博客, 继续以博文答复:

假如为城市发展定义5个指标: 面积, 人口, 公交总里程, 手机数目, 金融从业人员比例.

在5维指标空间, 一个小城市A的值是: A=(1,2,3,4,5)

而另一个大都市B的数量指标是: B=(10,20,30,40,50)

虽然, 两个城市在规模上有很大差别, 但在组织, 结构, 功能上, 我们可以认为它们在五维指标空间共线, 两者相似 A~B.

计算过程如下:

代表城市A的向量长度:

L(A)= 根号[(1^2 + 2^2 + 3^2 + 4^2 + 5^2 )]

=  根号[(1 + 4 + 9 + 16 + 25)]

=  根号[55]

城市B的向量长度:

L(B)=  根号[(10^2 + 20^2 + 30^2 + 40^2 + 50^2 )]

=  根号[(100 + 400 + 900 + 1600 + 2500)]

=  根号[5500]

城市A的向量在五元指标空间的指向, 余弦值:

余弦值(A)=[(1^2 + 2^2 + 3^2 + 4^2 + 5^2 )]/根号[55]

=(1^2/根号[55] + 2^2/根号[55] + 3^2/根号[55] + 4^2/根号[55] + 5^2/根号[55] )

城市B的向量在五元指标空间的指向, 余弦值:

余弦值(B)=[(10^2 + 20^2 + 30^2 + 40^2 + 50^2 )]/根号[5500]

=(10^2/根号[5500] + 20^2/根号[5500] + 30^2/根号[5500] + 40^2/根号[5500] + 50^2/根号[5500] )

从多元向量分析的角度, 把城市作为多元指标空间的多元向量看, 两者在组织,结构,功能上是相等的。

主要参考文献:

T. Jay Bai et al. Multi-dimensional sphere model and instantaneous vegetation trend analysis. Ecological Modeling 97(1997)75-86.

关键词: