摘要:相貌是每个人最鲜明的特征,也是我们分辨不同人物的重要依据。莱布尼茨曾言“世界上没有两片相同的树叶”,如果这句话换成“世界上没有两个完全相同的人”,是否也能成为至理名言?有人会说,同卵双胞胎不就是一样的人吗?一样的先天DNA,一样的后天成长环境。但是,不同时空不同家庭的人也长相相似,是什么原因呢?前世今生?轮回转世?从科学的角度来看,问题的答案还是在DNA里。
2022年8月23日,西班牙巴塞罗那大学研究团队在Cell Report发表题为“Look-alike humans identified by facial recognition algorithms show genetic similarities”的研究成果(图1)[1]。研究结果表明长相极其相似但无血缘关系的人,往往拥有相同的基因,且在行为习惯上也很相似。
图1 研究成果(图源:[1])
人类个体身份与生物特性和环境有关,人类最初识别彼此的方式往往依赖于个人独特的面孔,并通过大脑来区分不同面孔的身份。然而,长相相似人群的“先天与后天”或“基因型与表型”相关性的问题在很大程度上仍未得到解决。此项研究旨在从分子水平上研究基因组学、表观基因组学和微生物组学如何促成人类相似性(图2)。
图2 研究概要(图源:[1])
此项研究以32对长相相似的人为研究对象,这些人是从加拿大艺术家François Brunelle的摄影作品中招募的。François Brunelle自1999年以来一直在全球范围内拍摄相似人物的照片。受试者均完成了全面的生物特征和生活方式问卷,他/她们的地理位置分布如图3A所示。研究使用了三种不同的面部识别方法(自定义深度卷积神经网络Custom-Net,MatConvNet算法和Microsoft Oxford Project人脸API)来确定人物“相似度”的客观衡量标准。作为计算参数的一个例子,图3B从每种方法的不同组合中获得的结果显示在图3C的维恩图中。此外,研究人员采集了受试者的唾液,并提取DNA进行生物信息学分析。
图3 相似人群的招募信息和衡量标准(图源:[1])
研究发现:
1 相似度:相似的人≈同卵双胞胎
通过对圣母大学双胞胎数据库的同卵双胞胎照片图像和相似受试者分别进行面部识别模型运算发现:32对长相相似的人中,有16对的相似得分与同卵双胞胎相似,并且明显高于在随机的非相似配对中观察到的相似度得分(图3D)。
2 56.2%相似的人的基因分型也相似
通过对16对高相似度的受试者进行基因组分析发现:超过一半(16对中的9对,56.2%)的基因分型可能相似(图4B);在16对相似的人中,13对具有欧洲血统,1对西班牙裔,1对东亚裔和1对中南亚裔。尽管背景遗传血统是人类群体之间遗传变异的主要决定因素,但我们观察到在13对相似的白人中,有7对(54%)没有在遗传上聚集,这表明相似对之间具有相似的遗传变异。
在相似的人的祖先和亲属关系方面,使用KING关系推理来确定亲属关系分数,结果发现与同卵双胞胎相比,相似的人与非相似人群具有更加类似的亲属分数,说明相似人群的亲属关系不强(图4C);9对基因分型相似的配对中只有一对的结果表明过去几百年有共同祖先。
图4 相似人群的遗传分析(图源:[1])
3 相似的人具有相似的面部特征基因
对超相似配对基因共享的SNP基因座的功能性质的研究表明,有171个引起氨基酸变化,影响了158个基因。这些基因包括许多与面部决定因素或身体特征相关的特征基因,例如腭裂/唇裂、眼睛颜色、臀围、身高、腰臀比、秃顶、脱发、嘴唇、前额形态、体重指数、骨矿物质密度和附着的耳垂等。
4 相似的人的DNA甲基化相似,但口腔微生物组分不同
衰老过程改变了面部形态,DNA甲基化被用作“生物学年龄”的代表,可以或不能与“实际年龄”直接相关。根据实际年龄(出生日期)或表观遗传年龄(DNA甲基化时钟)计算了16个相似队列中的绝对年龄差异,发现超相似组和非超相似组之间的实际年龄没有差异。但超相似对之间的“表观遗传”年龄差异较小;相似的人大多不共享一个微生物组,然而,口腔微生物组与肥胖有关:脸上的脂肪可能与长相相似有关。与非超相似对相比,超相似对之间的重量差异较小,因此,口腔微生物组可能通过其与脂肪含量的关系,促成相似的表型。
5 相貌之外,相似的人往往具有相似的全身表型和行为习惯
对受试者全面的生物特征和生活方式问卷调查,独立问卷变量(例如身高、体重、吸烟习惯或教育水平)的结果进一步表明:相似配对比非相似配对身体表性和行为表现更接近。因此,具有相似面孔的人类也可能具有更相似的身体表型和行为表现,这与他们共享的遗传变异有关。研究支持遗传力估计的概念,即在表型水平相关的个体共享大量基因型相关性。
图5 使用余弦相似度得分对受试者的生物特征和生活方式分析(图源:[1])
此项研究通过将多组学方法应用于基因无关的相似人群队列,破译了与面部构造相关的分子成分。人类相似的遗传变异有助于共同的表型形成,共享的遗传变异不仅与外貌有关,还可能影响生活习惯和行为方式。这些发现为未来在生物医学、进化和法医学等各个领域的应用提供了分子基础,有助于根据个人的多组学数据预测人脸结构。
此项研究存在一些局限。样本量很小,无法进行大规模统计分析;使用的图像是二维的黑白图像,缺乏关于三维结构、微妙的肤色和独特的面部特征的有价值的信息;此外,使用的SNP阵列不允许分析其他遗传成分,例如结构变异和共享的罕见事件;样本主要来自欧洲,因此,该研究无法有效解决所使用的多组学对其他人群的影响。
研究作者表示:“几十年来,没有任何家庭关系,但彼此相似的个体的存在已是事实,但只是以轶事的形式出现,没有任何科学依据。广泛使用用于图像共享的互联网和社交网络意味着我们现在能够识别和研究这些人。我们的研究结果在法医中的潜在应用将非常有趣:使用未知人的基因组进行生物信息学分析,从 DNA数据入手重建面部特征。在医学上,我们或许能够从面部分析中推断出一个人的基因组,从而将其用作疾病筛选工具,以检测与疾病相关的基因突变的存在,并在早期阶段应用预防策略。世界有79亿人口,这些相似面孔的重复出现可能性会越来越大。更大的队列将有助于分析这些相似个体共享的更多遗传变异,也有助于在数据层面复原人类面孔。”
撰文|文竞择
排版|乔维钧
参考资料:
[1]Joshi RS, Rigau M, García-Prieto CA, et al. Look-alike humans identified by facial recognition algorithms show genetic similarities. Cell Rep. 2022 Aug 23;40(8):111257. doi: 10.1016/j.celrep.2022.111257. PMID: 36001980.