同性恋是由基因决定的?因为这篇文章,两个团队在 Science 直接干架
丁香学术 · 2021/04/04
科学发现被质疑才会「越辩越明」,同时这也正体现了其多面性及包容性。

本文转载自“丁香学术”微信公众号。

前情提要

2021 年 3 月 26 日,国际顶尖学术期刊 Science 刊发了一篇题为 Comment on 「Large-scale GWAS reveals insights into the genetic architecture of same-sex sexual behavior」 的评论性文章,再次将「全基因组关联分析」和「同性恋的遗传学特征」这两个话题推到了风口浪尖,文章从科学严谨的角度,重新探讨同性恋遗传特性该怎样研究,直言不讳的指出全基因组关联分析研究一直被诟病的问题。

双方措辞激烈,硝烟四起,原文读起来非常带感。


图片来源:Science

这篇评论性文章剑指 2019 年发表在 Science 的研究性文章,题为 「Large-scale GWAS reveals insights into the genetic architecture of same-sex sexual behavior」,该研究通过大规模的全基因组关联分析以揭示与同性恋相关的遗传特征,文章发表之后,就引起了科学界和大众媒体的广泛关注,以至于有媒体直接使用「同性恋基因」、「同性吸引力的来源」、 「同性恋的原因」等标题进行宣传。


图片来源:Science

针对这篇评论性文章,原作者在第一时间做出回应,并同期刊发在 Science。原作者针对评论性文章中的质疑做出了详细说明,阐明了全基因组关联分析研究中的「痛点」。接下来,我们就细细解读这场辩论。


图片来源:Science

人类性行为的生物学特征

人类的性行为是复杂和多变的,尽管它在生物学和社会上都很重要,但其潜在的发展路径和性行为个体差异的来源至今都还没有被很好地理解。随着研究的不断深入,大多数科学家们都认识到:生物学、心理学和文化、环境因素等共同影响着性行为和性身份的形成。

据不完全统计,在整个人类社会中,约有 2 - 10% 的人报告自己与同性伴侣发生过性行为,或只与同性伴侣发生性行为,或与同性 / 异性均发生过性行为。导致性取向的生物学因素在很大程度上是未知的,但是,同性性行为似乎在某些家族中代代相传,这一观察结果暗示了遗传因素的影响,此外,同性性行为在基因相同的同卵双胞胎中比异卵双胞胎或兄弟姐妹中更常见。这些观察更加提示了同性恋的遗传学影响。因此,科学家们就希望通过遗传研究识别特定的基因和生物过程,并结合生活环境和社会动态,为同性恋的生物学特征提供更为重要的新认识。

原始研究开展的背景及成果发表

同性恋的相关研究是比较敏感和特殊的,不仅具有生物学意义,而且相关结果也会产生社会层面的影响,因此,之前的研究都较为局限。全基因组关联分析技术的成熟极大的推动了此类研究。

2019 年 8 月 30 日,来自麻省总医院基因组医学中心的科学家们,联合昆士兰大学心理与进化中心等单位的研究人员,在 Science 刊发了这项关于同性性行为的全基因组关联研究,研究人员对来自英国生物样本库和 23andMe 公司,共计约 48 万人的全基因组学数据进行关联分析,共鉴定出 5 个与同性恋相关的基因位点,并在其他三个较小的人群研究中进行了验证。


图片来源:Science

表型判断标准的严重质疑!

Hamer 等人的评论文章直击该研究的「命门」,对其应用的表型形状的认定标准产生了严重的质疑!要知道,表型信息在全基因组关联分析研究中是至关重要的,它是研究开展的前提,也是希望通过关联分析拟解决的科学问题,如果对表型的认定标准产生质疑,那么这也就基本等同于对该研究的全盘否定。

评论性文章指出:对于表型认定,原始研究中使用的是一个自我报告的二分测量方法,也就是说被研究人员的主要表型是由一个问题确定,即「你是否曾与同性发生过性行为?」 回答「否」的被归为「异性恋者」,回答「是」的被归为「非异性恋者」。

质疑者认为,Ganna 等人选择这种二分法仅仅是为了方便统计,但它的科学性却存在很大的问题。另外,这种方法太过于极端和绝对,即在「异性恋者」和「非异性恋者」之间并没有设定一个有效的阈值,而这本可以通过一些基本的问题来辨别。更为荒谬的是,Ganna 等人使用的二分法没有经过任何可靠性或有效性的测试。质疑者指出:在绝大多数科学文献中几乎没有见过这种生硬的评判标准,因为它几乎没有体现关于人类性行为多样性的信息。


图片来源:Science 截图

原始研究结论的质疑

「炮轰」表型判断标准之后,质疑者随后对其产生的结论也产生质疑。

他们认为,Ganna 等人在这项研究中检测到了与同性恋相关的 5 个遗传位点,尽管其中 3 个在其他数据集中得到了验证。然而,在完全同性行为的参与者中,这些变量都没有表现出统计学显著的升高,也没有与对应于同性相对于异性伴侣的比例的变量显著相关。

此外,尽管原始研究中对这 5 个基因进行了文献支持和讨论,但质疑者指出,这些基因可以作为同性性行为相关的候选基因 (如性激素和嗅觉) ,但实际上它们中没有一个与人们通常理解的同性恋有关。


图片来源:Science

质疑者们也对这 5 个鉴定出来的基因位点抛出了一种合理的解释:他们与人类性行为的分类没有任何关系,而是与个性特征有关,或许仅仅只是好奇心驱使的性体验。

最后,质疑者重申:所有复杂性状的遗传学研究都需要精确有效的表型测量,考虑到性行为的社会、政治和个人影响,这一点尤其重要。

精确评判标准 or 更大的样本量?

针对质疑,原始研究人员也迅速做出回应。

针对表型判断的标准,Ganna 等人首先指出,由于缺乏足够大的样本,先前的基因组关联分析研究无法检测出具有复杂特征的变异,这也是对性行为的遗传学研究受到限制的原因。因此,为了产生最大的有效样本量,他们选择了这个简单易懂的变量。

另外,在数十万人群的这种大规模基因组学研究中,势必会受到现有表型数据的限制,这是因为那些表型数据并不是为了某一研究而收集的。比如说,英国生物样本库 (UK Biobank) 包含了大部分可用基因组数据,但不包括性吸引力或性身份等详细信息,其唯一与性行为相关的问题是:参与者是否有过同性伴侣。因此,也只有基于二分类项的变量,才能使绝对样本容量最大化。

研究结论在后续分析中反复得到验证

Ganna 等人也承认,原始研究中的这一变量的确没有包含性行为的多样性和复杂性,不过他们也没有声称用这个变量来衡量性取向或性吸引力。同时,在原始研究中,后续深入的分析与数据的子集以及独立数据集均能验证研究结论,这与质疑者们提到的「结论不可靠」是不符合的,之所以认为不可靠,是因为 Hamer 等人忽略了原始研究的这些后续分析。


图片来源:Science

最后,原始研究人员提到:「尽管我们更希望大规模的基于生物样本库的样本具有我们感兴趣的主题的深度、详细表型,但这种性质的数据目前还无法获得。」这句话也戳中了全基因组关联分析研究的痛点:表型深度和样本量大小之间的权衡!

科学发现被质疑才会「越辩越明」,同时这也正体现了其多面性及包容性。在任何科学研究中,均有其局限性,合理利用现有条件、现有数据推动该领域的发展,认识到他人所无法看到的深度信息,这才是科学研究的追求方向。

参考文献

1、 A. Ganna, K. J. H. Verweij, et.al. Large-scale GWAS reveals insights into the genetic architecture of same-sex sexual behavior. Science 365, eaat7693 (2019). doi:10.1126/science.aat7693pmid:31467194.

2、 D. Hamer, B. Mustanski, R. Sell, et.al. Comment on “Large-scale GWAS reveals insights into the genetic architecture of same-sex sexual behavior”. Science 371, eaba2941 (2021).

3、 A. Ganna, K. J. H. Verweij, et.al. Response to Comment on “Large-scale GWAS reveals insights into the genetic architecture of same-sex sexual behavior” DOI: 10.1126/science.aba5693.

查看更多
发表评论 我在frontend\modules\comment\widgets\views\文件夹下面 test