人类不少玄妙的感觉,其实都可以用简单的方式来定义。比如,如果有人发射了一束波长为510 nm的光,那么大部分人看见的就是绿色,当然色盲除外。除了视觉,听觉也是一样,超过80分贝的声音肯定会让大部分人觉得吵。这种确切的定义可以让业界很好地设计相关的材料和产品,来满足人类的需要。但是,另一种感觉——嗅觉却和视觉与听觉不一样,很难通过简单的方式来定义。这也导致了另一个很让科学家们头疼的问题——如何根据物质的分子结构来预测气味。这个问题咋一看好像没啥难度,比如接触过巯基乙醇的人看到巯基就会不自觉的预测“奇臭无比”。不过,如果换一个复杂点的结构呢(下图)?
事实上,人类的嗅觉比我们想象得要灵敏许多,理论上一个嗅觉正常的人可以分辨上万亿种气味。以往曾有研究工作者提出可以通过气味分子的化学结构来推断所能带来的嗅觉体验。但大量事实表明,一些分子看似具有十分相似的化学结构,但带给人的嗅觉体验却存在巨大的差异。相反,结构迥异的分子有时候却可以给人们带来十分相似的嗅觉体验。这里不妨举一个简单的例子,S构型的香芹酮具有芫荽(俗称“香菜”)的气味,而R构型的香芹酮却具有留兰香的气味,可见分子中一个手性中心构型的改变,都会带来不一样的“味道”。一般认为,人类的嗅觉体验归因于气味分子与鼻子中特定的受体结合,并将信号传达到大脑进行后续信息处理。到目前为止,科学家们已经发现在人体内存在着400多种分辨气味的受体,但不同的受体如何组织以分辨不同的气味,目前机理尚不十分明确。
那这个问题就无解了么?不一定。这里就要引出今天的主角、近期火的不能再火的人工智能(AI)。AI在很多领域都已经展现出了非凡实力,无论是“阿法狗”及其升级版挑翻众多人类围棋高手,还是预测晶体制备策略、优化偶联反应条件、根据照片诊断皮肤癌症,AI的发展势头都让人瞠目结舌。美国IBM研究中心的Pablo Meyer以及洛克菲勒大学的Leslie Vosshall与Andreas Keller决定赶个时髦,他们发起了一个众包项目“DREAM Olfaction Prediction Challenge”,提供一个百万级的数据集(包括化合物结构以及相应的人类志愿者判断的气味信息),供22个计算机科学家团队使用,以开发根据化合物结构预测气味的机器学习算法(也就是AI)。最终,AI完成了人类无法完成的预测任务。相关工作也发表在了Science 杂志上。
Meyer等人邀请了49名志愿者“闻”476个玻璃样品瓶中的化合物,对它们的气味逐一进行分类,每个样品可以用给定的19种描述项进行描述,例如这瓶有“鱼腥味”,那瓶有“大蒜味”,那瓶有“水果味”等等。与此同时,他们还需要对每种气味的浓淡以及带给人的愉悦程度进行定级,由此得到了大量数据(下图A)。另外,研究者还收集了这些样品分子的结构特征数据,比如原子类型、官能团种类等,每个分子的结构特征都超过4800种(下图B)。随后这些数据分批提供给22个参与团队,写算法、建模、训练、模型验证等(下图C)。
这些算法大多表现不俗,而密歇根大学的Yuanfang Guan团队和亚利桑那州立大学的Richard C. Gerkin团队的工作尤其出色。研究者们综合了多个团队的算法,优化出最终的AI模型。这一模型可以精准地预测一个分子的气味强度和愉悦度,还能对之前提及的19种气味描述项中的8种(“大蒜味”、“鱼腥味”、“甜味”、“水果味”、“焦糊味”、“辣味”、“花香味”和“酸味”)进行准确预测。Meyer表示,AI有能力将气味的分子结构与气味联系起来,例如分子中带有含硫的基团倾向于具有大蒜味,而与香兰素结构相似的分子则可能带有类似面包房里的香味,如此等等。利用这些数据关联,AI可以从大量的化学结构数据中找到合适气味描述项,其结果十分接近实际的嗅觉感受。
研究者认为这一模型可以帮助香料香精公司省去寻找特定气味分子所需的大量精力和投入,同时也节省了不少后期的用户体验调查等工作。同时,未来还有可能实现通过特定气味识别出该气味中组成的分子。然而,仅仅使用19种描述项对气味进行分类是远远不够的,增加气味的描述项无疑会使系统的数据处理量暴增,而AI是否有能力应对这一问题仍旧未知。无论如何,有一点可以肯定,这一研究结果对于探究分子结构与气味之间的关系具有十分重要的借鉴意义。
后记
前不久在江苏卫视《最强大脑》的一期节目中,著有“鬼才之眼”称号的王昱珩与AI展开“人机对战”,他们被要求通过行车记录仪、高位监控、自拍照片等数据记住三名偷走公文包的小偷特征,并将这三个人从三十名犯罪嫌疑人中指认出来。题目难度较大,超出人类的能力,AI最终胜出。
AI在某些方面可以比人类表现的更卓越,这已经不是什么新鲜事。目前,AI主要应用于人脸和语音识别、服务型机器人以及金融、医疗等行业的解决方案。而在未来,AI将会有更加广阔的应用,那时的人类,又将如何自处?