「诶,你跟我前女友长得挺像,我差点认错」

男生搭讪女孩,总有人用这种烂俗套近乎招数,整得大家仿佛很熟,仿佛很有缘分(手动狗头)。


(资料图)

当然,不止现实搭讪,长得像「异父异母亲兄弟姐妹」这件事,从来是网上玩梗打趣的热门话题…

比如,林东临和郭俊杰…

不光你我关心,这事儿被科学家拿来当成了研究问题,还有了结论:

相似长相的人确实「有缘」,他们可能有相似DNA。

最新一份发表在Cell子刊的文章显示,面部相似的人共享着相同基因序列。

这结论他们怎么得出的?靠谱么?

一起来看看。

请机器来找「异父异母的亲兄弟」

首先要找一堆长相几乎一模一样的人作样本。面对全球70亿茫茫人海,怎么找是个问题。

科学家找到了加拿大艺术家弗朗索瓦布鲁内尔 (François Brunelle)。从1999年,这位艺术家就在全球收集相似人相。

靠着「找对门路」,科学家获取了32对长相酷似的样本,并请参与者提供了详细的生物特征、所在地及生活方式问卷。

为保证脸部比对更客观,科学家找来三种算法/模型,共同「拆解」脸部细节,判断相似度。

其中包括了——

(1)自定义深度卷积神经网络Custom-Net,一种来自AI公司Herta,主用于监控领域的CNN模型;

(2)应用在Matlab上,常用于面部分类任务的MatConvNet

(3)来自微软Azure的Microsoft Oxford Project人脸API,常用于面部分析;

这些模型内置数百万参数,且历经上千主题下的数百万张面部图像训(折)练(磨),能识别姿势、发型、表情、年龄、配饰等诸多特征,对相似图像,模型将给出从0到1的一个相似度区间。

如果机器们三方「会审」一致判断极为相似,那科学家就会将样本作为重点研究对象。最终在32对样本中,有16对被三方认可。

之后是DNA比对环节。

科学家利用一种名为单核苷酸多态性(SNP) 的基因特征,比对各组长相高度相似人的唾液内DNA样本。

此后,再通过无监督聚类热图检测,让机器判断每对DNA是否属于一个类型(即相似)。

结论有点因吹斯汀

结果显示,在16对「被机器全部认可」样本DNA中,科学家发现,有9对被聚成一类,他们在3700个基因中,共享了超过19200个SNP。同样,在K-means算法中,最终结论也类似。

此外,科学家还研究了相似配对的生物特征及生活方式。他们在体重、身高、是否吸烟、教育水平等方面也在配对组中相互有关联,这说明,共享的遗传变异不仅影响长相,也造成相似的行为和习惯。

研究者形容该结果十分「striking」。研究者还排除了近亲关系的可能,并发现,这些样本比长相不同的双胞胎,基因相似度更高。

更有意思的是,剩下16组未通过三方机器视觉特征认可的样本中,也只有一对样本DNA被聚类在一个集合。

在人种和地域方面,科学家还进行祖先溯源,他们观察到,几乎所有相似配对样本的祖上生活地区都很靠近。

但需要指出,本文主题在其他多组学研究中,却有着不同结论。

比如DNA甲基化模式下,16对高度相似样本只有一堆匹配;

再比如从微生物角度看,16对相似样本中,口腔菌群相似的仅一对,且这对样本通过SNP也没被聚类到一起。该领域有研究认为,口腔微生物相似度与皮下脂肪有关,可能导致相似长相(如:脸上肉多)特征的人,有相似的口腔微生物特征。

团队介绍

本文一作Ricky S. Joshi,计算生物学家,来自西班牙巴萨罗那Josep Carreras 白血病研究所 (IJC),研究方向主要为遗传学和表现遗传学,其个人页面显示,Ricky致力于发现人类基因组中的病理性变异。

二作Maria Rigau ,同样Base在西班牙,是巴塞罗那超级计算中心 (BSC)的博士,专业为生命科学,主页头像显示,这是一位蛮喜欢狗狗的女研究者。

One More Thing

有网友指出,马斯克长相有点像爱迪生,还Po了下面这张图——

不知你怎么看?(手动狗头)

推荐内容