现在的位置:主页 > 综合新闻 >

Nature故事:从DNA预测罪犯外貌,AI手段获五角大楼

来源:商业故事 【在线投稿】 栏目:综合新闻 时间:2020-10-09

【作者】网站采编

【关键词】

【摘要】一般DNA表型研究都集中于绘制面部特征点,比如眼睛和头发的颜色。但Parabon Nanolabs另辟蹊径,除特征点外,还对某人的血统进行全面分析,提取出综合的面部轮廓。 这个问题的本质就

一般DNA表型研究都集中于绘制面部特征点,比如眼睛和头发的颜色。但Parabon Nanolabs另辟蹊径,除特征点外,还对某人的血统进行全面分析,提取出综合的面部轮廓。

这个问题的本质就是机器学习——收集大量DNA样本和面部照片,训练算法找出DNA与面部特征之间的关系。

编译 |?机器之能

DNA一直以来都是「刑侦利器」。?最常见的用途就是比对嫌疑人和犯罪现场证据的DNA,此外还有「追踪嫌疑人」功能。各个国家或地区都建有自己都DNA库,追踪嫌疑人时只需要将嫌疑人DNA与库中的DNA相匹配以溯源家族,寻找嫌疑人亲属。?Parabon Nanolabs是世界上最著名的法医遗传公司,在2019年之前,它几乎每周都可以利用DNA追踪帮助警察破获长久未解决的疑难案件,有些案件甚至可以追溯到20世纪60、80年代。?但大多数人不知道的是,DNA还有更加神奇的用途。?在2019年5月的一次破案过程中,Parabon Nanolabs的破案手法受到了广泛的伦理质疑,可用的DNA数据大大减少。此后,Parabon Nanolabs转向了公司初期的商业模式——通过DNA重建一个人的外表。

一?争议:我们还有DNA隐私吗?将DNA样本与家谱相结合是法医遗传谱系的核心,该过程原理也不复杂,就是简单统计规则。?父母与子女之间、兄弟姐妹之间共享50%的DNA,祖父母与孙子女共享25%的DNA,即便是远房亲戚也共享一小部分DNA。这样一来,基因测试便可以估算出样品背后两个人之间的关系。?在刑事案件中,通过将犯罪嫌疑人的DNA与家谱数据库中的档案进行比较,拼凑出嫌疑人的家谱,就可通过亲属关系追踪嫌疑人。?不过这种手法需要大量的DNA信息作为支撑。在美国,DNA数据主要来自于GEDMatch,这是一个免费使用的网站,起初是允许用户上传自己的DNA寻找失散多年的亲戚,后来一位侦探利用该网站找到了破获了金洲杀手案(1970、1980年的连环奸杀案)。?此后GEDMatch就走向刑侦领域,除非用户明确拒绝,否则GEDMatch允许执法机构访问个人资料,以帮助解决谋杀和性侵犯。

GEDmatch数据库的共同创建者Curtis Rogers(左)和John Olson犹他州2018年的一个下午,71岁的受害者在练习风琴时被人用石头砸伤并用绳子勒到昏倒。警察在现场在发现了嫌疑人留下的三滴血,但与州和联邦数据库中的任何人都不匹配,于是联系到了GEDMatch的授权批准。?最初拒绝此案的Parabon Nanolabs最后签署了协议,对居住在该地区的个人进行了数次部分DNA匹配,立刻找到了嫌疑人的三个亲戚,其中一个人曾经多次与警察发生冲突,而他17岁的侄子与受害者描述的嫌疑人刚好相符。警察从嫌疑人在学校扔进垃圾里的牛奶盒上获取了DNA样本,证明与现场血液DNA相匹配。2019年4月,嫌疑人被逮捕。?在此之前,媒体对DNA追踪的报道大多数积极的,但犹他州案件却在当时引起了家谱学家、隐私和广大公众的反对。因为GEDMatch条例规定只有在性侵和谋杀的情况下才能使用数据,但犹他州案件并不属于二者,已经侵犯了用户隐私。?Parabon Nanolabs一直认为自己并没有侵犯隐私,「公众对金洲杀手案反应如此积极,但对犹他州案反应如此消极,我感到非常惊讶。」生物信息学负责人遗传学家艾伦·麦克雷·格雷塔克(Ellen McRae Greytak)说。?但舆论却并不这么认为。「将DNA档案上传到GDEMatch等网站上就是用户放弃了自己的隐私权利,同时也侵犯了某些远亲的隐私。」英国纽卡斯尔诺森比亚大学的伦理学家Matthias Wienroth表示,事实上,在家进行的DNA测试的增多已经使一些基因系谱数据库变得非常庞大。2018年的一篇科学论文估计,这些数据可以识别出60%的欧洲血统的北美人,即使他们自己从未参加过这些测试。?作为对舆论的回应,GEDMatch表示只有用户专门表示可将信息用于执法手段的情况下才可以使用数据。一夜之间,Parabon失去了其主要的DNA数据来源。?随后,Parabon Nanolabs转向了最初的商业模式,直接根据DNA重绘面部。

二?机器学习让DNA重建面部Parabon Nanolabs在2008成立于一家地下车库中,最初是提供超级计算服务。2011年,这家刚起步的公司便获得了美国国防部的拨款。?当时国防部想开发一种技术:从炸弹上残留的少量DNA中识别出该建议爆炸装置的制造者,该技术被称为「DNA表型分析」。?大多数研究DNA表型技术的实验室都在试图寻找一个人的遗传密码的单个字母变化(单核苷酸多态性(SNP))与眼睛、头发、颜色等物理特征之间的关系。?这种办法只能获得嫌疑人的特征点,比如眼睛和头发是绿色的。但是Parabon Nanolabs另辟蹊径,除特征点外,还对某人的血统进行全面分析,提取出综合的面部轮廓。?这个问题的本质就是机器学习——收集大量DNA样本和面部照片,训练算法找出DNA与面部特征之间的关系。正是这种思路让他们获得了赢得了国防部的青睐。?理论上这种办法只适用于血样和颊拭子中的大量高质量DNA,但是法医样品DNA通常很小且会降解,只有1毫微克,但是实验所需的DNA是200毫微克——一卡车法医样本的量。使用如此少量的DNA进行的测序操作通常会使遗传密码的部分留空,因为样品降解程度太高或稀释度太低而无法读取。但Parabon Nanolabs为此建立了专有算法,以预测其数学模型中的此类空白点。现在已经可以从1毫微克的DNA中构建一张脸。?「我们也会对较低质量的DNA做出的预测缺乏信心,但结果证明很少发生问题。」 Greytak说。?该预测程序被称为「Snapshot」,发布于2014年,Parabon表示,自2018年以来,警方已利用其遗传谱学和表型分析方法解决了120多个案件。

文章来源:《商业故事》 网址: http://www.sygszzs.cn/zonghexinwen/2020/1009/721.html

上一篇:【德清故事】一个历史悠久,山清水秀,人文荟
下一篇:古人可没少给花木兰安排爱情故事

商业故事投稿 | 商业故事编辑部| 商业故事版面费 | 商业故事论文发表 | 商业故事最新目录
Copyright © 2018 《商业故事》杂志社 版权所有
投稿电话: 投稿邮箱: