@阑夕:一篇很有意思的文章:测谎仪的前沿竞赛。
据南加利福尼亚大学心理学家Jerry Jellison研究统计,每个人平均一天要听到200句谎言。大多数时候都是「善意的谎言」,但赫特福德大学心理学家Richard Wiseman表示,大部分人每天也会说2-3个真·谎言。
我们的身体在各个方面都会出卖我们,比如心率、汗液分泌和面部微表情等等,同时我们还会结巴、迟疑和不小心说漏嘴。弗洛伊德说过:「凡人皆无法保守秘密,就算口风严实也会在举手投足间流露,每个毛孔都散发着背叛的气息。」即使这样,我们也很难分辨出谎言。通过206项科学研究统计,人们只能分辨出54%的谎言,这个几率比抛硬币稍微好那么一点。
因此千百年来,人们一直致力于识别谎言。而测谎,在一般情况下基本上指的就是测谎仪,它在电视节目和审讯程序中很受欢迎。在过去的几十年里,随着计算能力、脑扫描技术和人工智能的发展,催生了许多声称是新一代强力测谎工具的仪器。初创公司竞相将这些进展商业化,并想要人们相信完美的测谎仪即将来临。
例如,联邦快递和Uber分别在巴拿马和墨西哥地区使用了一种叫做「眼检测」的测谎技术,来筛选出有犯罪历史的司机,这是一个基于眼睛运动和瞳孔大小的细微变化的测谎仪。同时信用评级机构益博睿使用它来测试其员工是否徇私舞弊,英国诺森比亚的警察使用它来评估性侵犯者的改善情况,阿富汗政府、麦当劳和数十家美国警局都在使用这项技术。
目前市面上的测谎技术一般运用五种类型的证据。
前两种证据是语言以及人们说话的方式。斯坦福数字通信专家Jeff Hancock发现,在约会网站的档案中撒谎的人更倾向于使用「I、me、my」。还有一种方法叫做语音压力分析,通过检测语音语调变化来识别谎言。审讯美国2012年枪杀案嫌疑犯George Zimmerman,和英国委员会在2007年到2010年期间打击电信诈骗时,都使用了这种方法。
第三种证据是肢体语言。有些说谎者会有一种所谓「骗子的愉悦」的表现,当他们认为谎言没有被发现时,脸上会有种欢快的表情一闪而过。而认知负荷会使人的行为变得不同,说谎者努力想要表现得自然一些,但结果往往适得其反。2015年剑桥大学的一项研究发现,通过紧身衣来测量受试者被质疑时肢体的烦躁和僵硬程度,来分辨谎言的成功率达到了70%以上。
第四种证据是生理性的。也就是常见的血压、呼吸速率和汗液分泌情况。有一种阴茎体积描记法,通过使用特殊工具来测量阴茎的充盈量来评估性犯罪者的唤起水平。还有技术是使用红外摄像机来分析面部温度,当人们撒谎时血会涌向大脑,鼻子——和匹诺曹相反——会随之稍微收缩。
第五种收集证据的途径在20世纪90年代随着新技术的发展而被开辟出来,那就是——大脑。在Netflix的纪录片「制造杀人犯」第二集中,一名被判处终身监禁的残酷杀人犯Steven Avery最终被名为「脑指纹」的检测所识破。它的发明人Larry Farwell称,「脑指纹」检测可以通过嫌疑人对罪案相关的词汇或图片的神经反应,来检测隐藏在犯罪嫌疑人大脑中的罪行。
911事件之后,美国政府通过美国国防高级研究计划局(DARPA)来赞助各种基于脑科学的测谎研究。其中2006年,名为Cephos和 No Lie MRI的两家公司发明出了一种基于fMRI(功能性磁共振成像)的测谎技术。这项技术可以追踪大脑中涉及社会计算、回忆和冲动控制部分的血液流动情况。
另外,一个新的测谎前沿领域正在兴起,那就是利用人工智能将各种证据来源途径结合在一起,成为一种测谎手段。机器学习通过在大量数据中发现之前看不出的数据模式,推动了测谎研究的发展。比如,马兰里大学的科学家们就声明他们发明出了通过分析法庭录像来鉴别谎言的软件,准确率可以达到88%。
但是从历史来看,测谎仪在科学基础上的瑕疵一直是笼罩在它头顶的一片乌云。甚至是测谎仪的发明者John Larson,也嫌弃他自己的创作。
1921年时值29岁Larson还是加利福尼亚州伯克利市的一名菜鸟警察,但他学习过生理学和犯罪学,于是他建造了一个装置连续测量人的血压和呼吸速率,并将结果记录在滚动的纸上。此后测谎仪开始大面积流行。1951年,美国陆军成立了第一所测谎学校,为南卡罗来纳州杰克逊堡国家信用评估中心的情报机构培养审查官。
在上世纪的大部分时间里,大约有四分之一的美国公司对员工进行了测谎检查,以检测包括吸毒史和盗窃史等问题,麦当劳也经常在员工身上使用测谎仪。到了20世纪80年代,美国有多达10000名受过培训的测谎主考官,每年要做200万次测试。
但唯一的问题是,测谎仪并没有用。
早在1965年,也就是Larson去世那一年,美国政府行动委员会就测谎仪发表了裁决:「测谎仪只是一个欺骗人们的神话。」1988年,出于对测谎仪「误用和滥用」的担心,美国国会禁止雇主使用测谎仪。20世纪下旬开始,各种其他形式的测谎仪也开始被废除,包括废弃的国防部项目「摆动椅」,它在审讯过程中可以秘密地追踪疑犯的活动和体温,并通过瞄准嘴唇的红外激光来测量呼吸速率。2003年,美国国家科学院发表了一份令人沮丧的报告,报告指出有证据表明57项测谎研究中的准确率「远不能令人满意」。
在911恐怖袭击后,美国开始寻找一个真正有效的测谎仪,情报部门和边境服务部门都急切地需要一个这样的仪器,政府主导的大量新资金流使测谎再次成为了一个热门行业。
心理学家保罗·艾克曼用了几十年的时间研究可以揭露隐藏真相的面部「微表情」,作品在心理学界有着很大的影响力,同时也是风靡一时的美剧「别对我说谎」的理论基础。2006年这项理论第一次在真实世界中进行测试,艾克曼花了一个月的时间培训美国移民官员如何通过微表情来识别护照管制中的欺骗行为。结果:在接下来的6年时间里,至少有16名恐怖分子被准许进入美国境内。
2008年在布什总统的领导下,美军花了70万美元购置了94台手持测谎仪,以应对伊拉克和阿富汗的状况。
2014年,布加勒斯特机场采用一种叫做Avatar的虚拟边境警卫,它具有电子护照扫描仪和指纹识别器,此外还拥有麦克风、红外线眼部追踪照相机和Xbox Kinect传感器来测量肢体动作。它是第一代「多模态」测谎仪,包含了多个不同的数据来源。
将Avatar技术商业化的David Mackstaller称,Avatar真正的秘密武器是其软件系统,它使用了一种可以将所有类型的数据组合起来的算法。据称,Avatar的准确可以达到83%到85%之间。
布加勒斯特的试验得到了欧盟边境机构Frontex的支持,该机构还资助了另一个名为 iBorderCtrl的系统,该系统基于「沉默的讲话者」技术。该技术使用了一种AI模型,可以分析40种以上面部和头部的细微特征,只需要将摄像头联网就可以使用。理论上它可以在智能手机上运行,也可以在电视直播中使用,甚至有可能的话也可以在政治辩论中使用。研发方声称「沉默的讲话者」在目前研究中的准确率为75%。
类似于Avatar这种新一代测谎仪所声称的80%-90%的准确率的确令人印象深刻,但在这些工具大规模地推广使用之前,需要更清楚的证据来证明,它们在不同的文化中或者类似精神病患者的特殊人群中同样是有效的,因为目前大多数研究都是针对美国和欧洲的白人进行的。数据偏见可能会在边境问题上被放大,造成极大的社会恐慌。更重要的是,AI模型的黑盒不利于决策的透明化,因为它不能解释自己的推理。
当然历史表明,这些缺点并不能阻止这些新工具的应用。毕竟初代测谎仪的不科学性虽然已经被广泛揭露,但美国每年仍会进行大概250万次测谎检查。
人工智能测谎仪的出现,让个人和政府更倾向于去相信科学本就应该有的「全知之眼」。它们可靠性越接近完美,就会变得越危险。因为测谎仪通常会瞄准社会中最脆弱的人:20世纪20年代的女性,60年代的不同政见者和同性恋者,以及21世纪的索赔受益人和今天寻求庇护的移民。
现实世界中,经过长期演练的说谎者还会使事情变得复杂。杜克大学著名行为心理学家丹·艾瑞里说:「我们有相信自己谎言的巨大能力,一旦我们相信自己的谎言,我们自然不会表露出任何撒谎的信号。」
No Lie MRI背后的科学家Daniel Langleben表示,他接触的一个政府机构对他的大脑测谎仪并不感兴趣。因为功能磁共振成像机不能装进手提箱或者带进审讯室,审讯人员不能操纵测试结果以向不合作的嫌疑犯施加压力。该机构只想知道它是否可以被用来训练特工从而击败测谎仪。
「真相并不是一种实际的商品,没有人想要它。」