这个国庆,雷军应该是最忙且最火的网红。
如果你经常刷视频,可能已经刷到了。
最开始雷军是锐评国庆假期:“ 老子一眨眼,国庆假期就过去了,真想开着小米 su7 创翻这个世界 ” 。
紧接着开始搞投资 “ 我准备 50 个亿投资安徽农业大学,谁要是阻拦我,我就远程操控小米 su7 创死他 ” 。
尽管言论反常,但从声音、语调、说话习惯上来听,都非常像是雷军本人。
你来听听看。。。
顺着这些片段,我挖掘了 “ 雷军 ” 在国庆前后的经典语录,发现他异常勤快,点评了堵车、调休、游戏、摆烂员工、大学生群体,甚至是曼联。。。
这些视频大体上可以分为三种类型。
第一种,用嘴臭攻击万物。
点评文科生,起手就是嘲讽,“ 花大笔的学费,并用 4 年时间去学这些垃圾 ” ,还有一些简单粗暴的脏话 “ 文科是狗学的,只有 sb 才会学文科 ” 。
再比如点评曼联,“TMD” 、一个 “ 初生 ” 贯穿全场,主打一个极致嘴臭。
而第二种类型,“ 雷军 ” 成了游戏核心玩家,忙着怒斥各种游戏乱象。
上一秒,满嘴 “ 我他妈 ” 、 “ 脑瘫 ” 、 “ 红温 ” 点评各种 FPS 游戏。
下一秒就在召唤师峡谷暴怒: “ 老子开局 buff 都被打完,三条路全部被对线单杀 ” 。
《 英雄联盟 》里玩数值怪铁男的,怒斥。
《 金铲铲之战 》玩四星波比阵容,怒斥。
《 无畏契约 》在手枪局赢了不起枪的,怒斥。
这些视频仿佛流水线生产一般,用词非常之脏,点评内容非常之广,更具有流水线特征的,是它形成了一定的范式。
开头就是一句,大家好,我是雷军,随即狂喷骂人的话。
小米手机,解锁小米 SU7 ,创人,成了经典三件套。
如果视频里没有这句,评论区甚至会有人直接发问:
如此种种,第三种类型随之诞生:多形式多场景多类型尝试,拓宽起雷军语音的边界。
有人开始调侃,国庆七天被雷军骂了六天,有人迷惑,怎么突然形象变化这么大, “ 雷军最近总骂人 ” 这个话题,连同嘴臭版的雷军,也由此一炮而红。
有人甚至溜达去了王化的微博下面,问他最近被雷总骂了嘛?
对了,王化,是小米集团公关部总经理。。。
最开始,看到这种现象时,让人感觉乐呵。
以前雷军也有 Are you ok 的梗,大家都习惯这么玩,恶搞嘛,雷军本人也围绕这事自娱自乐过。
但是仔细想想,感觉这事不对头,不同于鬼畜二创,这事性质已经改变。
因为 Are you ok真是雷军自己说的。
而如今诞生出来的新型恶搞呢?雷军明明没有骂过人,没有说过这些脏话,但不明真相的人却信了,误觉得雷军骂了人,这事让人觉得不太舒服了。
关注我们号时间比较长的差友,对前沿科技资讯多少有些了解,知道这是假的, AI 伪造的,但对于更多人,尤其是以及上了年纪的朋友们来说,这是一个眼见为实,耳听为真的世界。
无论雷军是否愿意,一个跟他本人真实形象相去甚远的嘴臭王,在互联网上冉冉升起。
科技是把双刃剑,这话都说烂了,对于 AI 技术可能带来的负面影响,许多人或早有预期,但可能不曾料到的是,事情的进展如此迅猛。
AI 配音初次进入大众视野,可以追溯到 2019 年前后,当时它的存在更多是一种工具。
在影视行业和娱乐行业,存在配音需求,出于时间和成本考虑,当时很多前沿团队寄希望于 AI 配音来替代真人配音,也有希望由 AI 配音来 “ 复活 ” 已故去的演员的。
声音克隆的技术基础是深度学习,算法通过分析大量声音数据,从中学习他说话的风格和情感,从而复制出特定个体的声音。
在当时,对单一个体的样本需求量大,有一定门槛,而且受限于技术,生成的语音总有一种浓浓的电磁感,更别提自然语调了。
直到近几年,随着 AI 配音技术的进步,才迎来第一次爆火。
这一次它摇身一变成了一个人畜无害的取乐玩具。
利用 AI 配音,人们制造出翻唱周杰伦的张惠妹,翻唱张惠妹的陈奕迅,翻唱陈奕迅的王力宏。
AI 配音的存在,为那些逐渐隐退不再营业的歌手,制造出一个替身,满足了歌迷们耳朵。
当时 AI 配音就展露了实力,无论是从声线、发音还是咬词方式都跟本尊无异,很多 AI 配音出来的歌曲,让无数网友表示好听到要单曲循环。
其中声音极具辨识度的孙燕姿,在短短半个月里,从民谣唱到摇滚再到流行歌曲,几乎干翻了半个华语乐坛,多个视频播放量破百万。
随后有人打开了新世界的大门。
丁真教你背《 滕王阁序 》。
AI 雷军教你学日语。
还有用 Kristen Stewart ( 暮光之城女主 )教大家学英语。
一点开视频,这位美貌如花的外国明星就用中文亲切的问候你: “ 甩锅这个词怎么翻译?别再翻译成 throw the pot ,这是中式英语 ” 。
定睛一看,会发现她的嗓音特征和口型都能对上,换本人来看了都得相信。
很快,某一国的语言已不足以满足,大家戏耍 AI 配音的心了。
会七国语言的彪子,横空出世,教育谢广坤。
在兼具一定实用价值的同时,又用咱们所熟知的名人带来了一些娱乐属性, AI 配音成了大众喜闻乐见的玩具。
从中你可能也有这样一个感受,短短数年, AI 配音技术突飞猛进,从一耳假到玩出花来。
而且,技术门槛越来越低,有种我上我也行的感觉。
为什么这么说呢?
如今网络上已经有非常丰富、非常细致的教程,从它们的简介中,你就可以对技术门槛高低有所感受:
完全免费,快到几秒,慢到几分钟,可生成任意内容。
随机点入一个播放量为四百万的视频,这位 up 主向大家教学了如何 “ 偷 ” 走别人的声音,仅需要极少量的音频( 1~2 分钟 ),就能克隆声音,在视频的开头他展示了对海绵宝宝声音的克隆,令网友直呼 “ 原声 ” 。
2019 年,人们希望 AI 配音帮助影视行业解决真人配音的局限性。
2024 年,某种意义上,这事儿已经实现了,如果你只是玩玩,甚至不需要多专业的商用工具。
在评论区中,有不少网友表示,作为小白,自己成功了。
这些尝试成功的网友,有人复原了刚过世的妈妈的声音,有人复刻了好兄弟的声音,也有人复刻了前女友的,在这些感人故事的背后,也有很多人发出担心,感觉这东西可能被不法分子利用。
是的,每个人都有独一无二的嗓音、声调以及说话习惯,所以声音曾经是一个人的经典标签。
但,从今以后,一个人的声音,或许不再可信。
真假难辨,会有什么后果?有几则新闻可供参考。
阿联酋一家银行的员工,被 AI 克隆出来的客户声音诈骗,向对方指定账户转账了 3500 万美元(折合人民币 2.25 亿 )。
还有无锡市市民王先生,接到正在英国留学的儿子来电: “ 爸爸我被人打了,快救我 ” ,随后 “ 绑匪 ” 对他大吼,用他儿子的性命做要挟,勒索 50 万。
有人可能会犟嘴:“ 别人是别人,我是我,肯定骗不到我头上,骗过来了我也会识破 ” 。
那么,近段时间针对公众人物的 “ 声音窃取 ” 新闻,应该会让你有些不一样的感觉。
9 月下旬,直播带货公司 “ 三只羊 ” 在风口浪尖上时,集团创始人卢文波醉酒后的音频流出,内容劲爆,导致大量讨论。
这段音频有方言,有脏话,有醉酒后的情绪,一听就是真的,很多网友信了,义愤填膺。
然而,警方调查后,发现这段引发轩然大波的音频是假的,仅仅由一段 30 秒左右的录音进行声音 “ 孵化 ” 而成。
类似的事,还有这次铺天盖地的对雷军的戏耍,同样令人警觉。
因为,AI 配音 + 口型可以伪造这件事,在社会认知中存在断层。
一部分人能理解到这是伪造的,一听就辨认为假,打开视频,看个乐子,就过去了。
可另一部分人完全无法理解,当他们相信眼见为实,对此深信不疑。
就拿那些 “ 我是乌克兰女人 / 我是俄罗斯女人,我想要嫁到中国 ” 的视频来说,这些视频小年轻一看就懂,其实只是加了一个外国人滤镜,粗制滥造。
但这并不妨碍它,能收获成千上万条喝彩。
总有人正相信。
这次面对这次脏话连篇,言行离谱的 AI 雷军,你或许会认为,很容易辨别,那下次手法升级,将其进行二次剪辑,或者改变场景,改成雷军在会议室骂人之类的话题,你觉得还有多少人能一眼看破?
而以上种种,更意味着这样一个事实,用极小的成本,就能改变一个公众人物在 50% 网友心中的印象。
天天裤子上沾屎,这谁顶得住?
除了对他人的影响之外,更为可怕一点是,这类的事情多了,咱们以后还能相信人的「 声音 」嘛?
这样的问题也许已经开始困扰人类了。
实际上,如今很多平台也会在 AI 生产技术的视频下打标,通知观众,也有一定的规范推出。
但截止目前,其实并没有什么特别有效的办法规避声音 “ 窃贼 ” 带来的可能影响,对于平台来说,需要时间和进一步努力来完善对 AI 伪造内容的整治。
对于咱们个人来说,目前比较有效的措施就是抹平信息差,让周围的家人知道有这么个技术,它可以达到什么地步,什么水平,不要掉以轻心。
抖音
过去,网络有谣言,只需要上网搜搜,有无对应的声音影像,往往谣言不攻自破。
现在,网络有谣言,你真能找到声音和影像啊,只是是他人所伪造的。
我们已经进入了一个眼见不为实的时代。
今年五月,著名影星 “ 寡姐 ” 斯嘉丽 · 约翰逊指控 OpenAI ,称对方非法使用其声音。
在长文中, “ 寡姐 ” 透露 openAI 曾经邀请她为公司新的聊天机器人 ChatGPT-4 配音,在她拒绝后, OpenAI 发布了一个声音与她声音极为相似的声音,以至于她的 “ 最亲密的朋友和媒体都无法分辨出区别 ” 。
她在声明中提出疑问,在一个深度伪造技术容易被创造并日益泛滥的新时代中,如何保护人们的形象和身份?
AI 技术的发展,让人们在信息时代的效率突飞猛进。
但也提出了一个新的问题,当我们建立在信息化技术上的一切真假难辨时,该何去何从?
黑客帝国中,蓝色药丸通常被解读为维持现状、逃避现实的象征,而红色药丸则代表选择知识与真相。
如今的我们如同吞下蓝色药丸,深陷幻像的人,如何捍卫真相和自由,仍需时间追寻。
来源:差评