首页 › 首页 › 资讯 › 查看内容

特朗普飙中文，翻译变革还是声音造假？虚假、伦理风险需警惕

2023-11-02| 发布者: 宿州生活网| 查看: 135| 评论: 1|文章来源: 互联网

摘要: 霉霉特朗普飙中文、郭德纲说英文相声……近期，AI应用领域刮起一阵“名人换声”的旋风。网传热门视频中，明......

霉霉特朗普飙中文、郭德纲说英文相声……近期，AI应用领域刮起一阵“名人换声”的旋风。网传热门视频中，明星、演员们操着一口流利、地道的“外语”，不仅音色以假乱真，口型也几乎吻合，神情自若，有的甚至讲起方言。

继“AI孙燕姿”“妙鸭相机”之后，“声音克隆”成为AI应用的新名词，而这一次对口语翻译和口型同步的融合，则带来了新变革。梳理发现，市面上已经出现了多款视频语音翻译或口型同步的工具平台，还有语音识别、口型匹配类的开源模型。

据悉，该产品的初衷是为了“消除语言障碍”。不过，专家指出，在开发相关工具应用时，需注意训练数据来源的合法性、模型的透明度、算法的可解释性、违法信息监测等，从合规层面而言，也需警惕生成内容被滥用于“深度造假”、生产虚假信息、个人信息泄露以及被非法利用等产生的伦理风险。

名人AI换声风靡：声称3分钟生成“没有译制片的腔调翻译”

在哔哩哔哩、视频号、抖音等短视频平台上，“霉霉说中文”“AI郭德纲用英文说相声”等成为热门搜索词，相关视频中，不仅有特朗普、泰勒·斯威夫特、憨豆、埃玛·沃森等等一众国外政客、明星，也不乏蔡明、赵本山、郭德纲等国内知名的相声小品演员。

*各大社交平台上出现的名人换声视频

视频中，有的国内演员操起一口地道的“伦敦腔”，有的外国明星被设定为带有南方口音的普通话，除了中英互换之外，还能转换为日语、西班牙语等多种语言。

声称“没有译制片的腔调翻译”“3分钟，就能让XXX说中文”的，怎么做到的？据了解，这些视频背后指向的则是一款名为HeyGen的AI视频工具，创作者只需要上传视频并选择要翻译的语言，就能实现自动翻译、调整音色、匹配嘴型。

南都记者登录该平台尝试翻译一段视频，根据引导，首先上传一段30s～5min的视频，点击翻译视频的按钮就能实现一键生成。上传视频支持英语、西班牙语、法语18种语言，输出视频可以支持英式/美式英语、德语、日语等14种语言。

官网显示，HeyGen还提供了个性化定制产品，“选择化身——输入脚本——生成视频”，仅需3步，就可以制作一个和真人一样的数字人，目前官网提供了90多种视频化身的模版，用户也可以上传自己视频或现场录制视频进行形象定制。不过，在生成视频之前，用户需要录制一段声明视频，以授权HeyGen使用视频进行创作。

多款应用工具涌现：HeyGen创始人称产品初衷为“消除语言障碍”

从今年下半年开始，HeyGen在网络上风靡，据悉，其背后的公司是一家名为“诗云科技”的公司，2020年12月在深圳成立，如今已获得来自IDG、红杉中国、真格基金累计近千万元的投资。

一位相关数据分析师统计，今年8-9月，各大文图类AI网站的访问量均开始呈现下降趋势，但HeyGen的访问量却上升了92%，流量跃居各大独立AI网站之首。

除了爆火的HeyGen，如今市面上已经出现了LipDub、Verbalate、Rask.ai等多款与其类似的一站式AI视频语音翻译工具平台。南都记者发现，部分应用的订阅费用都呈现上涨趋势，HeyGen的订阅费用已经从此前媒体报道中的24美元/月，提价到48美元/月。

为了达成AI视频语音翻译效果，还有短视频博主对声音克隆技术逻辑进行了拆解，总结出了语音识别、翻译、克隆声音和嘴型匹配几个步骤的技术路线，并进行了开源模型的推荐。这些模型能准确识别视频中的语音，将其翻译成其他语言，并将翻译后的语音与视频人物的口型进行匹配。

据诗云科技创始人徐卓所言，HeyGen这款产品的初衷是为了“消除语言障碍”。浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林表示，这次的AI换声应用能让批量视频翻译更加便捷，也减少了翻译人员的工作量，让更多文化产品直接地展现在观众面前，甚至于加速各国之间的文化传播。

北京京师律师事务所合伙人律师卢鼎亮认为，该技术的合法应用能够进一步帮助从业人员完成满足社会需求的文化娱乐作品，属于相辅相成的人和工具的关系。

需警惕深度造假风险：已有引发政治风波、诈骗和色情犯罪先例

无论是AI绘画，AI换脸视频、AI声音克隆或者AI视频翻译等底层技术，在业内都被认为是一种AI“深度造假”技术。可以看到，从生成静态画面，到克隆声音，再到可替换人物语言和口型的视频处理，支持各个环节“造假”的生成式AI技术和产品正在快速迭代，也带来风险隐忧。

今年以来，AI绘画模型的出现，使得Trump被捕的一系列假照片在网上被疯狂转载。随着2024年美国总统大选的脚步日渐临近，网络上的AI政治广告也开始流行。Obama、Trump的AI换脸+声音克隆视频常被网友制作出来，进行政治调侃。

而在诈骗方面，对于AI“深度造假”技术的运用也愈发常见。一些不法分子开始利用AI技术融合他人面孔和声音、制造逼真的合成图像、视频等来实施新型网络诈骗，类似骗局手段多样、门槛低、辨别难度大，经常让人防不胜防。

今年5月，内蒙古包头市公安局电信网络犯罪侦查局发布了一起使用智能AI技术进行电信诈骗的案件。4月20日，福建省某企业法人代表郭先生的“好友”突然通过微信视频向其借用公司账户“走账”430万元保证金，郭先生事后发现，对方通过智能AI换脸技术，佯装成好友对他实施了诈骗。

还有一些AI换脸视频广告引发诈骗，如有不法分子制作了一则加拿大总理贾斯汀·特鲁多和科技巨头埃隆·马斯克代言的虚拟货币交易平台广告视频，一名安大略省男子在看到该视频后，被骗11000加元。

此外，AI色情犯罪也是AI“深度造假”技术滥用广泛的领域。诸多好莱坞和国内明星的面孔均被不法分子制作成AI换脸视频，发布在色情网站上。

*国内某色情网站上的AI换脸明星视频

探路法律风险规避：已有限制访问、标准设立、鼓励举报等途径

专家一致认为，对于AI工具的迭代，“不要因噎废食，也不能听之任之”。对于需要警惕的风险点，资深合规律师彭凯指出，从数据训练层面，需注意训练数据来源的合法性，譬如是否涉及到个人信息的不当利用，或是否可能涉及利用他人受版权保护的数据。从模型生成的层面，需要注意模型的透明度、算法的可解释性。而在内容生成与应用层面，更需要符合内容管理的相关规定，如是否履行了内容标识义务，对违法内容是否进行了及时的监测、处置等等。

南都记者了解到，部分平台已在采取措施规避滥用风险。今年5月，在Google2023I/O开发者大会上，谷歌宣布正在开发一项名为UniversalTranslator的实验技术，这也是一款视频语音翻译的应用。谷歌方面表示，考虑到此工具可能被滥用来创建虚假视频，将限制对UniversalTranslator的访问，只有谷歌授权合作伙伴才能将其用于建设性项目，而普通用户无法使用。

也有部分AI视频工具平台通过制定相应的隐私、伦理政策、用户协议等加以防范。如在隐私政策中明确收集哪些数据、如何使用数据、如何存储数据、用户有哪些数据管控权限等。在使用伦理方面，倡导在使用过程中抵制暴力、仇恨、歧视、欺诈、侵害未成年人、侵犯知识产权等内容，并畅通渠道，鼓励对滥用软件行为进行报告等。

彭凯提示，除企业需注意的法律合规风险外，还需厘清政府、开发者、使用者责任，目前利用AI技术生成虚假信息的成本低、速度快，在一定程度上影响了信息传播，损害了内容可信度。不法分子很可能会利用此类技术进行牟利，而作为信息接收方的个体则需要注意谨慎辨别，避免自身损失。

出品：南都大数据研究院

采写：南都记者张雨亭熊润淼李伟锋