• 首页
  • 资讯
  • 专家
  • 话题
  • 问题库
  • 礼品商店
  • 分类
    • 新闻资讯
    • 娱乐八卦
    • 3C数码
    • 医疗健康
    • 健康养生
    • 云盘解析
    首页   ›   正文
新闻资讯

千万别让AI自动生成字幕:满屏“脏话”不忍直视

2022-03-01 20:55
699  0
依依加油吖
依依加油吖
阅读需:0

AI自动生成的字幕有多离谱?

他不仅把“螃蟹”误认为“垃圾”,还当场粗鲁地说:

千万别让AI自动生成字幕:满屏“脏话”不忍直视

你甚至可以把“玉米”翻译成p*RN

千万别让AI自动生成字幕:满屏“脏话”不忍直视

关键是这些是AI为儿童节目自动生成的字幕。

AAAI2022的一项新研究发现,在7013个儿童视频中,近40%的节目出现了诸如儿童不当或脏话之类的词语。

即使在113集的儿童机器人学习专栏中,AI“破解”103次,接近平均每集一次!

YouTube正在接受这一点《连线》采访中的回应:我们为13岁以下的儿童开发了YouTubekids。此应用程序将关闭字幕生成功能。

千万别让AI自动生成字幕:满屏“脏话”不忍直视

但如果需要字幕,我们如何才能找到减少AI一代错误的方法呢?

让我们看看。

亚马逊和谷歌都非常“Zuan”

让我们来看看本文的发现。

研究人员从管道中总共选择了24个儿童频道,并记录了这些频道的广播和订阅数量。

可以看出,视频播放量基本上达到了100万,用户数量也很多。

千万别让AI自动生成字幕:满屏“脏话”不忍直视

然后,研究人员尝试了谷歌和AWS(亚马逊网络服务)的字幕生成效果。

结果显示,AI字幕中“不适合儿童”的比例令人震惊:

在7013个视频中,谷歌的AI有2768个错误的字幕,将近40%。

亚马逊的AI字幕错误率更高,达到3672次,超过52%。

具体来说,AI和AI都容易在这些“不恰当”的词语上犯错误:

千万别让AI自动生成字幕:满屏“脏话”不忍直视

△亚马逊在左边,谷歌在右边

在这些数据集中,有一些词特别“不适合儿童”,例如一些辱骂性脏话:

千万别让AI自动生成字幕:满屏“脏话”不忍直视

经过作者的手动检查(例如,确认原始视频是否真的说脏话),发现AI在以下情况下容易出错:

背景音乐很吵

演讲者是个婴儿

演讲者是个孩子

说话者把英语作为第二语言

演讲者正在唱歌

千万别让AI自动生成字幕:满屏“脏话”不忍直视

△包括但不限于这些情况

那么,有没有办法减少这种情况?

词序连贯中的错误更容易纠正

研究人员提出了一个新的数据集,该数据集使用近音词来构建禁忌词的“替代”选项。

例如,对于可能的“脏话”,研究人员设置了发音相似的单词,如crab和craft,以便AI在出错时可以替换。

具体来说,他们在诸如BERT、XLM和xlnet等NLP模型上对“完形填空”任务进行了再培训,也就是说,他们用[mask]覆盖了一些单词,并要求AI填写相应的内容。

结果表明,AI在语序正常、前后有逻辑拷贝的视频中的替换准确率较高(蓝色是正确的替换词):

千万别让AI自动生成字幕:满屏“脏话”不忍直视

然而,在一些逻辑性较弱的文案中,成功替换的效果并不太好:

千万别让AI自动生成字幕:满屏“脏话”不忍直视

最后,Megatron(AndyLau)和莱文施泰因(Levenshtein)等机型的修复效果最好,亚马逊AI(AmazonJetLi)的正确修复率超过25%,谷歌AI(GoogleJetLi)的正确修复率超过28%。

千万别让AI自动生成字幕:满屏“脏话”不忍直视

从字幕生成能力来看,AI还有很长的路要走。

论文地址:https://github.com/sumeetkr/UnsafeTranscriptionofKidsContent/blob/main/YouTube_Transcription_Final.pdf

参考链接:https://www.dailymail.co.uk/sciencetech/article-10553233/YouTube-AI-播放清晰的语言字幕视频-aimed-儿童html

相关标签:

如本站内容“对您有用”,欢迎随意打赏,让我们持续更新!

生成海报 打赏
评论
  • 消灭零回复
登录后回复
游客
登录后展示个人签名去登录
0文章 0问题 0回答 0点赞
写作
发布问题
发布文章
关注微信
加QQ群370431002
随机文章
150W闪充没对手!realme GT Neo3官宣3月发:首批搭载天玑8100
2022-03-11 08:16:49
新一代自拍神器vivo S12宣布:搭载vivo定制版天玑1200
2021-12-15 09:13:49
明道热搜担当:追光21什么时候播放?追光吧哥哥更新时间介绍
2021-12-05 21:11:48
一加9系列不止两款!一加9R正式官宣:售价或有惊喜
2021-12-05 21:38:36
驾照记分规则迎来大调整:堵车时插队将被加大处罚!
2022-02-19 08:45:32
机箱接口套路多 这些小知识你都知道吗?
2023-02-23 09:46:53
中国可回收民营火箭飞跃:星河动力50吨级液氧煤油发动机试车成功
2022-03-01 20:41:12
紫甘蓝可以生吃吗 紫甘蓝的食用方法
2021-12-05 22:33:56
包皮垢怎么清洗 包皮垢清洁的注意事项
2021-12-18 07:34:47
山东栖霞市委书记、市长被免职怎么一回事 山东栖霞金矿爆炸事故后续
2021-12-09 21:23:02
这么多年都被Windows骗了 硬盘容量为啥总不够
2021-12-17 08:51:33
吃避孕药有哪些副作用
2022-04-03 08:13:33
学小米Civi 2?曝iPhone 15 Ultra将配备双前摄
2023-01-29 09:30:32
吉林长春12小时内新增本土确诊730例!全国多地紧急驰援
2022-03-16 08:50:46
冲上热搜!知名男星被曝长期进行“情绪操控”:出现这些行为一定要注意
2021-12-22 08:10:36
热门标签
智能手机为何越卖越贵 马斯克加速抢滩一文了解脑机接口 凛冬将至苹果还能靠iphone支撑多久 新野蛮人马斯克 630wrtx 4090解锁极限功耗 马斯克没有打价格战的基因 ipad营收锐减卖不动了 小米13 lite现身小米13家族最便宜版本 感受守护网络安全的黑科技app 感受守护网络安全的黑科技 新一代影像性能旗舰努比亚z50官宣 黑亚当纽约首映式 黑亚当创下巨石强森个人最好成绩 超人归来电影免费观看 超人回归dc 超人回归 贝鲁奇谈贝鲁奇 辐射剧集首张剧照 大超与白狼不可兼得 用废品造的iphone你会买单吗
Copyright © 2025 网站备案号: 闽ICP备2020021158号-10 本站所有信息来自于互联网或网友上传,如有侵权,敬请来信联系我们,1494738443@qq.com 我们立刻删除。
responsive_hankin 主题. Designed by 极速问答社区
赞赏作者

请通过微信、支付宝 APP 扫一扫

感谢您对作者的支持!

 支付宝 微信支付