每个月,超过19亿的用户登录YouTube。
每天,用户在Youtube上观看的视频超过10亿小时。
每分钟,用户平均上传300小时的视频。
如此多的用户、活动和内容产生了大量的数据,因此YouTube可以充分利用AI来帮助运营。
文摘菌今天给大家介绍的是YouTube使用AI和机器学习的神奇方法,从视频过滤、内容推荐到视频特效、视频深度预测,Youtube的AI算法已然无处不在。
自动删除劣质内容
仅在19年第一季度,就有830万视频从YouTube上被删除,其中76%的视频是由AI分类器自动识别的。并且,超过70%的视频在有用户观看前就被识别出来了。虽然这些算法并不是万无一失的,但它们对内容的梳理速度显然要比人工监控平台快得多。
然而在某些情况下,算法会把有新闻价值的视频误认为是“暴力极端主义”,这也是Google聘请全职人类专家与AI合作处理暴力内容的原因之一。
YouTube的“首要任务”是避免用户接触到有害内容。为了实现这一目标,YouTube不仅投入了人类专家,还投入了机器学习技术。
AI极大地提高了YouTube快速识别劣质内容的能力。在使用AI之前,只有8%的含有“暴力极端主义”的视频在被观看10次之前被标记并删除;但在使用机器学习技术之后,这个数字被提高到了50%以上。
YouTube如此重视删除劣质内容的原因,一是来自品牌、机构和政府的压力,二是来自广告与不法视频同时出现时可能引起的不良反应。当广告开始出现在支持种族主义和恐怖主义的视频旁时,广告主可能就要开始削减广告费用。因此YouTube部署了高级机器学习技术,并与第三方公司合作,以提高金主爸爸们对于广告质量的把控。
YouTube还有一个“垃圾视频分类器”,用于扫描YouTube主页和“watch next”面板。它关注的是来自观众的反馈,观众可能会举报一个误导人的标题、不宜或其他不良的内容。
给视频加特效
Google AI研究人员训练了一个神经网络,使其能够在不需要专业设备的情况下改变视频背景。
在此之前,该换视频背景是一个复杂且耗时的过程。研究人员用经过精确标记的图像训练了一种算法,使该算法能够学习模式,得到一个能够实时渲染的快速特效系统。
“下一个视频”功能
如果你曾经使用过YouTube的“下一个视频”功能,你就应该领教过平台的AI。YouTube上的数据集随用户每时每刻上传的视频而不断变化,因此为其推荐引擎提供动力的AI需要不同于Netflix和Spotify的推荐引擎。它必须能够在用户不断添加新数据的同时进行实时推荐。
YouTube的解决方案是一个由两部分组成的系统,第一部分是通过评估用户观看历史得到的候选推荐,第二部分则是为每个视频打分的排名系统。
Guillaume Chaslot是谷歌的前员工,他提出了一个倡导提高透明度的倡议,该倡议被称为AlgoTransparency。
他说,YouTube算法用来确定成功推荐的标准是观看时间。这对平台和广告商来说都是好事,但对用户来说就不那么好了。这种情况可能会放大那些猎奇的视频,越多的人花时间观看它,它的推荐就会越多。
深度预测训练
YouTube拥有如此多数据,为AI算法提供了肥沃的训练土壤。Google AI研究人员利用平台上发布的2000多个“假人挑战”视频,创建了一个能够识别视频中景深的AI模型。
在“假人挑战”中,一群人站在视频中就像被冻住了一样一动不动,然后由摄影师穿过现场拍摄视频。最终,这种深度预测的技术将有助于推动增强现实(AR)体验的发展。
防止暴力事件
随着大规模枪击事件的危机持续困扰美国,特朗普总统要求社交媒体公司“开发能够在大规模枪击事件发生前侦测到凶手的工具”。于是YouTube、Twitter和Facebook已经在AI的帮助下着手删除恐怖分子的内容,现在总统又要求让他们与司法部和执法机构合作。
但是,建立这种合作关系还存在许多问题,社交媒体公司是否能够在真正的恐怖分子采取行动之前就发现他们,以及是否会对无辜百姓的公民自由产生影响,这都是不可预料的。
YouTube和其他社交媒体公司能否在不侵犯他人权利的同时,利用AI阻止恐怖分子,还有待观察。
本文转自公众号机器学习研究会订阅号,原文地址