每個月,超過19億的用戶登錄YouTube。

每天,用戶在Youtube上觀看的視頻超過10億小時。

每分鐘,用戶平均上傳300小時的視頻。

如此多的用戶、活動和內容產生了大量的數據,因此YouTube可以充分利用AI來幫助運營。

文摘菌今天給大家介紹的是YouTube使用AI和機器學習的神奇方法,從視頻過濾、內容推薦到視頻特效、視頻深度預測,Youtube的AI算法已然無處不在。

YouTube 的 ai 算法無處不在

自動刪除劣質內容

僅在19年第一季度,就有830萬視頻從YouTube上被刪除,其中76%的視頻是由AI分類器自動識別的。並且,超過70%的視頻在有用戶觀看前就被識別出來了。雖然這些算法並不是萬無一失的,但它們對內容的梳理速度顯然要比人工監控平台快得多。

然而在某些情況下,算法會把有新聞價值的視頻誤認為是“暴力極端主義”,這也是Google聘請全職人類專家與AI合作處理暴力內容的原因之一。

YouTube的“首要任務”是避免用戶接觸到有害內容。為了實現這一目標,YouTube不僅投入了人類專家,還投入了機器學習技術。

AI極大地提高了YouTube快速識別劣質內容的能力。在使用AI之前,只有8%的含有“暴力極端主義”的視頻在被觀看10次之前被標記並刪除;但在使用機器學習技術之後,這個數字被提高到了50%以上。

YouTube如此重視刪除劣質內容的原因,一是來自品牌、機構和政府的壓力,二是來自廣告與不法視頻同時出現時可能引起的不良反應。當廣告開始出現在支持種族主義和恐怖主義的視頻旁時,廣告主可能就要開始削減廣告費用。因此YouTube部署了高級機器學習技術,並與第三方公司合作,以提高金主爸爸們對於廣告質量的把控。

YouTube還有一個“垃圾視頻分類器”,用於掃描YouTube主頁和“watch next”面板。它關注的是來自觀眾的反饋,觀眾可能會舉報一個誤導人的標題、不宜或其他不良的內容。

給視頻加特效

Google AI研究人員訓練了一個神經網絡,使其能夠在不需要專業設備的情況下改變視頻背景。

在此之前,該換視頻背景是一個複雜且耗時的過程。研究人員用經過精確標記的圖像訓練了一種算法,使該算法能夠學習模式,得到一個能夠實時渲染的快速特效系統。

“下一個視頻”功能

如果你曾經使用過YouTube的“下一個視頻”功能,你就應該領教過平台的AI。YouTube上的數據集隨用戶每時每刻上傳的視頻而不斷變化,因此為其推薦引擎提供動力的AI需要不同於Netflix和Spotify的推薦引擎。它必須能夠在用戶不斷添加新數據的同時進行實時推薦。

YouTube的解決方案是一個由兩部分組成的系統,第一部分是通過評估用戶觀看歷史得到的候選推薦,第二部分則是為每個視頻打分的排名系統。

Guillaume Chaslot是谷歌的前員工,他提出了一個倡導提高透明度的倡議,該倡議被稱為AlgoTransparency。

他說,YouTube算法用來確定成功推薦的標準是觀看時間。這對平台和廣告商來說都是好事,但對用戶來說就不那麼好了。這種情況可能會放大那些獵奇的視頻,越多的人花時間觀看它,它的推薦就會越多。

深度預測訓練

YouTube擁有如此多數據,為AI算法提供了肥沃的訓練土壤。Google AI研究人員利用平台上發布的2000多個“假人挑戰”視頻,創建了一個能夠識別視頻中景深的AI模型。

在“假人挑戰”中,一群人站在視頻中就像被凍住了一樣一動不動,然後由攝影師穿過現場拍攝視頻。最終,這種深度預測的技術將有助於推動增強現實(AR)體驗的發展。

防止暴力事件

隨着大規模槍擊事件的危機持續困擾美國,特朗普總統要求社交媒體公司“開發能夠在大規模槍擊事件發生前偵測到兇手的工具”。於是YouTube、Twitter和Facebook已經在AI的幫助下着手刪除恐怖分子的內容,現在總統又要求讓他們與司法部和執法機構合作。

但是,建立這種合作關係還存在許多問題,社交媒體公司是否能夠在真正的恐怖分子採取行動之前就發現他們,以及是否會對無辜百姓的公民自由產生影響,這都是不可預料的。

YouTube和其他社交媒體公司能否在不侵犯他人權利的同時,利用AI阻止恐怖分子,還有待觀察。

本文轉自公眾號機器學習研究會訂閱號,原文地址