首頁 > 行業(yè)動態(tài)
人工凈化網(wǎng)絡(luò) AI扛起清道夫的掃把
時間:2017-08-24 10:04:12  來源:科技日報   作者:

原標(biāo)題:人工凈化網(wǎng)絡(luò)“心有余力不足”

  AI扛起清道夫的掃把

 

 

  近日,多款在線學(xué)習(xí)類APP被曝光產(chǎn)品內(nèi)暗藏大量“黃段子”,“學(xué)霸君”“小猿搜題”等熱門在線學(xué)習(xí)軟件均牽涉其中。針對這一問題,全國“掃黃打非”辦公室已協(xié)調(diào)相關(guān)部門進(jìn)行深入調(diào)查,并且會同宣傳、網(wǎng)信、工信、公安、文化、工商、新聞出版廣電等部門,在全國范圍內(nèi)開展互聯(lián)網(wǎng)低俗色情信息專項(xiàng)整治行動。

  近兩年來,直播平臺、資源共享下載平臺、各類APP,以及各種圖片、視頻社交網(wǎng)站迅速發(fā)展,但是魚龍混雜、良莠不齊,面對互聯(lián)網(wǎng)上充斥的不健康信息,我們該怎么辦?

  涉黃與凈化上演貓鼠游戲 人工審核“力不從心”

  相信很多人還對“快播被禁”事件記憶猶新。2014年4月中旬快播科技對外宣布,快播會關(guān)閉qvod服務(wù)器,停止基于快播技術(shù)的視頻點(diǎn)播和下載,清理低俗內(nèi)容與涉盜版內(nèi)容。

  在此之后,國家監(jiān)管政策密集頒布,一個個涉黃平臺被關(guān)停。國家對淫穢色情信息的嚴(yán)厲監(jiān)管,也使得網(wǎng)絡(luò)行業(yè)催生了一個新工種——被網(wǎng)友調(diào)侃為“宅男福利職業(yè)”的人工鑒黃師。

  之所以被看作“福利”,是因?yàn)樗麄儾坏枰娅C大量黃色圖片、文字、視頻等,而且還能掙高額工資。很多人還記得,4年前,某互聯(lián)網(wǎng)公司曾用20萬高薪招聘“首席淫穢色情鑒定官”。

  但是,看似“風(fēng)光”的背后是心理和生理的雙重壓力。據(jù)科技日報記者了解,一個鑒黃師平均一天要看2萬張圖,同時需要“白加黑、五加二”不間斷工作。“圖普科技”運(yùn)營總監(jiān)、“AI鑒黃師”姜澤榮就吐槽:“說當(dāng)‘鑒黃師’是件美差的人,都不了解這個職業(yè)。”

  對眾多平臺而言,聘請鑒黃師需要巨額投入。阿里安全專家王金廷向科技日報記者表示,一個100人的審核團(tuán)隊(duì),一年花費(fèi)要在840萬元左右。但是即使在年薪20萬的誘惑下,每個平臺也只有幾十或者上百個人的監(jiān)管隊(duì)伍。當(dāng)直播高峰期來臨時,成千上萬的主播在線,讓監(jiān)管隊(duì)伍“力不從心”。

  AI“清道夫”培訓(xùn)上崗 用三把尺子鑒定影像

  在這樣的前提下,引入“AI鑒黃師”解放一大部分審核師就顯得意義非凡。利用機(jī)器替代人工進(jìn)行基礎(chǔ)的審核工作,對于以視頻和圖片為主的網(wǎng)絡(luò)平臺而言,成為了一種剛需。

  王金廷指出,使用“AI鑒黃師”可以減少90%以上人工成本;可實(shí)現(xiàn)精準(zhǔn)審核過濾,甚至可達(dá)到99%以上的準(zhǔn)確率;相對于人工鑒黃3小時輪班輪崗的效率,AI可以24小時不間斷審核,并且“無工傷、無工資”。

  但是“AI鑒黃師”在上崗前還需要通過工程師的“訓(xùn)練”才能開始工作。首先人們會給AI輸入海量數(shù)據(jù),對它們進(jìn)行標(biāo)簽化訓(xùn)練,告訴它,ABC這樣的情況屬于色情,DEF這樣的情況屬于非色情;然后AI會通過學(xué)習(xí),提取ABCDEF的特征來判斷G是不是色情。

  當(dāng)然,不同的“AI鑒黃師”工作的技術(shù)路線也不盡相同,但“套路”是一致的,一般會通過3方面對實(shí)時視頻影像進(jìn)行分析鑒定:是否有人物,如有,色情概率增加;人形輪廓的膚色比例,如果比較大,色情概率增加;姿態(tài)分析,如有性行為姿勢,則色情概率增加。

  在網(wǎng)絡(luò)凈化的道路上,國內(nèi)多家IT巨頭早已開始布局。阿里的綠網(wǎng)、騰訊的萬象優(yōu)圖等紛紛下水,創(chuàng)業(yè)公司也積極參與凈化業(yè)務(wù),“八仙過海,各顯神通”。

  王金廷是負(fù)責(zé)“阿里綠網(wǎng)”的產(chǎn)品專家。據(jù)介紹,基于深度學(xué)習(xí)技術(shù)及阿里巴巴多年的海量數(shù)據(jù)支撐,“阿里綠網(wǎng)”可提供圖片、視頻、文字等多媒體的內(nèi)容風(fēng)險智能識別服務(wù),在節(jié)省90%以上人力成本的同時,該應(yīng)用支持秒級返回結(jié)果,達(dá)到99%以上的準(zhǔn)確率。

  騰訊優(yōu)圖DeepEye智能鑒黃技術(shù),可對目標(biāo)圖片進(jìn)行系統(tǒng)識別,準(zhǔn)確率高達(dá)99.9%。它不僅可以用于靜態(tài)圖片的審核,還可以應(yīng)用到動態(tài)的直播業(yè)務(wù)中,透過對直播流抽幀鑒定處理,讓違規(guī)“色情主播”秒進(jìn)“小黑屋”。

  機(jī)器發(fā)力還需人工輔助 AI獨(dú)立審核任重道遠(yuǎn)

  無疑,人工智能介入內(nèi)容識別是偉大的進(jìn)步。但上述機(jī)器審核都不能獨(dú)立進(jìn)行,還需要人工輔助。

  在采訪中,關(guān)于人工智能何時能獨(dú)立扛起審核大旗的疑問,科技日報記者從眾多專家那里得到的比較一致的看法是,“在現(xiàn)有技術(shù)條件下,要實(shí)現(xiàn)AI完全替代人工尚需時日”。

  人工智能如此發(fā)達(dá),為何還替代不了人?王金廷向記者列舉了人工智能審核時的3個瓶頸。“首先AI需要適應(yīng)不同行業(yè)不同用戶的審核標(biāo)準(zhǔn),這中間的差異性會非常大,對于人工智能算法的挑戰(zhàn)也很大;其次,針對新出現(xiàn)的變異風(fēng)險,算法需要有強(qiáng)大的自我學(xué)習(xí)能力,這也是目前需要解決的問題;最后,要真正實(shí)現(xiàn)無人化,人工智能需要達(dá)到在沒有人的參與下訓(xùn)練。”

  此外,現(xiàn)階段,人工智能還遠(yuǎn)未模擬出用戶的真實(shí)體驗(yàn),涉黃與否,很難作出準(zhǔn)確的“人的判斷”。以Google為例,有超過一萬名員工充當(dāng)著搜索結(jié)果評估者的角色。這或許也說明了人工智能“上位”還需加把勁。究其原因,機(jī)器檢測到含有敏感詞匯的文字內(nèi)容,會將其刪除或向用戶發(fā)出警告。但對于圖片、視頻的審核,機(jī)器無法像對文字內(nèi)容一樣提取關(guān)鍵詞,審核難度較大。

  “人工智能雖然取得了很大進(jìn)步,但遠(yuǎn)未到徹底替代人的時候。”王金廷認(rèn)為,隨著技術(shù)的進(jìn)步,人工智能也許會徹底解放人類。不過到了那一天,人工鑒黃師恐怕就要失業(yè)了。

  版權(quán)聲明:呼倫貝爾擔(dān)保網(wǎng)為開放性信息平臺,為非營利性站點(diǎn),所有信息及資源均是網(wǎng)上搜集或作交流學(xué)習(xí)之用,任何涉及商業(yè)盈利目的均不得使用,否則產(chǎn)生一切后果將由您自己承擔(dān)!本站僅提供一個參考學(xué)習(xí)的環(huán)境,將不對任何信息負(fù)法律責(zé)任。除部分原創(chuàng)作品外,本站不享有版權(quán),如果您發(fā)現(xiàn)有部分信息侵害了您的版權(quán),請速與我們聯(lián)系,我們將在48小時內(nèi)刪除。
熱點(diǎn)推薦
收費(fèi)公路為何連年虧損? 交通部回應(yīng)六大熱點(diǎn)問題
收費(fèi)公路為何連年虧損? 交通部回應(yīng)六大熱點(diǎn)問題
水污染防治法修改通過 將引爆萬億級市場空間
水污染防治法修改通過 將引爆萬億級市場空間
債券通”迎開門紅 首日成交逾70億
債券通”迎開門紅 首日成交逾70億
債券通考驗(yàn)中國債市的身板體質(zhì)
債券通考驗(yàn)中國債市的身板體質(zhì)
券商債券承銷上半年全面遇冷 公司債大幅縮水超七成
券商債券承銷上半年全面遇冷 公司債大幅縮水超七成