AI鑒黃,一把量出人性的尺子
AI鑒黃,一把量出人性的尺子。在1997年版的電影《洛麗塔》里,洛麗塔趴在花園的草坪上讀書,天真的臉龐籠罩在朦朧的水霧下。在她的眼波流轉(zhuǎn)之中,電影流露出情色的味道。情色作品的含蓄和豐富常常使其可以借“性”的描述來傳達(dá)對社會(huì)精神狀態(tài)的思考。但是情色和色情從來不是一回事,而二者模糊的邊界卻不斷讓色情內(nèi)容的傳播有了可乘之機(jī)。
鑒黃師是在互聯(lián)網(wǎng)色情內(nèi)容暴增的條件下滋生的一個(gè)職業(yè)。然而長期面對大量色情內(nèi)容的刺激使這類工作者往往要承受心理、生理的雙重壓力。那么,在人工智能迅速崛起的時(shí)代,AI的加入會(huì)不會(huì)成為鑒黃師們的“減壓閥”呢?
AI來了,“東京熱”們還會(huì)好嗎?
互聯(lián)網(wǎng)鑒黃主要分為三個(gè)階段,第一階段叫人肉階段,主要通過人工識(shí)別的方式來發(fā)現(xiàn)黃色內(nèi)容;第二階段叫算法過濾階段,以膚色識(shí)別算法過濾黃色圖片開始成為主流;第三階段叫深度學(xué)習(xí)階段,因?yàn)榧兡w色式地圖片過濾已經(jīng)難以擔(dān)當(dāng)鑒黃的重任,所以機(jī)器學(xué)習(xí)成為了新的主角。針對第三個(gè)階段,智能相對論分析師(aixdlun)楊蘇穎梳理了三種不同的智能鑒黃工種,分別囊括了音頻、圖像和視頻三種形式。
首先是鑒定圖片和視頻的鑒定。鑒別黃色圖片的過程主要有兩步,第一步是用黃圖的特點(diǎn)來定義一個(gè)機(jī)器可以識(shí)別的數(shù)學(xué)模型。第二步則是用大量滿足定義的圖片來進(jìn)行樣本數(shù)據(jù)的收集并將其用于機(jī)器訓(xùn)練。在島國搜尋大量動(dòng)作片的種子進(jìn)行海量灌輸之后,我們可以得到一個(gè)越來越精準(zhǔn)的模型,從而讓人工智能準(zhǔn)確識(shí)別出某張圖片是否為黃圖。這是AI鑒別靜態(tài)圖片的一個(gè)簡單流程。
那么AI對于動(dòng)態(tài)圖像又是怎么進(jìn)行處理的呢?其實(shí)AI要對在線視頻和直播這類的動(dòng)態(tài)圖像開展鑒黃工作,其原理與鑒別靜態(tài)圖片并沒有太大的差別。只要在鑒別視頻和直播的時(shí)候,人為地多加一個(gè)步驟把動(dòng)態(tài)內(nèi)容解碼變成圖片幀,剩下的工作就和靜態(tài)圖片處理大同小異了。
另外,如今偽ASMR的涌現(xiàn)要求AI在色情音頻上的處理能力也必須跟上。在各種直播房間內(nèi),主播們更是可以直接以語言交流的方式與粉絲進(jìn)行互動(dòng)。所以,國內(nèi)的一家名叫極限元的公司采用了一種叫CTC+LSTM組合的深度學(xué)習(xí)技術(shù)來識(shí)別色情音頻內(nèi)容。它可以分析語音的信息內(nèi)容,從而判斷出語音當(dāng)中是否含有色情信息。
在鑒黃領(lǐng)域,AI的三管齊下顯示了其要肅清黃色內(nèi)容的決心,而且它也確確實(shí)實(shí)地減輕了人工鑒黃的壓力。但是在現(xiàn)實(shí)當(dāng)中上有政策,下有對策的戲碼總是會(huì)不斷上演,因此鑒黃的力度越大,色情的邊界也就拓展地越快,自然AI鑒黃的難度也會(huì)越大。而這好像成為一個(gè)繞不開的死循環(huán)。
AI鑒黃可能暫時(shí)還hold不住軟色情
最近軟色情一詞在網(wǎng)絡(luò)上被頻繁提到,成為一個(gè)關(guān)注度很高的話題。軟色情的內(nèi)容很軟,好像廣告軟文一樣,入侵的時(shí)候悄無聲息。但是其所造成的傷害卻很硬,足以讓沒有心智成熟的青少年沉溺其中難以自拔。AI進(jìn)入鑒黃領(lǐng)域,勢必要面對現(xiàn)在越來越活躍的軟色情,但要如果真想要AI對軟色情做出識(shí)別和判定卻是一項(xiàng)難上加難的工作。
軟色情的定義很模糊,它的定義是與硬色情對比得來的,指一些不暴露生殖器官的色情內(nèi)容。如果把暴露生殖器官作為一個(gè)特點(diǎn)去識(shí)別哪些內(nèi)容屬于硬色情,那么這是一件相對比較容易的事情。但是我們卻不能把不暴露生殖器官作為識(shí)別軟色情的特點(diǎn),否則所有不暴露生殖器官的內(nèi)容都會(huì)被標(biāo)記為軟色情內(nèi)容。所以這也就意味著軟色情并不是一樣容易被貼上具體標(biāo)簽的東西,它非黑非白,而是屬于灰色,因此很難被公式化。
這就為人工智能鑒黃制造了一個(gè)難題。通常人工智能進(jìn)行鑒黃首先需要建立一個(gè)“分類器”來將圖片歸類,但不幸的是,軟色情的問題卻沒有那么簡單。什么是軟色情這個(gè)事并不好弄清楚。在B站的一些彈幕上,我們常??梢钥吹揭蝗喝藢χ曨l當(dāng)中的蘿莉發(fā)彈幕,包括“跪舔”、“硬了”之類的字眼。但是拿“跪舔”為例,有些人只把它當(dāng)作一個(gè)比較夸張的網(wǎng)絡(luò)用語,覺得無比正常。而有的人在這些字眼的刺激下卻真的會(huì)產(chǎn)生生理反應(yīng),難以把控。這些不同的反應(yīng)主要是由于我們每個(gè)人色情刺激的閾值高低不一。所以,像“跪舔”這樣的彈幕到底算不算是軟色情的表現(xiàn)呢?這很難判定。捫心自問,軟色情是一個(gè)很個(gè)人化的東西,它幾乎可以是一切能夠喚起自己對配偶之外的性欲的東西,而機(jī)器卻不可能成為每一個(gè)人肚子里的蛔蟲。
不僅是定義模糊難分類,軟色情的傳播渠道也開始朝越來越隱秘的方向發(fā)展。今年3月B站的“文愛”事件讓語C群浮出水面。各種嬌喘的音頻,露骨的聊污在QQ微信群里肆意傳播。在此基礎(chǔ)上,選擇私聊成為“文愛”對象的青少年也同樣不在少數(shù)。我們可以看到的是,全國最大的社交工具現(xiàn)在正在成為全國最大的軟色情承載地之一,而這些社交工具對隱私的保護(hù)竟成為了軟色情最好的保護(hù)傘。面對這些越來越隱秘的色情傳播形式,AI要嘗試去發(fā)現(xiàn)它們的存在實(shí)際上是一件非常困難的事情。如果強(qiáng)行去打開這扇門,那么很有可能會(huì)觸及到閱讀用戶隱私這條紅線,對此,內(nèi)容審核方難以把握,所以也就更難以下手。加之,人工智能對自然語言的識(shí)別程度現(xiàn)在還十分局限。常用的拆字法、首字母縮寫法、取別稱法、拼音代替法、形近字代替法等等也會(huì)讓鑒黃工作變得更為復(fù)雜。
AI鑒黃堵住了人性的出口嗎?
弗洛伊德的泛性論認(rèn)為,性是一種本能力量。若受到壓抑就會(huì)導(dǎo)致人得精神疾病。因此,色情內(nèi)容的看客會(huì)說,AI鑒黃堵住了人性的出口。在美國,色情業(yè)的收入超過了哥倫比亞廣播公司CBS、全國廣播公司NBC和美國廣播公司ABC三家收入的總和。營業(yè)額超過了所有職業(yè)橄欖球、職業(yè)棒球和職業(yè)籃球收入的總和,因此色情產(chǎn)業(yè)對人來說是一種剛需。
法國有一部叫《生吃》的電影曾對人的欲望做出討論,電影女主角一家因?yàn)榛蜃儺惖膯栴}受本能驅(qū)使不得不生吃人肉,這看上去非常殘忍。但是仔細(xì)想想,吃人肉為什么一定得被定義成“野蠻”、“殘忍”的代表,“吃人肉是錯(cuò)的”這樣的道德標(biāo)準(zhǔn)又是從何而來?如果吃人肉是一種本能,那么本能是不是不能加以價(jià)值判斷?
確實(shí),本能不可以加以價(jià)值的判斷。因?yàn)橛钦鎸?shí)存在,并且與生俱來的。但是怎么對待自己的欲望卻可以成為一門很重要的功課。如果我們對欲望視而不見,那么人就會(huì)麻木,壓抑;如果我們?nèi)斡麢M流,那么人最終會(huì)被欲望吞噬,成為怪物。欲望不能被殺死,但是也不能成為我們生活的主宰者??刂菩杂?、食欲、肉欲的道理皆是如此。所以,黃色內(nèi)容需要正規(guī)、有序的引導(dǎo),AI鑒黃不是在堵住人性的出口,而是在調(diào)控欲望的尺度。
2898站長資源平臺(tái)網(wǎng)站資訊:http://afrimangol.com/news/