當(dāng)前位置:首頁 > 大白菜資訊 > 阿里AI技術(shù)升級,輕松識別攔截近30個語種外語臟話圖
阿里AI技術(shù)升級,輕松識別攔截近30個語種外語臟話圖
日期:2021-09-28 | 時間:11:44
早在一年前,阿里巴巴就發(fā)現(xiàn)了一些為規(guī)避平臺審查的“臟話”的做法,一般開始是文字形式的臟話,后面逐漸演變?yōu)榕K話圖片,后面甚至使用多國語言進(jìn)行偽裝。
而這些做法使得阿里巴巴,無法通過現(xiàn)有技術(shù)和規(guī)則,進(jìn)行識別和清除,因此阿里安全開始進(jìn)行多語種識別技術(shù)升級。
最近,阿里安全算法團(tuán)隊(duì)宣布了一個好消息,表示網(wǎng)絡(luò)臟話的AI(OCR)技術(shù)研發(fā)升級,可以識別近30種語言,即使是嵌入圖片中的臟話,也可以進(jìn)行識別。
之所以要進(jìn)行這這類技術(shù)的研發(fā),是因?yàn)樵诓糠謬H平臺中,“買家”在商品評論以及一些交互場景中,使用臟話圖片對陣。
而這部分臟話圖片中,還包含了多語種垃圾廣告以及不良信息,具有較大的威脅。
但是,全球有幾百種語言,即使是重點(diǎn)的語言也有幾十種,所以人工識別風(fēng)險圖片一點(diǎn)也不現(xiàn)實(shí)的,所以這項(xiàng)技術(shù)的需求就很大了。
在研發(fā)的過程中,除了要熟悉各字體的信息之外,還要注意部分臟話圖會以置換正常字符順序的方法,試圖瞞天過海。
現(xiàn)在,經(jīng)過一年多努力研究,阿里安全算法團(tuán)隊(duì)總算是得到了一個好結(jié)果,可以更加好地攔截危險圖片,確保安全。
推薦內(nèi)容
- 高通新旗艦SoC或沿用驍龍855命名,并將于下周揭曉
- Uber被罰117萬美元!英國荷蘭共300萬用戶數(shù)據(jù)遭泄露
- 龍芯3A3000 CPU深入實(shí)測:國產(chǎn)芯片的春天即將來臨
- AI芯片年度最大融資!制作商地平線正籌資高達(dá)10億美元
- Moto G7 Play信息大曝光,預(yù)計19年第一季度正式發(fā)布
- 英特爾公布晶圓工廠擴(kuò)建計劃,首要任務(wù)提升14nm芯片產(chǎn)能
- iPhone違反法院禁令在中國照賣,高通再次死磕蘋果
- 中國移動11月份數(shù)據(jù)曝光:寬帶用戶量NO.1
- 高通聯(lián)發(fā)科等與阿里達(dá)成合作共識:將推芯片模組產(chǎn)品
- iOS 12.1.2再現(xiàn)老問題:4G網(wǎng)絡(luò)無法上網(wǎng)