當(dāng)前位置：首頁 > 大白菜資訊 > 阿里AI技術(shù)升級，輕松識別攔截近30個語種外語臟話圖

阿里AI技術(shù)升級，輕松識別攔截近30個語種外語臟話圖

日期：2021-09-28 | 時間：11:44

早在一年前，阿里巴巴就發(fā)現(xiàn)了一些為規(guī)避平臺審查的“臟話”的做法，一般開始是文字形式的臟話，后面逐漸演變?yōu)榕K話圖片，后面甚至使用多國語言進(jìn)行偽裝。

而這些做法使得阿里巴巴，無法通過現(xiàn)有技術(shù)和規(guī)則，進(jìn)行識別和清除，因此阿里安全開始進(jìn)行多語種識別技術(shù)升級。

最近，阿里安全算法團(tuán)隊(duì)宣布了一個好消息，表示網(wǎng)絡(luò)臟話的AI(OCR)技術(shù)研發(fā)升級，可以識別近30種語言，即使是嵌入圖片中的臟話，也可以進(jìn)行識別。

之所以要進(jìn)行這這類技術(shù)的研發(fā)，是因?yàn)樵诓糠謬H平臺中，“買家”在商品評論以及一些交互場景中，使用臟話圖片對陣。

而這部分臟話圖片中，還包含了多語種垃圾廣告以及不良信息，具有較大的威脅。

圖片.png

但是，全球有幾百種語言，即使是重點(diǎn)的語言也有幾十種，所以人工識別風(fēng)險圖片一點(diǎn)也不現(xiàn)實(shí)的，所以這項(xiàng)技術(shù)的需求就很大了。

在研發(fā)的過程中，除了要熟悉各字體的信息之外，還要注意部分臟話圖會以置換正常字符順序的方法，試圖瞞天過海。

現(xiàn)在，經(jīng)過一年多努力研究，阿里安全算法團(tuán)隊(duì)總算是得到了一個好結(jié)果，可以更加好地攔截危險圖片，確保安全。

大白菜資訊