国产强伦姧在线观看无码,中文字幕99久久亚洲精品,国产精品乱码在线观看,色桃花亚洲天堂视频久久,日韩精品无码观看视频免费

      正在閱讀:阿里研發(fā)AI技術(shù)0.15秒識別攔截外語臟話圖 覆蓋近30個語種

      阿里研發(fā)AI技術(shù)0.15秒識別攔截外語臟話圖 覆蓋近30個語種

      2021-09-27 13:42:13來源:快科技 關(guān)鍵詞:阿里巴巴智能識別閱讀量:21614

      導讀:為解決語言問題,阿里安全進行了多語種識別技術(shù)升級。近日,阿里安全算法團隊宣布,其研發(fā)用于網(wǎng)絡臟話的AI技術(shù),已能識別近30種語言。
        一年多前,阿里巴巴國際安全內(nèi)容風控小二小荷(化名)在用戶交互場景發(fā)現(xiàn)了特殊的為規(guī)避平臺審查的“臟話”案例。
       
        她的工作是借助技術(shù)和規(guī)則識別與清掃影響清朗環(huán)境的違規(guī)內(nèi)容,剛開始,一些小廣告和口吐芬芳的臟話只是以文字形式呈現(xiàn),后來隨著對抗升級,一些臟話嵌入到圖片中,甚至會使用多國語言進行偽裝。
       
        為解決這個問題,阿里安全進行了多語種識別技術(shù)升級。近日,阿里安全算法團隊宣布,其研發(fā)用于網(wǎng)絡臟話的AI(OCR)技術(shù),已能識別近30種語言,包括嵌入圖片中的英文、阿拉伯、俄語、法語、西語、日語、韓語、泰語、越南語、波斯語、孟加拉、尼泊爾、僧伽羅、朝鮮、蘇丹、德語、荷蘭語,以及馬來語、塔加洛語、土耳其語、意大利語、印尼語等國語言,甚至還包括三種中國少數(shù)民族語言。
       
        在部分國際平臺中,“買家”在商品評論中以英語評論圖罵人,或者在交互場景中,買賣雙方以俄語臟話圖片對陣。國際平臺風控團隊和算法團隊復盤了很多案例,發(fā)現(xiàn)除了多語種臟話,多語種垃圾廣告以及不良信息也會暗藏在圖片中,試圖對抗風控。
       
        全球有幾百種語言,重點的語言也有幾十種,一個工作人員最多認識三四種語言,在國際化場景下,靠人工識別風險圖片是不現(xiàn)實的,多語言識別的技術(shù)需求應運而生。
       
        阿里安全高級算法工程師沄帆介紹,要識別多語種文字,就要了解各個語言文字特點,以及影響算法識別的問題。每種文字體系都有自己的字體,不同字體會導致同一字符出現(xiàn)字形上的差異,例如下左圖展示了漢字“字”在不同字體時的形態(tài),以及手寫文字中的字符變化。下右圖則展示了俄語字母在手寫體和印刷體時的差異,紅框標出了部分字符會出現(xiàn)字形上的巨大變化。
       
        “字符連接導致字形變化,不同文字體系,書寫及閱讀順序是不同的,這些都會影響AI識別和對語義的判斷。”沄帆說。例如,相同的單詞在不同的語種里也可能有不同的含義,“jammer”在荷蘭語里是“遺憾”的意思,但是在英語中是“信號屏蔽器”,可能涉及違規(guī)。
       
        “以前沒有多語種識別功能的時候,我們?nèi)绻堰@個口語詞直接攔截,可能會造成‘誤殺’,臟話圖識別也是如此,要依據(jù)語種來判斷。”小荷說。
       
        除此之外,還有臟話圖以置換正常字符順序,對抗風控的情況出現(xiàn),即使調(diào)換字符順序,人還是可以輕而易舉地判斷單詞的含義,但這種“攻擊”試圖以打亂字母順序的方式騙過機器識別。
       
        當然,要訓練如此多語種的識別模型,并解決多種對抗情況并不容易。技術(shù)團隊既要保證好的識別效果,又要盡可能提高計算效率及控制成本,解決好訓練樣本及模型方案的問題。
       
        通過一年多努力研究,阿里安全算法團隊對這些點進行了逐個突破,通過改進多語言樣本生成方案與多語種識別模型框架,在多種圖片語言的識別上做到了高識別率,以及做到識別1張臟話圖只需0.15秒的速度,目前該技術(shù)也已應用在阿里多項國際業(yè)務中,總體識別準確率可達95%以上,并對各種藝術(shù)字體、復雜背景以及手寫圖進行了針對性識別優(yōu)化。
       
        其實,臟話攔截只是多語種OCR識別技術(shù)應用的場景之一,阿里安全國際風控小二文萱介紹,在交互場景里,違規(guī)信息中還有大部分屬于垃圾信息。
       
        現(xiàn)在,基于阿里安全的算法能力,每天僅單個國際平臺就為全球用戶攔截幾萬次包含危險、辱罵、垃圾文本的多語言臟話圖片。阿里安全圖靈實驗室算法負責人薛暉表示:“期待以科技創(chuàng)新解決實際業(yè)務問題,幫助造就更好的網(wǎng)絡環(huán)境和網(wǎng)絡安全。”
       
        (原標題:阿里研發(fā)AI技術(shù)0.15秒識別攔截外語臟話圖 覆蓋近30個語種)
      我要評論
      文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

      所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)。

      版權(quán)與免責聲明:

      凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應在授權(quán)范圍內(nèi)使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責任。

      本站轉(zhuǎn)載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉(zhuǎn)載時,必須保留本站注明的作品第一來源,并自負版權(quán)等法律責任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責任。

      鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問題,請與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

      不想錯過行業(yè)資訊?

      訂閱 智能制造網(wǎng)APP

      一鍵篩選來訂閱

      信息更豐富

      推薦產(chǎn)品/PRODUCT 更多
      智造商城:

      PLC工控機嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機械包裝機械工程機械倉儲物流環(huán)保設備化工設備分析儀器工業(yè)機器人3D打印設備生物識別傳感器電機電線電纜輸配電設備電子元器件更多

      我要投稿
      • 投稿請發(fā)送郵件至:(郵件標題請備注“投稿”)1271141964.qq.com
      • 聯(lián)系電話0571-89719789
      工業(yè)4.0時代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務平臺
      智能制造網(wǎng)APP

      功能豐富 實時交流

      智能制造網(wǎng)小程序

      訂閱獲取更多服務

      微信公眾號

      關(guān)注我們

      抖音

      智能制造網(wǎng)

      抖音號:gkzhan

      打開抖音 搜索頁掃一掃

      視頻號

      智能制造網(wǎng)

      公眾號:智能制造網(wǎng)

      打開微信掃碼關(guān)注視頻號

      快手

      智能制造網(wǎng)

      快手ID:gkzhan2006

      打開快手 掃一掃關(guān)注
      意見反饋
      我要投稿
      我知道了