2.6 人工智能組件

1.人工智能組件功能

企業(yè)級RPA的人工智能組件(AI Component)主要用于提供以圖像處理妻率、文本識別谒亦、語義分析等為核心的人工智能技術,賦予RPA智能化數字員工更強大的業(yè)務技能和場景延展性。如果將傳統(tǒng)的RPA產品比喻成人的雙手魁淳,因為它能夠替代人工處理一些簡單的壕探、規(guī)律性的事務冈钦,那么融合了人工智能技術的RPA產品則相當于是擁有了人的眼睛和大腦,這就使得RPA軟件機器人能夠處理的場景和能力得到了大大的提升浩蓉。人工智能組件不僅能夠幫助用戶解決代填派继、數據遷移之類的業(yè)務,還能夠通過圖像處理捻艳、文本識別提供的“眼睛”的能力和語義分析提供的“大腦”的能力處理大量的紙質文檔驾窟,以及對文檔進行分析和研判。

2.智能圖像處理組件

傳統(tǒng)RPA的元素捕獲功能需要依靠系統(tǒng)或軟件提供的接口认轨,對目標元素進行識別或定位绅络,通過消息傳遞機制或鍵盤和鼠標操作完成一系列的操控動作。但元素捕獲能力的強弱在很大程度上取決于開發(fā)的接口嘁字,很多第三方的軟件或者非標準化的元素常常會無法捕獲恩急。

企業(yè)級智能RPA創(chuàng)新性地將計算機視覺技術與傳統(tǒng)元素捕獲功能相結合,以便更好地支持非標準化元素的定位與獲取纪蜒。計算機視覺是一項幫助計算機衷恭、軟件、機器人或其他設備獲取纯续、分析及處理圖片的技術随珠。智能RPA利用計算機視覺的模板匹配技術識別并定位目標元素,然后使用鍵盤和鼠標進行控制猬错。模板匹配技術需要兩幅圖像:一幅是原圖像窗看,在其中尋找與模板匹配的區(qū)域;一幅是模板倦炒,是用來與原圖像進行比照的圖像塊显沈。在檢測最匹配區(qū)域的過程中,模板在原圖像上進行滑動比較逢唤,即圖像塊一次移動一個像素(從左往右拉讯,從上往下)。每個位置都進行一次匹配度或相似度的計算智玻,最終找到模板與原圖像最匹配的位置遂唧。

通過創(chuàng)新性地整合計算機視覺技術,企業(yè)級智能RPA可以完全捕獲國產辦公軟件WPS吊奢、國產數據庫盖彭、Chrome纹烹、IE、Firefox召边、App铺呵、Email、Office隧熙、ERP片挂、SAP、Citrix等各類應用程序界面的非標準元素贞盯,完全避免了RPA在實施過程中部分非標準元素無法定位和捕獲的尷尬局面音念,極大地拓展了RPA的能力邊界。

3.智能文本識別組件

在許多行業(yè)的業(yè)務場景中都存在著將大量的影音文件躏敢、紙質文件的數據錄入電子系統(tǒng)的工作闷愤,傳統(tǒng)RPA一般無法直接處理掃描件等影印類型的數據資料。智能RPA能夠與基于光學字符識別(Optical Character Recognition件余,OCR)的智能文本識別技術相結合讥脐,實現對身份證、發(fā)票啼器、房產證旬渠、火車票、營業(yè)執(zhí)照等掃描件的高精度識別(如圖2-15端壳、圖2-16所示)告丢。光學字符識別是指利用電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗损谦、亮的模式確定其形狀芋齿,然后用字符識別的方法將形狀翻譯成計算機文字的過程。OCR技術具體來說就是成翩,針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件赦役,并通過識別軟件將圖像中的文字轉換成文本格式麻敌,供文字處理軟件進一步編輯加工。通過OCR技術掂摔,可以自動識別護照等證件上的信息术羔,從而能夠省去大量的人工錄入工作。

10.jpg

圖2-15 驗證碼等文件智能識別校驗

11.jpg

圖2-16 發(fā)票智能識別校驗

智能文本識別組件能夠實現高難度的文本識別乙漓,除基礎證件级历、證明、常用報表之外叭披,其還可以處理無邊框表格寥殖,對于手寫體識別也可以達到較高的準確率。智能文本識別組件使用了基于CTPN等先進算法的文本檢測網絡,能有效地區(qū)分文本與模糊圖片嚼贡,可以方便地處理各行各業(yè)的匯總文檔與報表熏纯,同時還可以便捷地處理爬蟲數據。當組件使用基于Mask-RCNN和Unet的表格檢測算法時粤策,可以通過大量的圖像處理算法構建無邊框表格的表格線樟澜,區(qū)分文本與表格的內容,有效解決無邊框表格處理這個業(yè)界難題叮盘。

智能文本識別組件使用基于CRNN等算法的文本識別網絡秩贰,能夠大幅度提升識別的準確率。除傳統(tǒng)類別的文本之外柔吼,該組件對污損印章毒费、模糊手寫與混合驗證碼的識別也能取得良好的效果。該組件支持全新類別的文檔定制化開發(fā)嚷堡,如建筑圖紙等類別蝗罗。智能圖像處理組件除SaaS部署方式之外,還支持私有化部署蝌戒,具體采用哪種部署方式可依據客戶的需求靈活調節(jié)串塑。

4.智能語義分析組件

經過OCR技術識別之后,智能RPA平臺可以將照片等圖片信息轉化為電子信息北苟,但是對于其中的關鍵信息還是沒有辦法處理桩匪,因此需要進一步使用NLP技術。NLP技術可用于對文檔的各個維度進行分析友鼻,自動提取出文檔中的關鍵內容傻昙,比如,從勞動合同中找到就業(yè)信息彩扔、崗位內容等相關的材料妆档,同時完成相關內容的自動填寫。智能語義分析組件基于NLP技術虫碉,結合深度學習贾惦、多模型融合、圖像處理等AI技術可以實現對文檔的深入理解和分析敦捧,從而最大限度地提高企業(yè)的工作效率须板、降低監(jiān)控風險。

智能語義分析組件基于海量文本語料庫兢卵、審核規(guī)則习瑰、外界知識庫(法規(guī)庫),由淺入深地全面審閱文檔秽荤,以實現不同業(yè)務場景及其中任何文檔類型的審閱工作甜奄,如采購類合同柠横、銀行業(yè)零售貸款合同、民事判決贺嫂、債券募集說明書等(如圖2-17所示)滓鸠。智能組件使用Docker技術,部署輕便第喳、擴容方便糜俗,能快速完成平臺的搭建;系統(tǒng)既可獨立部署曲饱,也可以通過API調用的方式直接對接現有系統(tǒng)的業(yè)務悠抹,從而在最大程度上減少用戶在不同系統(tǒng)間的學習成本和障礙。智能語義分析組件能夠實現文本分類扩淀、文本審核楔敌、文本摘要、標簽提取驻谆、觀點提取和情感分析等文檔智能分析功能卵凑,針對不同的行業(yè)需求提供易用的自動化控件操作及API,支持更加豐富的使用場景胜臊。

12.jpg

圖2-17 智能RPA實現文本(財務報表勺卢、審計報告、招股說明書等)的智能抽取

由于各行業(yè)的業(yè)務場景都很復雜象对,企業(yè)在實現業(yè)務流程自動化升級的過程中需要面臨諸多挑戰(zhàn)黑忱,因此企業(yè)對RPA也提出了更高的要求。企業(yè)級智能RPA通過安全穩(wěn)定勒魔、高可用的平臺架構甫煞,完善易用的系統(tǒng)功能,實現了對企業(yè)結構化數據場景問題的高效處理冠绢。企業(yè)級智能RPA在深度融合人工智能技術之后抚吠,拓寬了機器人的非結構化數據處理場景,使得智能RPA軟件機器人在企業(yè)自動化升級過程中能夠發(fā)揮越來越重要的作用弟胀。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末埃跷,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子邮利,更是在濱河造成了極大的恐慌,老刑警劉巖垃帅,帶你破解...
    沈念sama閱讀 222,590評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件延届,死亡現場離奇詭異,居然都是意外死亡贸诚,警方通過查閱死者的電腦和手機方庭,發(fā)現死者居然都...
    沈念sama閱讀 95,157評論 3 399
  • 文/潘曉璐 我一進店門厕吉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人械念,你說我怎么就攤上這事头朱。” “怎么了龄减?”我有些...
    開封第一講書人閱讀 169,301評論 0 362
  • 文/不壞的土叔 我叫張陵项钮,是天一觀的道長。 經常有香客問我希停,道長烁巫,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,078評論 1 300
  • 正文 為了忘掉前任宠能,我火速辦了婚禮亚隙,結果婚禮上,老公的妹妹穿的比我還像新娘违崇。我一直安慰自己阿弃,他們只是感情好,可當我...
    茶點故事閱讀 69,082評論 6 398
  • 文/花漫 我一把揭開白布羞延。 她就那樣靜靜地躺著渣淳,像睡著了一般。 火紅的嫁衣襯著肌膚如雪肴楷。 梳的紋絲不亂的頭發(fā)上水由,一...
    開封第一講書人閱讀 52,682評論 1 312
  • 那天,我揣著相機與錄音赛蔫,去河邊找鬼砂客。 笑死,一個胖子當著我的面吹牛呵恢,可吹牛的內容都是我干的鞠值。 我是一名探鬼主播,決...
    沈念sama閱讀 41,155評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼渗钉,長吁一口氣:“原來是場噩夢啊……” “哼彤恶!你這毒婦竟也來了?” 一聲冷哼從身側響起鳄橘,我...
    開封第一講書人閱讀 40,098評論 0 277
  • 序言:老撾萬榮一對情侶失蹤声离,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后瘫怜,有當地人在樹林里發(fā)現了一具尸體术徊,經...
    沈念sama閱讀 46,638評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,701評論 3 342
  • 正文 我和宋清朗相戀三年鲸湃,在試婚紗的時候發(fā)現自己被綠了赠涮。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片子寓。...
    茶點故事閱讀 40,852評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖笋除,靈堂內的尸體忽然破棺而出斜友,到底是詐尸還是另有隱情,我是刑警寧澤垃它,帶...
    沈念sama閱讀 36,520評論 5 351
  • 正文 年R本政府宣布鲜屏,位于F島的核電站,受9級特大地震影響,放射性物質發(fā)生泄漏。R本人自食惡果不足惜倔韭,卻給世界環(huán)境...
    茶點故事閱讀 42,181評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望虹菲。 院中可真熱鬧,春花似錦掉瞳、人聲如沸毕源。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,674評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽霎褐。三九已至,卻和暖如春该镣,著一層夾襖步出監(jiān)牢的瞬間冻璃,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,788評論 1 274
  • 我被黑心中介騙來泰國打工损合, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留省艳,地道東北人。 一個月前我還...
    沈念sama閱讀 49,279評論 3 379
  • 正文 我出身青樓嫁审,卻偏偏與公主長得像跋炕,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子律适,可洞房花燭夜當晚...
    茶點故事閱讀 45,851評論 2 361