1.人工智能組件功能
企業(yè)級RPA的人工智能組件(AI Component)主要用于提供以圖像處理妻率、文本識別谒亦、語義分析等為核心的人工智能技術,賦予RPA智能化數字員工更強大的業(yè)務技能和場景延展性。如果將傳統(tǒng)的RPA產品比喻成人的雙手魁淳,因為它能夠替代人工處理一些簡單的壕探、規(guī)律性的事務冈钦,那么融合了人工智能技術的RPA產品則相當于是擁有了人的眼睛和大腦,這就使得RPA軟件機器人能夠處理的場景和能力得到了大大的提升浩蓉。人工智能組件不僅能夠幫助用戶解決代填派继、數據遷移之類的業(yè)務,還能夠通過圖像處理捻艳、文本識別提供的“眼睛”的能力和語義分析提供的“大腦”的能力處理大量的紙質文檔驾窟,以及對文檔進行分析和研判。
2.智能圖像處理組件
傳統(tǒng)RPA的元素捕獲功能需要依靠系統(tǒng)或軟件提供的接口认轨,對目標元素進行識別或定位绅络,通過消息傳遞機制或鍵盤和鼠標操作完成一系列的操控動作。但元素捕獲能力的強弱在很大程度上取決于開發(fā)的接口嘁字,很多第三方的軟件或者非標準化的元素常常會無法捕獲恩急。
企業(yè)級智能RPA創(chuàng)新性地將計算機視覺技術與傳統(tǒng)元素捕獲功能相結合,以便更好地支持非標準化元素的定位與獲取纪蜒。計算機視覺是一項幫助計算機衷恭、軟件、機器人或其他設備獲取纯续、分析及處理圖片的技術随珠。智能RPA利用計算機視覺的模板匹配技術識別并定位目標元素,然后使用鍵盤和鼠標進行控制猬错。模板匹配技術需要兩幅圖像:一幅是原圖像窗看,在其中尋找與模板匹配的區(qū)域;一幅是模板倦炒,是用來與原圖像進行比照的圖像塊显沈。在檢測最匹配區(qū)域的過程中,模板在原圖像上進行滑動比較逢唤,即圖像塊一次移動一個像素(從左往右拉讯,從上往下)。每個位置都進行一次匹配度或相似度的計算智玻,最終找到模板與原圖像最匹配的位置遂唧。
通過創(chuàng)新性地整合計算機視覺技術,企業(yè)級智能RPA可以完全捕獲國產辦公軟件WPS吊奢、國產數據庫盖彭、Chrome纹烹、IE、Firefox召边、App铺呵、Email、Office隧熙、ERP片挂、SAP、Citrix等各類應用程序界面的非標準元素贞盯,完全避免了RPA在實施過程中部分非標準元素無法定位和捕獲的尷尬局面音念,極大地拓展了RPA的能力邊界。
3.智能文本識別組件
在許多行業(yè)的業(yè)務場景中都存在著將大量的影音文件躏敢、紙質文件的數據錄入電子系統(tǒng)的工作闷愤,傳統(tǒng)RPA一般無法直接處理掃描件等影印類型的數據資料。智能RPA能夠與基于光學字符識別(Optical Character Recognition件余,OCR)的智能文本識別技術相結合讥脐,實現對身份證、發(fā)票啼器、房產證旬渠、火車票、營業(yè)執(zhí)照等掃描件的高精度識別(如圖2-15端壳、圖2-16所示)告丢。光學字符識別是指利用電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗损谦、亮的模式確定其形狀芋齿,然后用字符識別的方法將形狀翻譯成計算機文字的過程。OCR技術具體來說就是成翩,針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件赦役,并通過識別軟件將圖像中的文字轉換成文本格式麻敌,供文字處理軟件進一步編輯加工。通過OCR技術掂摔,可以自動識別護照等證件上的信息术羔,從而能夠省去大量的人工錄入工作。
圖2-15 驗證碼等文件智能識別校驗
圖2-16 發(fā)票智能識別校驗
智能文本識別組件能夠實現高難度的文本識別乙漓,除基礎證件级历、證明、常用報表之外叭披,其還可以處理無邊框表格寥殖,對于手寫體識別也可以達到較高的準確率。智能文本識別組件使用了基于CTPN等先進算法的文本檢測網絡,能有效地區(qū)分文本與模糊圖片嚼贡,可以方便地處理各行各業(yè)的匯總文檔與報表熏纯,同時還可以便捷地處理爬蟲數據。當組件使用基于Mask-RCNN和Unet的表格檢測算法時粤策,可以通過大量的圖像處理算法構建無邊框表格的表格線樟澜,區(qū)分文本與表格的內容,有效解決無邊框表格處理這個業(yè)界難題叮盘。
智能文本識別組件使用基于CRNN等算法的文本識別網絡秩贰,能夠大幅度提升識別的準確率。除傳統(tǒng)類別的文本之外柔吼,該組件對污損印章毒费、模糊手寫與混合驗證碼的識別也能取得良好的效果。該組件支持全新類別的文檔定制化開發(fā)嚷堡,如建筑圖紙等類別蝗罗。智能圖像處理組件除SaaS部署方式之外,還支持私有化部署蝌戒,具體采用哪種部署方式可依據客戶的需求靈活調節(jié)串塑。
4.智能語義分析組件
經過OCR技術識別之后,智能RPA平臺可以將照片等圖片信息轉化為電子信息北苟,但是對于其中的關鍵信息還是沒有辦法處理桩匪,因此需要進一步使用NLP技術。NLP技術可用于對文檔的各個維度進行分析友鼻,自動提取出文檔中的關鍵內容傻昙,比如,從勞動合同中找到就業(yè)信息彩扔、崗位內容等相關的材料妆档,同時完成相關內容的自動填寫。智能語義分析組件基于NLP技術虫碉,結合深度學習贾惦、多模型融合、圖像處理等AI技術可以實現對文檔的深入理解和分析敦捧,從而最大限度地提高企業(yè)的工作效率须板、降低監(jiān)控風險。
智能語義分析組件基于海量文本語料庫兢卵、審核規(guī)則习瑰、外界知識庫(法規(guī)庫),由淺入深地全面審閱文檔秽荤,以實現不同業(yè)務場景及其中任何文檔類型的審閱工作甜奄,如采購類合同柠横、銀行業(yè)零售貸款合同、民事判決贺嫂、債券募集說明書等(如圖2-17所示)滓鸠。智能組件使用Docker技術,部署輕便第喳、擴容方便糜俗,能快速完成平臺的搭建;系統(tǒng)既可獨立部署曲饱,也可以通過API調用的方式直接對接現有系統(tǒng)的業(yè)務悠抹,從而在最大程度上減少用戶在不同系統(tǒng)間的學習成本和障礙。智能語義分析組件能夠實現文本分類扩淀、文本審核楔敌、文本摘要、標簽提取驻谆、觀點提取和情感分析等文檔智能分析功能卵凑,針對不同的行業(yè)需求提供易用的自動化控件操作及API,支持更加豐富的使用場景胜臊。
圖2-17 智能RPA實現文本(財務報表勺卢、審計報告、招股說明書等)的智能抽取
由于各行業(yè)的業(yè)務場景都很復雜象对,企業(yè)在實現業(yè)務流程自動化升級的過程中需要面臨諸多挑戰(zhàn)黑忱,因此企業(yè)對RPA也提出了更高的要求。企業(yè)級智能RPA通過安全穩(wěn)定勒魔、高可用的平臺架構甫煞,完善易用的系統(tǒng)功能,實現了對企業(yè)結構化數據場景問題的高效處理冠绢。企業(yè)級智能RPA在深度融合人工智能技術之后抚吠,拓寬了機器人的非結構化數據處理場景,使得智能RPA軟件機器人在企業(yè)自動化升級過程中能夠發(fā)揮越來越重要的作用弟胀。