1昙读、NLP
自然語言處理( Natural Language Processing, NLP)是計算機科學領域與人工智能領域中的一個重要方向。主要研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法膨桥。自然語言處理是一門融語言學蛮浑、計算機唠叛、于一體的。因此沮稚,這一領域的研究將涉及自然語言艺沼,即人們日常使用的語言,所以它與語言學的研究有著密切的聯(lián)系蕴掏,但又有重要的區(qū)別障般。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現(xiàn)自然語言通信的計算機系統(tǒng)盛杰,特別是其中的軟件系統(tǒng)挽荡。因而它是計算機科學的一部分。主要是在文本數(shù)據(jù)基礎之上做各種應用即供,比如文本挖掘定拟、搜索推薦等,主要產品是文本智能化處理軟件系統(tǒng)募狂,能夠幫助客戶完成文檔智能審閱、推薦角雷、搜索祸穷、客戶意見洞察等工作。
2勺三、RPA
RPA(機器人流程自動化)是近兩年較為火熱的話題雷滚,它通過模仿最終用戶在電腦的手動操作方式,提供了另一種方式來使最終用戶手動操作流程自動化吗坚。簡單來說祈远,這是一項橫向的、貼近業(yè)務流的技術商源,用于自動化處理重復车份、規(guī)則明確、并且需要人類切換不同系統(tǒng)來完成的工作牡彻。具體到產品形態(tài)扫沼,則是自動化軟件,模擬人類的交互完成重復性事務庄吼。
舉個例子缎除,如果一個分析師每天需要關注一家上市公司的數(shù)據(jù),每天要在同一個網站扒數(shù)據(jù)总寻,并填到表內器罐,那么?RPA 機器人就可以自動完成獲取數(shù)據(jù)、填表渐行、導出等工作轰坊。
傳統(tǒng)?RPA 產品由開發(fā)平臺铸董、控制中心、終端機器人組成衰倦。RPA 已推出銀行袒炉、財稅、政務樊零、保險我磁、證券基金等數(shù)十種不同崗位的機器人員工。在售后工單處理驻襟、商業(yè)案例報告生成夺艰、供應商準入核實、智慧政務行政審批沉衣、金融文檔的抽取驗查和填寫等場景中已開展工作郁副。
3、OCR
OCR (Optical Character Recognition豌习,光學字符識別)是指電子設備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符存谎,通過檢測暗、亮的模式確定其形狀肥隆,然后用字符識別方法將形狀翻譯成計算機數(shù)據(jù)的過程既荚。
針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件栋艳,并通過識別軟件將圖像中的文字轉換成文本格式恰聘,供文字處理軟件進一步編輯加工的技術。衡量一個OCR系統(tǒng)性能好壞的主要指標有:拒識率吸占、誤識率晴叨、識別速度、產品的穩(wěn)定性矾屯、易用性等兼蕊。在多數(shù)組織的智能自動化流程業(yè)務中,OCR是應用最多的人工智能技術之一件蚕。OCR與RPA的結合可以將組織中超過70%的無紙化業(yè)務實現(xiàn)自動化遍略,其效率將是人工的5倍以上。
4骤坐、RPA绪杏、NLP、OCR應用情況:
RPA目前被企業(yè)應用最多的還是實現(xiàn)業(yè)務流程自動化纽绍,在降低風險方面RPA同樣發(fā)揮了重要作用蕾久。許多世界頂級銀行已把RPA部署在運營部門,以幫助他們打擊那些涉及欺詐拌夏、洗錢等行為的用戶僧著。金融機構利用RPA幫助識別這些進行非法活動的客戶履因,很好的為企業(yè)避免了重大損失。
RPA平臺通過收集并定期分析客戶數(shù)據(jù)盹愚,包括:媒體新聞栅迄、搜索引擎、征信系統(tǒng)等執(zhí)行定期數(shù)據(jù)調查皆怕,以查出該用戶是否有觸犯法規(guī)的行為毅舆。例如在一家加拿大銀行的案例中,該公司在部署RPA后的六個月內不僅節(jié)省了750,000美元的成本愈腾,還查處了120個非法客戶成功避免了那些潛在的危險行為憋活。
NLP主要幫助企業(yè)分析客戶需求,研究表明虱黄,大多數(shù)致電企業(yè)售前客服咨詢業(yè)務時悦即,都無法及時獲得所需要的幫助。當這種情況發(fā)生較多時橱乱,很多人都會產生厭倦感辜梳。NLP技術通過檢測語音通話,可以實時測量客戶的語調以及他們在對話中使用的單詞頻率等泳叠,有效的防止人們挫敗感的產生作瞄。一些呼叫中心使用NLP來提供實時的反饋信息。例如:如果一個人打電話給旅游公司并多次提到“度假”析二,那么NLP就會識別這一詞匯進行統(tǒng)計粉洼。當會話結束后节预,NLP會把會話中出現(xiàn)頻率最多的幾個詞統(tǒng)計出來叶摄,方便客服人員進行服務分析。
相對于NLP和RPA來說安拟,目前OCR應該是應用層面最廣的技術蛤吓。在具體的落地應用層面,目前卡證識別糠赦、票據(jù)識別等標準場景文字識別已經相對成熟会傲,手寫文字識別在教育、物流等行業(yè)的應用也在不斷擴大拙泽。復雜動態(tài)場景下的OCR技術和應用成為近兩年的熱門研究方向淌山,比如在無人駕駛、機器人等場景利用OCR對視場中出現(xiàn)的文字進行識別等顾瞻。目前OCR識別技術泼疑,主要劃分為8項:
1)證件識別:主要識別證件信息,用于金融荷荤、銀行退渗、保險移稳、汽車等領域(互聯(lián)網),支持大陸二代身份證会油、臺灣身份證个粱、香港身份證、澳門身份證翻翩、護照都许、行駛證、駕駛證体斩、港澳臺通行證等20余種證件識別梭稚,支持Android/iOS、Windows/Linux 32/64位主流操作系統(tǒng)絮吵,目前有證件采集儀弧烤、護照閱讀器、門禁考勤機蹬敲、人行通道閘機暇昂、人證一體掃描儀、移動端證件識別SDK等產品中應用該項技術伴嗡;
2)銀行卡識別:主要識別銀行卡卡號急波,用于移動支付綁卡,提升APP用戶體驗(互聯(lián)網)瘪校。支持國內各個銀行的信用卡澄暮、儲蓄卡,包括平面字體和凹凸字體銀行卡阱扬、橫版和豎版銀行卡泣懊、標準和異形銀行卡等識別,支持Android/iOS麻惶、Windows/Linux 32/64位主流操作系統(tǒng)馍刮,目前有移動端銀行卡識別SDK、云端銀行卡識別API窃蹋;
3)車牌識別:主要識別車牌號碼卡啰、車牌顏色、車牌類型警没、車標匈辱、車身顏色等車輛特征信息,用于移動警務杀迹,占道停車亡脸,停車場管理,車險等領域(互聯(lián)網)中,支持識別普通藍牌梗掰、黃牌(雙層)嵌言、軍牌(雙)、武警牌(雙)及穗、警牌摧茴、農用車牌、大使館車牌等各種常見規(guī)格的汽車號牌埂陆,支持Android/iOS苛白、Windows/Linux 32/64位主流操作系統(tǒng),目前有PC端車牌識別SDK焚虱、移動端車牌識別SDK购裙、車牌識別抓拍相機、DSP嵌入式車牌識別鹃栽、車型識別躏率、車位檢測等產品應用了該項技術;
4)名片識別:主要識別名片內容民鼓,用于移動展業(yè)薇芝、CRM客戶管理系統(tǒng)等領域(互聯(lián)網),支持橫版丰嘉、豎版名片識別夯到,及其他板式的各種名片,還支持多語種名片識別饮亏,支持Android/iOS耍贾、Windows/Linux 32/64位主流操作系統(tǒng),目前有移動端名片識別路幸、云端名片識別API荐开;
5)營業(yè)執(zhí)照識別:主要識別營業(yè)執(zhí)照信息(統(tǒng)一社會信用代碼、公司名稱劝赔、二維碼等)誓焦,用于需要代替人工提取營業(yè)執(zhí)照信息的領域(互聯(lián)網)胆敞,支持Android/iOS着帽、Windows/Linux 32/64位主流操作系統(tǒng),目前有移動端營業(yè)執(zhí)照識別SDK移层、文字識別SDK仍翰、掃描識別硬;
6)汽車VIN碼識別:主要識別車架號(汽車VIN碼)观话,用于汽車管理予借、汽車服務、二手車交易、租車等領域(互聯(lián)網)灵迫,支持Android/iOS秦叛、Windows/Linux 32/64位主流操作系統(tǒng),目前有移動端汽車VIN碼識別SDK瀑粥;
7)票據(jù)類OCR識別:主要識別增值稅發(fā)票等不同格式的票據(jù)內容挣跋,用于財務管理、汽車狞换、銀行避咆、金融等領域(互聯(lián)網),基于模板機制修噪,針對不同的票據(jù)查库,定制不同的識別要素,支持Android/iOS黄琼、Windows/Linux 32/64位主流操作系統(tǒng)樊销,目前有表票識別掃描儀、表票識別SDK脏款;
8)文檔文字OCR識別:主要識別文檔文字现柠,用于圖書館,報社等針對圖書弛矛、報紙够吩、雜志等文本類,需要把這些紙質文檔進行電子化的領域(互聯(lián)網)丈氓,需借助在掃描儀周循,目前有移動端的文檔OCR識別、文檔識別掃描儀万俗,隨著掃描儀分辨率的提升湾笛,OCR軟件也在不斷升級,掃描儀廠商現(xiàn)在已經把專業(yè)的OCR軟件搭配自己生產的掃描儀出售闰歪。
5嚎研、RPA、NLP库倘、OCR三者關系
目前临扮,大部分的RPA工具都是基于微軟.NET Framework的WorkflowFoundation開發(fā),整合OCR教翩、NLP等AI技術杆勇,能夠以弱耦合,即不改變現(xiàn)有軟件系統(tǒng)部署的形式跨系統(tǒng)執(zhí)行饱亿,且實現(xiàn)零出錯率蚜退。在技術上闰靴,RPA早已不是單個企業(yè)的定制化功能,事實上已經生長成融合AI技術钻注、系統(tǒng)級的跨軟硬件蚂且、多賬戶的服務。
在NLP的產品體系中幅恋,OCR是關于文檔膘掰、文件處理的基礎步驟,是無法回避和繞開的佳遣。
對任何一個業(yè)務流程自動化而言识埋,都需要串接許多技術模塊。RPA+OCR+NLP的融合零渐,減少了業(yè)務流程中人機交互窒舟、人工復核的環(huán)節(jié),可以更全面的滿足企業(yè)自動化的需求诵盼。
下面這個實例主要幫助大家更好的理解RPA與OCR的工作原理:
1惠豺、用戶收到一封帶有圖片的電子郵件。
2风宁、RPA自動閱讀電子郵件洁墙。
3、對圖片進行分類并選擇模板戒财。
4热监、通過OCR對分類的圖片進行數(shù)據(jù)識別和提取。
5饮寞、RPA接收OCR轉化后的結構化數(shù)據(jù)孝扛。
6、進行數(shù)據(jù)校審確認幽崩。
7苦始、自動將結構化數(shù)據(jù)放置或錄入到指定位置。
8慌申、存儲所有結構化數(shù)據(jù)陌选,并向用戶發(fā)送一封通知郵件,確認所有工作完畢蹄溉。
目前全球的RPA廠商正在通過與不同的人工智能技術相結合咨油,來提升競爭力贏得市場。而OCR在頻率类缤、業(yè)務范圍臼勉、以及對業(yè)務影響上都領先于其他技術邻吭。通過OCR來處理那些非結構化業(yè)務餐弱,也使得RPA的自動化范圍可以擴展到更多的領域中。