人工智能中RPA、NLP淀衣、OCR介紹

1昙读、NLP

自然語言處理( Natural Language Processing, NLP)是計算機科學領域與人工智能領域中的一個重要方向。主要研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法膨桥。自然語言處理是一門融語言學蛮浑、計算機唠叛、于一體的。因此沮稚,這一領域的研究將涉及自然語言艺沼,即人們日常使用的語言,所以它與語言學的研究有著密切的聯(lián)系蕴掏,但又有重要的區(qū)別障般。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現(xiàn)自然語言通信的計算機系統(tǒng)盛杰,特別是其中的軟件系統(tǒng)挽荡。因而它是計算機科學的一部分。主要是在文本數(shù)據(jù)基礎之上做各種應用即供,比如文本挖掘定拟、搜索推薦等,主要產品是文本智能化處理軟件系統(tǒng)募狂,能夠幫助客戶完成文檔智能審閱、推薦角雷、搜索祸穷、客戶意見洞察等工作。

2勺三、RPA

RPA(機器人流程自動化)是近兩年較為火熱的話題雷滚,它通過模仿最終用戶在電腦的手動操作方式,提供了另一種方式來使最終用戶手動操作流程自動化吗坚。簡單來說祈远,這是一項橫向的、貼近業(yè)務流的技術商源,用于自動化處理重復车份、規(guī)則明確、并且需要人類切換不同系統(tǒng)來完成的工作牡彻。具體到產品形態(tài)扫沼,則是自動化軟件,模擬人類的交互完成重復性事務庄吼。

舉個例子缎除,如果一個分析師每天需要關注一家上市公司的數(shù)據(jù),每天要在同一個網站扒數(shù)據(jù)总寻,并填到表內器罐,那么?RPA 機器人就可以自動完成獲取數(shù)據(jù)、填表渐行、導出等工作轰坊。

傳統(tǒng)?RPA 產品由開發(fā)平臺铸董、控制中心、終端機器人組成衰倦。RPA 已推出銀行袒炉、財稅、政務樊零、保險我磁、證券基金等數(shù)十種不同崗位的機器人員工。在售后工單處理驻襟、商業(yè)案例報告生成夺艰、供應商準入核實、智慧政務行政審批沉衣、金融文檔的抽取驗查和填寫等場景中已開展工作郁副。

3、OCR

OCR (Optical Character Recognition豌习,光學字符識別)是指電子設備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符存谎,通過檢測暗、亮的模式確定其形狀肥隆,然后用字符識別方法將形狀翻譯成計算機數(shù)據(jù)的過程既荚。

針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件栋艳,并通過識別軟件將圖像中的文字轉換成文本格式恰聘,供文字處理軟件進一步編輯加工的技術。衡量一個OCR系統(tǒng)性能好壞的主要指標有:拒識率吸占、誤識率晴叨、識別速度、產品的穩(wěn)定性矾屯、易用性等兼蕊。在多數(shù)組織的智能自動化流程業(yè)務中,OCR是應用最多的人工智能技術之一件蚕。OCR與RPA的結合可以將組織中超過70%的無紙化業(yè)務實現(xiàn)自動化遍略,其效率將是人工的5倍以上。

4骤坐、RPA绪杏、NLP、OCR應用情況:

RPA目前被企業(yè)應用最多的還是實現(xiàn)業(yè)務流程自動化纽绍,在降低風險方面RPA同樣發(fā)揮了重要作用蕾久。許多世界頂級銀行已把RPA部署在運營部門,以幫助他們打擊那些涉及欺詐拌夏、洗錢等行為的用戶僧著。金融機構利用RPA幫助識別這些進行非法活動的客戶履因,很好的為企業(yè)避免了重大損失。

RPA平臺通過收集并定期分析客戶數(shù)據(jù)盹愚,包括:媒體新聞栅迄、搜索引擎、征信系統(tǒng)等執(zhí)行定期數(shù)據(jù)調查皆怕,以查出該用戶是否有觸犯法規(guī)的行為毅舆。例如在一家加拿大銀行的案例中,該公司在部署RPA后的六個月內不僅節(jié)省了750,000美元的成本愈腾,還查處了120個非法客戶成功避免了那些潛在的危險行為憋活。

NLP主要幫助企業(yè)分析客戶需求研究表明虱黄,大多數(shù)致電企業(yè)售前客服咨詢業(yè)務時悦即,都無法及時獲得所需要的幫助。當這種情況發(fā)生較多時橱乱,很多人都會產生厭倦感辜梳。NLP技術通過檢測語音通話,可以實時測量客戶的語調以及他們在對話中使用的單詞頻率等泳叠,有效的防止人們挫敗感的產生作瞄。一些呼叫中心使用NLP來提供實時的反饋信息。例如:如果一個人打電話給旅游公司并多次提到“度假”析二,那么NLP就會識別這一詞匯進行統(tǒng)計粉洼。當會話結束后节预,NLP會把會話中出現(xiàn)頻率最多的幾個詞統(tǒng)計出來叶摄,方便客服人員進行服務分析。

相對于NLP和RPA來說安拟,目前OCR應該是應用層面最廣的技術蛤吓。在具體的落地應用層面,目前卡證識別糠赦、票據(jù)識別等標準場景文字識別已經相對成熟会傲,手寫文字識別在教育、物流等行業(yè)的應用也在不斷擴大拙泽。復雜動態(tài)場景下的OCR技術和應用成為近兩年的熱門研究方向淌山,比如在無人駕駛、機器人等場景利用OCR對視場中出現(xiàn)的文字進行識別等顾瞻。目前OCR識別技術泼疑,主要劃分為8項:

1)證件識別:主要識別證件信息,用于金融荷荤、銀行退渗、保險移稳、汽車等領域(互聯(lián)網),支持大陸二代身份證会油、臺灣身份證个粱、香港身份證、澳門身份證翻翩、護照都许、行駛證、駕駛證体斩、港澳臺通行證等20余種證件識別梭稚,支持Android/iOS、Windows/Linux 32/64位主流操作系統(tǒng)絮吵,目前有證件采集儀弧烤、護照閱讀器、門禁考勤機蹬敲、人行通道閘機暇昂、人證一體掃描儀、移動端證件識別SDK等產品中應用該項技術伴嗡;

2)銀行卡識別:主要識別銀行卡卡號急波,用于移動支付綁卡,提升APP用戶體驗(互聯(lián)網)瘪校。支持國內各個銀行的信用卡澄暮、儲蓄卡,包括平面字體和凹凸字體銀行卡阱扬、橫版和豎版銀行卡泣懊、標準和異形銀行卡等識別,支持Android/iOS麻惶、Windows/Linux 32/64位主流操作系統(tǒng)馍刮,目前有移動端銀行卡識別SDK、云端銀行卡識別API窃蹋;

3)車牌識別:主要識別車牌號碼卡啰、車牌顏色、車牌類型警没、車標匈辱、車身顏色等車輛特征信息,用于移動警務杀迹,占道停車亡脸,停車場管理,車險等領域(互聯(lián)網)中,支持識別普通藍牌梗掰、黃牌(雙層)嵌言、軍牌(雙)、武警牌(雙)及穗、警牌摧茴、農用車牌、大使館車牌等各種常見規(guī)格的汽車號牌埂陆,支持Android/iOS苛白、Windows/Linux 32/64位主流操作系統(tǒng),目前有PC端車牌識別SDK焚虱、移動端車牌識別SDK购裙、車牌識別抓拍相機、DSP嵌入式車牌識別鹃栽、車型識別躏率、車位檢測等產品應用了該項技術;

4)名片識別:主要識別名片內容民鼓,用于移動展業(yè)薇芝、CRM客戶管理系統(tǒng)等領域(互聯(lián)網),支持橫版丰嘉、豎版名片識別夯到,及其他板式的各種名片,還支持多語種名片識別饮亏,支持Android/iOS耍贾、Windows/Linux 32/64位主流操作系統(tǒng),目前有移動端名片識別路幸、云端名片識別API荐开;

5)營業(yè)執(zhí)照識別:主要識別營業(yè)執(zhí)照信息(統(tǒng)一社會信用代碼、公司名稱劝赔、二維碼等)誓焦,用于需要代替人工提取營業(yè)執(zhí)照信息的領域(互聯(lián)網)胆敞,支持Android/iOS着帽、Windows/Linux 32/64位主流操作系統(tǒng),目前有移動端營業(yè)執(zhí)照識別SDK移层、文字識別SDK仍翰、掃描識別硬;

6)汽車VIN碼識別:主要識別車架號(汽車VIN碼)观话,用于汽車管理予借、汽車服務、二手車交易、租車等領域(互聯(lián)網)灵迫,支持Android/iOS秦叛、Windows/Linux 32/64位主流操作系統(tǒng),目前有移動端汽車VIN碼識別SDK瀑粥;

7)票據(jù)類OCR識別:主要識別增值稅發(fā)票等不同格式的票據(jù)內容挣跋,用于財務管理、汽車狞换、銀行避咆、金融等領域(互聯(lián)網),基于模板機制修噪,針對不同的票據(jù)查库,定制不同的識別要素,支持Android/iOS黄琼、Windows/Linux 32/64位主流操作系統(tǒng)樊销,目前有表票識別掃描儀、表票識別SDK脏款;

8)文檔文字OCR識別:主要識別文檔文字现柠,用于圖書館,報社等針對圖書弛矛、報紙够吩、雜志等文本類,需要把這些紙質文檔進行電子化的領域(互聯(lián)網)丈氓,需借助在掃描儀周循,目前有移動端的文檔OCR識別、文檔識別掃描儀万俗,隨著掃描儀分辨率的提升湾笛,OCR軟件也在不斷升級,掃描儀廠商現(xiàn)在已經把專業(yè)的OCR軟件搭配自己生產的掃描儀出售闰歪。

5嚎研、RPA、NLP库倘、OCR三者關系

目前临扮,大部分的RPA工具都是基于微軟.NET Framework的WorkflowFoundation開發(fā),整合OCR教翩、NLP等AI技術杆勇,能夠以弱耦合,即不改變現(xiàn)有軟件系統(tǒng)部署的形式跨系統(tǒng)執(zhí)行饱亿,且實現(xiàn)零出錯率蚜退。在技術上闰靴,RPA早已不是單個企業(yè)的定制化功能,事實上已經生長成融合AI技術钻注、系統(tǒng)級的跨軟硬件蚂且、多賬戶的服務。

在NLP的產品體系中幅恋,OCR是關于文檔膘掰、文件處理的基礎步驟,是無法回避和繞開的佳遣。

對任何一個業(yè)務流程自動化而言识埋,都需要串接許多技術模塊。RPA+OCR+NLP的融合零渐,減少了業(yè)務流程中人機交互窒舟、人工復核的環(huán)節(jié),可以更全面的滿足企業(yè)自動化的需求诵盼。

下面這個實例主要幫助大家更好的理解RPA與OCR的工作原理:

1惠豺、用戶收到一封帶有圖片的電子郵件。

2风宁、RPA自動閱讀電子郵件洁墙。

3、對圖片進行分類并選擇模板戒财。

4热监、通過OCR對分類的圖片進行數(shù)據(jù)識別和提取。

5饮寞、RPA接收OCR轉化后的結構化數(shù)據(jù)孝扛。

6、進行數(shù)據(jù)校審確認幽崩。

7苦始、自動將結構化數(shù)據(jù)放置或錄入到指定位置。

8慌申、存儲所有結構化數(shù)據(jù)陌选,并向用戶發(fā)送一封通知郵件,確認所有工作完畢蹄溉。

目前全球的RPA廠商正在通過與不同的人工智能技術相結合咨油,來提升競爭力贏得市場。而OCR在頻率类缤、業(yè)務范圍臼勉、以及對業(yè)務影響上都領先于其他技術邻吭。通過OCR來處理那些非結構化業(yè)務餐弱,也使得RPA的自動化范圍可以擴展到更多的領域中。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市膏蚓,隨后出現(xiàn)的幾起案子瓢谢,更是在濱河造成了極大的恐慌,老刑警劉巖驮瞧,帶你破解...
    沈念sama閱讀 222,590評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件氓扛,死亡現(xiàn)場離奇詭異,居然都是意外死亡论笔,警方通過查閱死者的電腦和手機采郎,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,157評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來狂魔,“玉大人蒜埋,你說我怎么就攤上這事∽羁” “怎么了整份?”我有些...
    開封第一講書人閱讀 169,301評論 0 362
  • 文/不壞的土叔 我叫張陵,是天一觀的道長籽孙。 經常有香客問我烈评,道長,這世上最難降的妖魔是什么犯建? 我笑而不...
    開封第一講書人閱讀 60,078評論 1 300
  • 正文 為了忘掉前任讲冠,我火速辦了婚禮,結果婚禮上适瓦,老公的妹妹穿的比我還像新娘沟启。我一直安慰自己,他們只是感情好犹菇,可當我...
    茶點故事閱讀 69,082評論 6 398
  • 文/花漫 我一把揭開白布德迹。 她就那樣靜靜地躺著,像睡著了一般揭芍。 火紅的嫁衣襯著肌膚如雪胳搞。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,682評論 1 312
  • 那天称杨,我揣著相機與錄音肌毅,去河邊找鬼。 笑死姑原,一個胖子當著我的面吹牛悬而,可吹牛的內容都是我干的。 我是一名探鬼主播锭汛,決...
    沈念sama閱讀 41,155評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼笨奠,長吁一口氣:“原來是場噩夢啊……” “哼袭蝗!你這毒婦竟也來了?” 一聲冷哼從身側響起般婆,我...
    開封第一講書人閱讀 40,098評論 0 277
  • 序言:老撾萬榮一對情侶失蹤到腥,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后蔚袍,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體乡范,經...
    沈念sama閱讀 46,638評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,701評論 3 342
  • 正文 我和宋清朗相戀三年啤咽,在試婚紗的時候發(fā)現(xiàn)自己被綠了晋辆。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,852評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡宇整,死狀恐怖栈拖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情没陡,我是刑警寧澤涩哟,帶...
    沈念sama閱讀 36,520評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站盼玄,受9級特大地震影響贴彼,放射性物質發(fā)生泄漏。R本人自食惡果不足惜埃儿,卻給世界環(huán)境...
    茶點故事閱讀 42,181評論 3 335
  • 文/蒙蒙 一器仗、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧童番,春花似錦精钮、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,674評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至幼东,卻和暖如春臂容,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背根蟹。 一陣腳步聲響...
    開封第一講書人閱讀 33,788評論 1 274
  • 我被黑心中介騙來泰國打工脓杉, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人简逮。 一個月前我還...
    沈念sama閱讀 49,279評論 3 379
  • 正文 我出身青樓球散,卻偏偏與公主長得像,于是被迫代替她去往敵國和親散庶。 傳聞我的和親對象是個殘疾皇子蕉堰,可洞房花燭夜當晚...
    茶點故事閱讀 45,851評論 2 361

推薦閱讀更多精彩內容

  • 1.人工智能組件功能 企業(yè)級RPA的人工智能組件(AI Component)主要用于提供以圖像處理凌净、文本識別、語義...
    從此以后你牽我手閱讀 1,015評論 0 0
  • 夜鶯2517閱讀 127,728評論 1 9
  • 版本:ios 1.2.1 亮點: 1.app角標可以實時更新天氣溫度或選擇空氣質量嘁灯,建議處女座就不要選了泻蚊,不然老想...
    我就是沉沉閱讀 6,905評論 1 6
  • 我是黑夜里大雨紛飛的人啊 1 “又到一年六月躲舌,有人笑有人哭丑婿,有人歡樂有人憂愁,有人驚喜有人失落没卸,有的覺得收獲滿滿有...
    陌忘宇閱讀 8,547評論 28 53
  • 兔子雖然是枚小碩 但學校的碩士四人寢不夠 就被分到了博士樓里 兩人一間 在學校的最西邊 靠山 兔子的室友身體不好 ...
    待業(yè)的兔子閱讀 2,611評論 2 9