在貝殼實(shí)習(xí)已經(jīng)95天了翰撑,之前參與規(guī)劃的中臺產(chǎn)品一期已經(jīng)上線,目前已經(jīng)進(jìn)入使用和二期迭代的階段,需要我們產(chǎn)品去體驗(yàn)使用先较,很重要的一環(huán)是利用正則表達(dá)式(Pattern)進(jìn)行規(guī)則配置掏击。
這方面我是完全小白卵皂,在mentor的講授,自我查找資料砚亭,練習(xí)寫Pattern的過程灯变,我和小伙伴一起沉淀出了“正則表達(dá)式(Pattern)的快速入門自學(xué)手冊”殴玛,征得mentor和小伙伴的同意,在這里分享給大家添祸。
一滚粟、正則表達(dá)式(Pattern)的定義
正則表達(dá)式,又稱規(guī)則表達(dá)式刃泌,通常被用來檢索坦刀、替換那些符合某個(gè)模式(規(guī)則)的文本。
正則表達(dá)式是對字符串操作的一種邏輯公式蔬咬,就是用事先定義好的一些特定字符鲤遥、及這些特定字符的組合,組成一個(gè)“規(guī)則字符串”林艘,這個(gè)“規(guī)則字符串”用來表達(dá)對字符串的一種過濾邏輯盖奈。
二、規(guī)則與模型的優(yōu)劣比較
正則表達(dá)式和機(jī)器學(xué)習(xí)模型都可用于匹配文本狐援,需要根據(jù)檢索文本的特性來決策使用哪一種方式來匹配钢坦,二者的比較如下:
有時(shí)候,二者也會同時(shí)應(yīng)用啥酱,規(guī)則用于保準(zhǔn)確率爹凹、模型用于保召回率。
三镶殷、正則表達(dá)式的應(yīng)用領(lǐng)域
智能對話:匹配用戶提問禾酱,然后給出符合邏輯的回答
文本檢測:檢索符合某些特征、規(guī)則的文本
推薦算法:如抖音推薦算法绘趋,首先會給用戶打上標(biāo)簽颤陶,然后將用戶的標(biāo)簽特征字符化,匹配對應(yīng)的推薦內(nèi)容
搜索:匹配用戶提問陷遮,再給出符合邏輯的搜索結(jié)果
殺毒:匹配病毒庫文件名滓走,從而識別病毒庫
四、正則表達(dá)式符號語法
(一)常用符號
注意:所有符號都必須是英文格式帽馋!
(二)全部符號
(二)全部符號
五搅方、正則表達(dá)式撰寫流程
搜集正樣本,總結(jié)其中的語法規(guī)則
根據(jù)總結(jié)的語法規(guī)則绽族,撰寫對應(yīng)的正則表達(dá)式
測試所寫的正則表達(dá)式是否準(zhǔn)確(這里分享一個(gè)自用正則表達(dá)式測試網(wǎng)站姨涡,可以很有效地檢查自己寫的Pattern是否正確?https://tool.oschina.net/regex/)
最后感謝mentor常超 | 人人都是產(chǎn)品經(jīng)理 (woshipm.com)的指導(dǎo),還有并肩作戰(zhàn)的小魚姐项秉,在我作為一名產(chǎn)品經(jīng)理成長路上的幫助绣溜。