用python檢測(cè)字符串是否包含非英文

背景

工作中經(jīng)常有些功能限制了只能輸入英文字符串坝辫,但是客戶或者銷售同事的文案來(lái)源比較多蔚出,有些是直接復(fù)制的其它渠道或者平臺(tái),會(huì)存在一些肉眼根本看不來(lái)的異常字符箩做,如果內(nèi)容較長(zhǎng)莽红,定位和查找就比較麻煩了。
因此結(jié)合之前幫助同事處理過(guò)的異常字符串,寫了個(gè)處理腳本安吁,方便后續(xù)同類問(wèn)題的處理醉蚁。

使用效果

ascii.gif

通過(guò)上述運(yùn)行輸出可以看到,字符中包含NBSP空格鬼店,這個(gè)大部分的輸入框會(huì)提示輸入非法网棍,但是肉眼很難發(fā)現(xiàn),由于NBSP一般是來(lái)源于網(wǎng)頁(yè)文本的復(fù)制粘貼妇智,不影響文本釋意滥玷,這里我直接用英文空格進(jìn)行替換。

存在異澄±猓空格, 執(zhí)行替換處理惑畴!

其它的標(biāo)點(diǎn)符號(hào),其實(shí)也是存在中文和英文長(zhǎng)的很像的情況航徙。但改了可能會(huì)影響文本的意思桨菜,這部分字符我們不直接替換,而是顯示其所在位置捉偏,讓人工可以快速定位到倒得,來(lái)進(jìn)行合理處理。

檢測(cè)數(shù)據(jù): Ni Digger這 Producto~ Eléct·rico ¥y Electrónico Douchekop, Doucheslang, Handdouche  Constru??o & Decora??o コンピュータ ??? 製品 ??????? ????????
異常字符:          這         ~   é  ·     ¥        ó                                                ??          ??  コンピュータ ??? 製品 ??????? ????????

最后處理完異常字符的每行數(shù)據(jù)夭禽,存到一個(gè)數(shù)組里霞掺,逐行輸出,方便人工進(jìn)行再次使用讹躯。

整形后的全部數(shù)據(jù):
Ni Digger這 Producto~ Eléct·rico ¥y Electrónico Douchekop, Doucheslang, Handdouche  Constru??o & Decora??o コンピュータ ??? 製品 ??????? ????????

完整代碼

def isEnglish(s):
  return s.isascii()

def loop_string(str):
  ascii_strs = []
  hasAscii = False
  print("檢測(cè)數(shù)據(jù):",str)
  for s in str:
    if not isEnglish(s):
      ascii_strs.append(s)
      hasAscii = True
    else:
      ascii_strs.append(" ")
  if hasAscii:
    print("異常字符:","".join(ascii_strs))

def format_data(data):
  print("==" * 50)
  new_data = []
  for str in data:
    if u'\xa0' in str:
      str = str.replace(u'\xa0', u' ')
      print("存在異称斜颍空格, 執(zhí)行替換處理!")
      new_data.append(str)
    loop_string(str)
    print("==" * 50)
  print("整形后的全部數(shù)據(jù):")
  for n in new_data:
    print(n)


if __name__ == '__main__':
  data = [
    "要檢測(cè)的字符串"
  ]
  format_data(data)

把文本粘貼到 要檢測(cè)的字符串 里運(yùn)行即可潮梯,如果有多個(gè)字符串骗灶,挨個(gè)往數(shù)組貼就可以了。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末秉馏,一起剝皮案震驚了整個(gè)濱河市耙旦,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌萝究,老刑警劉巖免都,帶你破解...
    沈念sama閱讀 218,122評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異帆竹,居然都是意外死亡绕娘,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門栽连,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)险领,“玉大人,你說(shuō)我怎么就攤上這事【钅埃” “怎么了挨下?”我有些...
    開(kāi)封第一講書人閱讀 164,491評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)下面。 經(jīng)常有香客問(wèn)我,道長(zhǎng)绩聘,這世上最難降的妖魔是什么沥割? 我笑而不...
    開(kāi)封第一講書人閱讀 58,636評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮凿菩,結(jié)果婚禮上机杜,老公的妹妹穿的比我還像新娘。我一直安慰自己衅谷,他們只是感情好椒拗,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著获黔,像睡著了一般蚀苛。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上玷氏,一...
    開(kāi)封第一講書人閱讀 51,541評(píng)論 1 305
  • 那天堵未,我揣著相機(jī)與錄音,去河邊找鬼盏触。 笑死渗蟹,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的赞辩。 我是一名探鬼主播雌芽,決...
    沈念sama閱讀 40,292評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼辨嗽!你這毒婦竟也來(lái)了世落?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 39,211評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤糟需,失蹤者是張志新(化名)和其女友劉穎岛心,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體篮灼,經(jīng)...
    沈念sama閱讀 45,655評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡忘古,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了诅诱。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片髓堪。...
    茶點(diǎn)故事閱讀 39,965評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出干旁,到底是詐尸還是另有隱情驶沼,我是刑警寧澤,帶...
    沈念sama閱讀 35,684評(píng)論 5 347
  • 正文 年R本政府宣布争群,位于F島的核電站回怜,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏换薄。R本人自食惡果不足惜玉雾,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望轻要。 院中可真熱鬧复旬,春花似錦、人聲如沸冲泥。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,894評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)凡恍。三九已至志秃,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間嚼酝,已是汗流浹背洽损。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,012評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留革半,地道東北人碑定。 一個(gè)月前我還...
    沈念sama閱讀 48,126評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像又官,于是被迫代替她去往敵國(guó)和親延刘。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容