Python中文轉(zhuǎn)拼音代碼(支持全拼和首字母縮寫(xiě))

本文的代碼稽煤,從https://github.com/cleverdeng/pinyin.py升級(jí)得來(lái)富玷,針對(duì)原文的代碼败潦,做了以下升級(jí):

1啃擦、可以傳入?yún)?shù)firstcode:如果為true格带,只取漢子的第一個(gè)拼音字母撤缴;如果為false刹枉,則會(huì)輸出全部拼音;

2屈呕、修復(fù):如果為英文字母微宝,則直接輸出;

3凉袱、修復(fù):如果分隔符為空字符串芥吟,仍然能正常輸出;

4专甩、升級(jí):可以指定詞典的文件路徑

代碼很簡(jiǎn)單钟鸵,直接讀取了一個(gè)詞典(字符和英文的映射),然后挨個(gè)替換中文中的拼音即可涤躲;

#!/usr/bin/env python

# -*- coding:utf-8 -*-

"""

原版代碼:https://github.com/cleverdeng/pinyin.py

新增功能:

????1棺耍、可以傳入?yún)?shù)firstcode:如果為true,只取漢子的第一個(gè)拼音字母种樱;如果為false蒙袍,則會(huì)輸出全部拼音;

????2嫩挤、修復(fù):如果為英文字母害幅,則直接輸出;

????3岂昭、修復(fù):如果分隔符為空字符串以现,仍然能正常輸出;

????4约啊、升級(jí):可以指定詞典的文件路徑

"""

__version__?=?'0.9'

__all__?=?["PinYin"]

import?os.path

class?PinYin(object):

def?__init__(self):

self.word_dict?=?{}

def?load_word(self,?dict_file):

self.dict_file?=?dict_file

if?not?os.path.exists(self.dict_file):

raise?IOError("NotFoundFile")

with?file(self.dict_file)?as?f_obj:

for?f_line?in?f_obj.readlines():

try:

line?=?f_line.split('????')

self.word_dict[line[0]]?=?line[1]

except:

line?=?f_line.split('?? ')

self.word_dict[line[0]]?=?line[1]

def?hanzi2pinyin(self,?string="",?firstcode=False):

result?=?[]

if?not?isinstance(string,?unicode):

string?=?string.decode("utf-8")

for?char?in?string:

key?=?'%X'?%?ord(char)

value?=?self.word_dict.get(key,?char)

outpinyin?=?str(value).split()[0][:-1].lower()

if?not?outpinyin:

outpinyin?=?char

if?firstcode:

result.append(outpinyin[0])

else:

result.append(outpinyin)

return?result

def?hanzi2pinyin_split(self,?string="",?split="",?firstcode=False):

"""提取中文的拼音

????????@param string:要提取的中文

????????@param split:分隔符

????????@param firstcode: 提取的是全拼還是首字母邑遏?如果為true表示提取首字母,默認(rèn)為False提取全拼??

????????"""

result?=?self.hanzi2pinyin(string=string,?firstcode=firstcode)

return?split.join(result)

if?__name__?==?"__main__":

test?=?PinYin()

test.load_word('word.data')

string?=?"Java程序性能優(yōu)化-讓你的Java程序更快更穩(wěn)定"

print?"in: %s"?%?string

print?"out: %s"?%?str(test.hanzi2pinyin(string=string))

print?"out: %s"?%?test.hanzi2pinyin_split(string=string,?split="",?firstcode=True)

print?"out: %s"?%?test.hanzi2pinyin_split(string=string,?split="",?firstcode=False)


實(shí)例中main函數(shù)的代碼輸出結(jié)果

代碼使用方法:

如果需要其他的提取恰矩,可以修改一下代碼實(shí)現(xiàn)记盒;

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市外傅,隨后出現(xiàn)的幾起案子纪吮,更是在濱河造成了極大的恐慌,老刑警劉巖萎胰,帶你破解...
    沈念sama閱讀 222,183評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件碾盟,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡奥洼,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門晚胡,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)灵奖,“玉大人嚼沿,你說(shuō)我怎么就攤上這事〈苫迹” “怎么了骡尽?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,766評(píng)論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)擅编。 經(jīng)常有香客問(wèn)我攀细,道長(zhǎng),這世上最難降的妖魔是什么爱态? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,854評(píng)論 1 299
  • 正文 為了忘掉前任谭贪,我火速辦了婚禮,結(jié)果婚禮上锦担,老公的妹妹穿的比我還像新娘俭识。我一直安慰自己,他們只是感情好洞渔,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,871評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布套媚。 她就那樣靜靜地躺著,像睡著了一般磁椒。 火紅的嫁衣襯著肌膚如雪堤瘤。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,457評(píng)論 1 311
  • 那天浆熔,我揣著相機(jī)與錄音本辐,去河邊找鬼。 笑死蘸拔,一個(gè)胖子當(dāng)著我的面吹牛师郑,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播调窍,決...
    沈念sama閱讀 40,999評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼宝冕,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了邓萨?” 一聲冷哼從身側(cè)響起地梨,我...
    開(kāi)封第一講書(shū)人閱讀 39,914評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎缔恳,沒(méi)想到半個(gè)月后宝剖,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,465評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡歉甚,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,543評(píng)論 3 342
  • 正文 我和宋清朗相戀三年万细,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片纸泄。...
    茶點(diǎn)故事閱讀 40,675評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡赖钞,死狀恐怖腰素,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情雪营,我是刑警寧澤弓千,帶...
    沈念sama閱讀 36,354評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站献起,受9級(jí)特大地震影響洋访,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜谴餐,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,029評(píng)論 3 335
  • 文/蒙蒙 一姻政、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧总寒,春花似錦扶歪、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,514評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至年枕,卻和暖如春炫欺,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背熏兄。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,616評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工品洛, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人摩桶。 一個(gè)月前我還...
    沈念sama閱讀 49,091評(píng)論 3 378
  • 正文 我出身青樓桥状,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親硝清。 傳聞我的和親對(duì)象是個(gè)殘疾皇子辅斟,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,685評(píng)論 2 360

推薦閱讀更多精彩內(nèi)容

  • 一、快捷鍵 ctr+b 執(zhí)行ctr+/ 單行注釋ctr+c ...
    o_8319閱讀 5,828評(píng)論 2 16
  • 一芦拿、Python簡(jiǎn)介和環(huán)境搭建以及pip的安裝 4課時(shí)實(shí)驗(yàn)課主要內(nèi)容 【Python簡(jiǎn)介】: Python 是一個(gè)...
    _小老虎_閱讀 5,750評(píng)論 0 10
  • 前言 最先接觸編程的知識(shí)是在大學(xué)里面蔗崎,大學(xué)里面學(xué)了一些基礎(chǔ)的知識(shí)酵幕,c語(yǔ)言,java語(yǔ)言缓苛,單片機(jī)的匯編語(yǔ)言等芳撒;大學(xué)畢...
    oceanfive閱讀 3,095評(píng)論 0 7
  • 主席說(shuō):集中力量消滅敵人。 人的精力有限,要把有限的精力笔刹,集中于一件事情一個(gè)問(wèn)題庐完,只有這樣才能把事情一件一件做好,...
    拼命掙錢的三十六畫(huà)生閱讀 607評(píng)論 0 0
  • 人總需要有一個(gè)目標(biāo)徘熔,才不至于活得那么狼狽,我想成為那些精英中的一員淆党,我想證明我自己酷师,所以我要讓自己變得更加優(yōu)秀。我...
    島嶼之南閱讀 181評(píng)論 0 0