思路很簡單:從唐詩三百首中獲取最常使用的漢字,然后在這些漢字中拿出一些組成新“詩”。
看看出來了什么詩
空女寒國樂棍现,已照柳落聲。
自夫新同難旅挤,鼓一何看過。
百將多如物,小生云夕轉(zhuǎn)。
歌間下是露谎替,干聲已此劍。
聞看夜問此蹋辅,草仙還云商。
劍大愁老成挫掏,可茫松西晚侦另。
小伙伴看出什么名堂來了嗎?
看看代碼
import re
from collections import Counter
dic = []
data = open('tangshi.txt','r') #下載的唐詩三百首
for i in data.readlines():
dic.append(i.strip().replace(':','').replace('尉共,','').replace('褒傅。','').replace('?','').replace('袄友!','').replace('[','').replace(']','')) #去除一些不用的符號
word = ''.join(dic)
word_str = re.sub(r"(?<=\w)","",word) #把所有文字分開
word_list = list(word_str)
a = [v for v in word_list if not str(v).isdigit()] #刪除數(shù)字
c = Counter(a)
s = c.most_common(300) #取了前300個最常見的漢字
tangshi = []
for i in s:
tangshi.append(i[0])
import random
i = random.sample(tangshi,20) #從300個最常見的漢字中拿出20個
print(i[0]+i[1]+i[2]+i[3]+i[4]+'殿托,'+i[5]+i[6]+i[7]+i[8]+i[9]+'。'+'\n'+i[10]+i[11]+i[12]+i[13]+i[14]+'剧蚣,'+i[15]+i[16]+i[17]+i[18]+i[19]+'支竹。')
可以看出旋廷,這樣存在很多問題。
1礼搁、詩句沒有主題饶碘。讓人摸不到頭腦,可以考慮把相似風格的漢字歸類再生成
2馒吴、詩句不押韻扎运。可以考慮把對應(yīng)的押韻漢字組合起來再調(diào)用
你是否有更好的想法呢饮戳?或者你“寫”了那些有意思的詩詞呢豪治?
說出來一起交流吧!