1.訓(xùn)練數(shù)據(jù)一定要定義成utf-8格式,然后生成的model在測試數(shù)據(jù)為utf-8的情況下會出現(xiàn)錯誤银萍。
2.訓(xùn)練數(shù)據(jù)中不能有空字符变勇,如果有空字符,CRF++的命令行就會出現(xiàn)錯誤贴唇。
3.讀寫文件的時候一定要定義好是utf-8格式搀绣。
4.在命令行顯示中文字符的時候,一定要進(jìn)行chch65001更改編碼格式為utf-8戳气。
不要用powershell??
不要用powershell??
不要用powershell??
結(jié)果會亂碼!!!!
用cmd!!!!!!
用cmd!!!!!!
用cmd!!!!!!
用powershell的話先執(zhí)行命令 chch65001 改為utf-8編碼
推薦用cmder?https://cmder.net/? ?一個第三方的命令行工具? 在環(huán)境中添加默認(rèn)代碼頁?chch65001