2021-03-17 kaggle上Speech-Transformer項(xiàng)目問題2

根據(jù)前面的工程，首先編譯了kaldi工具盅称，利用speech_data（即aishell1數(shù)據(jù)集肩祥，只是刪除了一層wav目錄），完成了stage 0缩膝、1混狠、2步驟，主要是數(shù)據(jù)準(zhǔn)備與fbank特征提取，將kaldi與Speech-Transformer目錄均作為kaggle/working輸出，再作為新工程的數(shù)據(jù)導(dǎo)入蜡感，修改目錄名稱為fbank_done

訓(xùn)練集與工程數(shù)據(jù)

方法一只copy部分文件胎挎，其余用軟鏈接

1仲吏、復(fù)制speech-transformer-project/Speech-Transformer工程目錄

# 復(fù)制speech-transformer-project/Speech-Transformer工程目錄
!cp -r /kaggle/input/speech-transformer-project/Speech-Transformer /kaggle/working/

2、切換到egs/aishell目錄下，替換steps utils目錄（此處用軟鏈接則無法修改內(nèi)部文件的執(zhí)行權(quán)限）

#  切換到egs/aishell目錄下，替換steps utils目錄
%cd /kaggle/working/Speech-Transformer/egs/aishell
!rm -R steps utils
!cp -r /kaggle/input/fbank-done/kaldi/egs/wsj/s5/steps /kaggle/working/Speech-Transformer/egs/aishell/
!cp -r /kaggle/input/fbank-done/kaldi/egs/wsj/s5/utils /kaggle/working/Speech-Transformer/egs/aishell/
!ls -l

3掖蛤、將fbank_done里的dump data目錄設(shè)置軟鏈接到working目錄

%cd /kaggle/working/Speech-Transformer/egs/aishell
!ln -s /kaggle/input/fbank-done/Speech-Transformer/egs/aishell/dump /kaggle/working/Speech-Transformer/egs/aishell/dump
!ln -s /kaggle/input/fbank-done/Speech-Transformer/egs/aishell/data /kaggle/working/Speech-Transformer/egs/aishell/data
!ls -l

4、切換到utils目錄下井厌，生成run.pl軟鏈接（之前工程輸出數(shù)據(jù)保存過程中會自動刪除軟鏈接）

%cd /kaggle/working/Speech-Transformer/egs/aishell/utils
!ln -s /kaggle/working/Speech-Transformer/egs/aishell/utils/parallel/run.pl /kaggle/working/Speech-Transformer/egs/aishell/utils/
# !ls -l
%cd /kaggle/working/Speech-Transformer/egs/aishell
!ls -l

5蚓庭、創(chuàng)建 lib 目錄，里面設(shè)置所有src目錄下的共享庫.so的軟鏈接

!mkdir -p /kaggle/working/kaldi/src/lib
!ln -s /kaggle/input/fbank-done/kaldi/src/*/*.so /kaggle/working/kaldi/src/lib/

6仅仆、copy config目錄器赞，內(nèi)部包含后面需調(diào)用的文件

!mkdir -p /kaggle/working/kaldi/tools
!cp -r /kaggle/input/fbank-done/kaldi/tools/config /kaggle/working/kaldi/tools/
!ls -l /kaggle/working/kaldi/tools/

7、安裝kaldi_io

!pip install kaldi_io

8墓拜、開放可執(zhí)行文件的權(quán)限

!chmod +x /kaggle/working/* -R

9港柜、追加指定py文件搜索路徑（不同路徑下py文件可以被import）

import sys
sys.path.append(r'/kaggle/working/Speech-Transformer/src/bin')
sys.path.append(r'/kaggle/working/Speech-Transformer/src/data')
sys.path.append(r'/kaggle/working//Speech-Transformer/src/solver')
sys.path.append(r'/kaggle/working//Speech-Transformer/src/transformer')
sys.path.append(r'/kaggle/working//Speech-Transformer/src/utils')

10、直接利用%run命令運(yùn)行train.py腳本進(jìn)行訓(xùn)練咳榜，log文件不保存潘懊，而是直接打印到輸出窗口

# 以%開頭的代碼為魔法函數(shù)，其中：
# %run  調(diào)用外部python腳本贿衍，直接運(yùn)行出結(jié)果
# %load 加載本地文件到notebook，然后點(diǎn)擊運(yùn)行
%cd /kaggle/working/Speech-Transformer/egs/aishell
%run /kaggle/working/Speech-Transformer/src/bin/train.py \
--train-json dump/train/deltafalse/data.json \
--valid-json dump/dev/deltafalse/data.json \
--dict data/lang_1char/train_chars.txt \
--LFR_m 7 --LFR_n 6 --d_input 80 \
--n_layers_enc 6 --n_layers_dec 6 --n_head 8 --d_k 64 --d_v 64 \
--d_model 256 --d_word_vec 256 --d_inner 1024 \
--dropout 0.1 --pe_maxlen 5000 --tgt_emb_prj_weight_sharing 1 --label_smoothing 0.1 \
--epochs 25 --shuffle 1 \
--batch-size 64 --batch_frames 0 \
--maxlen-in 800 --maxlen-out 150 \
--num-workers 2 --k 0.2 --warmup_steps 300 \
--save-folder exp/train_result \
--checkpoint 0 --continue-from "" \
--print-freq 10 --visdom 0 --visdom_lr 0 --visdom_epoch 0 --visdom-id "Transformer Training"

11救恨、直接執(zhí)行run.sh腳本贸辈，與上面 %run train.py 任選其一運(yùn)行即可。（不輸出到窗口，而是保存到train.log文件）

# 執(zhí)行run.sh
%cd /kaggle/working/Speech-Transformer/egs/aishell
# !./run.sh --checkpoint 0 --stage 0 --visdom 0 --visdom_id "train test" --visdom_lr 0  --visdom_epoch 0 --LFR_m 1 --LFR_n 1 --batch_frames 1500 --batch-size 16 --print-freq 100 --num-workers 4 
# !./run.sh --checkpoint 0 --stage 1 --visdom 0 --visdom_id "train test" --visdom_lr 0  --visdom_epoch 0 --LFR_m 1 --LFR_n 1 --batch_frames 1500 --batch-size 16 --print-freq 100 --num-workers 4 
# !./run.sh --checkpoint 0 --stage 2 --visdom 0 --visdom_id "train test" --visdom_lr 0  --visdom_epoch 0 --LFR_m 1 --LFR_n 1 --batch_frames 1500 --batch-size 16 --print-freq 100 --num-workers 4 
# !./run.sh --checkpoint 0 --stage 3  --LFR_m 7 --LFR_n 6 --batch_frames 0 --batch-size 32 --print-freq 10 --num-workers 4 --visdom 0 --visdom_id "train test" --visdom_lr 0  --visdom_epoch 0
!./run.sh --stage 3 --LFR_m 7 --LFR_n 6 \
--d_input 80 --n_layers_enc 6 --n_head 8 --d_k 64 --d_v 64 \
--d_model 256 --d_inner 1024 --dropout 0.1 --pe_maxlen 5000 \
--d_word_vec 256 --n_layers_dec 6 --tgt_emb_prj_weight_sharing 1 \
--label_smoothing 0.1 \
--epochs 25 --shuffle 1 \
--batch-size 128 --batch_frames 0 \
--maxlen-in 800 --maxlen-out 150 \
--num-workers 2 --k 0.2 --warmup_steps 300 \
--checkpoint 0 --continue-from "" --print-freq 10 \
--visdom 0 --visdom_lr 0 --visdom_epoch 0 --visdom-id "Transformer Training"

通過執(zhí)行%run train.py擎淤，可以在Console查看訓(xùn)練情況奢啥，及時(shí)調(diào)整訓(xùn)練策略

%run train.py時(shí)成功啟動訓(xùn)練

直接執(zhí)行run.sh時(shí)，無法實(shí)時(shí)看到訓(xùn)練情況嘴拢，所以Create Save & Run All Version桩盲，讓其在后臺執(zhí)行。（記得要選擇Run All with GPU席吴，過程中仍然進(jìn)行GPU使用時(shí)間計(jì)時(shí)赌结，每周大約30+小時(shí)）

直接執(zhí)行run.sh時(shí)創(chuàng)建Save并且Run All Version

私有數(shù)據(jù)占用的空間，似乎是去掉了與平臺公開數(shù)據(jù)集重復(fù)的數(shù)據(jù)后的最終容量孝冒？

kaggle賬戶詳情中可以查看

最后編輯于：2021.03.17 16:27:56

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末柬姚，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子庄涡，更是在濱河造成了極大的恐慌量承，老刑警劉巖，帶你破解...
沈念sama閱讀 217,657評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件穴店，死亡現(xiàn)場離奇詭異撕捍，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)泣洞，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,889評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門忧风，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人斜棚，你說我怎么就攤上這事阀蒂。” “怎么了弟蚀？”我有些...
開封第一講書人閱讀 164,057評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵蚤霞，是天一觀的道長。經(jīng)常有香客問我义钉，道長昧绣，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,509評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任捶闸，我火速辦了婚禮夜畴，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘删壮。我一直安慰自己贪绘，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,562評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布央碟。她就那樣靜靜地躺著税灌，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上菱涤，一...
開封第一講書人閱讀 51,443評論 1贊 302
城市分裂傳說
那天苞也，我揣著相機(jī)與錄音，去河邊找鬼粘秆。笑死如迟，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的攻走。我是一名探鬼主播殷勘，決...
沈念sama閱讀 40,251評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼陋气！你這毒婦竟也來了劳吠？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,129評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤巩趁，失蹤者是張志新（化名）和其女友劉穎痒玩，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體议慰，經(jīng)...
沈念sama閱讀 45,561評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡蠢古，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,779評論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了别凹。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片草讶。...
茶點(diǎn)故事閱讀 39,902評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖炉菲，靈堂內(nèi)的尸體忽然破棺而出堕战，到底是詐尸還是另有隱情，我是刑警寧澤拍霜，帶...
沈念sama閱讀 35,621評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布嘱丢，位于F島的核電站，受9級特大地震影響祠饺，放射性物質(zhì)發(fā)生泄漏越驻。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,220評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一道偷、第九天我趴在偏房一處隱蔽的房頂上張望缀旁。院中可真熱鬧，春花似錦勺鸦、人聲如沸并巍。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,838評論 0贊 22
一樁弒父案换途，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽懊渡。三九已至嘶窄，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間距贷，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,971評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工吻谋，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留忠蝗，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,025評論 2贊 370
代替公主和親
正文我出身青樓漓拾，卻偏偏與公主長得像阁最，于是被迫代替她去往敵國和親。傳聞我的和親對象是個(gè)殘疾皇子骇两，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,843評論 2贊 354

2021-03-17 kaggle上Speech-Transformer項(xiàng)目問題2

方法一 只copy部分文件胎挎，其余用軟鏈接

推薦閱讀更多精彩內(nèi)容

方法一只copy部分文件胎挎，其余用軟鏈接