官方文檔https://numpy.org/doc/stable/reference/generated/numpy.genfromtxt.html
參考http://www.360doc.com/content/19/0719/08/7669533_849694998.shtml
numpy.genfromtxt(fname, dtype=<class'float'>, comments='#', delimiter=None, skip_header=0, skip_footer=0, converters=None, missing_values=None, filling_values=None, usecols=None, names=None, excludelist=None, deletechars="!#$%&'()*+, -./:;<=>?@[\\]^{|}~", replace_space='_', autostrip=False, case_sensitive=True, defaultfmt='f%i', unpack=None, usemask=False, loose=True, invalid_raise=True, max_rows=None, encoding='bytes', *, like=None)
從文本文件加載數(shù)據(jù)梆砸,并按指定處理缺失值。 第一個(gè)skip_header 行之后的每一行在分隔符處被分割,并且指定注釋字符之后的字符被注釋。
參數(shù):
fname:文件、str餐曼、pathlib.Path、str 列表、生成器 要讀取的文件杨耙、文件名、列表或生成器飘痛。如果文件擴(kuò)展名為 gz 或 bz2珊膜,則首先解壓縮文件。請注意宣脉,生成器必須返回字節(jié)字符串车柠。列表中的字符串或由生成器生成的字符串被視為行。
dtype:可選塑猖。結(jié)果數(shù)組的數(shù)據(jù)類型竹祷。我們從文件讀取的字符串序列要轉(zhuǎn)換為其他類型數(shù)據(jù)時(shí)需設(shè)置dtype參數(shù)。
1)默認(rèn)是float類型羊苟。
2)可設(shè)置為序列類型塑陵,如dtype=(int, float, float);
3)元組序列,如dtype=[('a',int),('b',float)];
4)設(shè)置為dtype=None蜡励,則每個(gè)列的類型由自身數(shù)據(jù)決定令花,將參數(shù)設(shè)置成None效率較低,因?yàn)樗鼤?huì)從布爾值開始檢驗(yàn)凉倚,然后是整形浮點(diǎn)型復(fù)數(shù)最后是字符串兼都,直到滿足條件為止。
comments:是個(gè)字符串稽寒,可選扮碧,標(biāo)志著注釋開始的符號(hào)。默認(rèn)是“#”,任何字符出現(xiàn)在注釋標(biāo)記之后會(huì)被忽略慎王。
delimiter: 指定分隔符蚓土,將行分割為列,也可以按給定的字符數(shù)對寬度進(jìn)行分割赖淤。分割固定寬度的文件,列的寬度被定義為一個(gè)給定的字符數(shù)北戏。在這種情況下,我們需要將分隔符設(shè)置成一個(gè)整數(shù)(如果所有的列有相同的大小)或一個(gè)整數(shù)序列(如果列可以有不同的大小)。
skip_header和skip_footer:?一個(gè)文件的頁眉會(huì)阻礙文件的處理漫蛔。在這種情況下,我們需要使用skip_header可選參數(shù)嗜愈。這個(gè)參數(shù)的值必須是一個(gè)整數(shù),跳過文件開頭的對應(yīng)的行數(shù),然后再執(zhí)行任何其他操作。同樣的,我們通過使用skip_footer屬性和n的值可以跳過文件的最后n行莽龟。默認(rèn)值都為0.