![240](https://cdn2.jianshu.io/assets/default_avatar/14-0651acff782e7a18653d7530d6b27661.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
Python有許多可以讀寫常見的HTML和XML格式數(shù)據(jù)的庫赊时,包括lxml薄霜、Beautiful Soup和html5lib讶隐。lxml的速度比較快...
JSON(JavaScript Object Notation的簡稱)已經(jīng)成為通過HTTP請求在Web瀏覽器和其他應(yīng)用程序之間發(fā)送數(shù)據(jù)的標準格式...
大部分存儲在磁盤上的表格型數(shù)據(jù)都能用pandas.read_table進行加載伞广。然而婶博,有時還是需要做一些手工處理榔昔。由于接收到含有畸形行的文件而使...
pandas提供了一些用于將表格型數(shù)據(jù)讀取為DataFrame對象的函數(shù)蜈项。表6-1對它們進行了總結(jié)聘殖,其中read_csv和read_table可...
還有一類方法可以從一維Series的值中抽取信息〖橄伲看下面的例子: 第一個函數(shù)是unique餐禁,它可以得到Series中的唯一值數(shù)組: 返回的唯一值...
有些匯總統(tǒng)計(如相關(guān)系數(shù)和協(xié)方差)是通過參數(shù)對計算出來的。我們來看幾個DataFrame洋机,它們的數(shù)據(jù)來自Yahoo!Finance的股票價格和成...
pandas對象擁有一組常用的數(shù)學(xué)和統(tǒng)計方法坠宴。它們大部分都屬于約簡和匯總統(tǒng)計,用于從Series中提取單個值(如sum或mean)或從DataF...
根據(jù)條件對數(shù)據(jù)集排序(sorting)也是一種重要的內(nèi)置運算绷旗,要對行或列索引進行排序(按字典順序)喜鼓,可使用sort_index方法,它將返回一個...
NumPy的ufuncs(元素級數(shù)組方法)也可用于操作pandas對象: 另一個常見的操作時衔肢,將函數(shù)應(yīng)用到由各列或行所形成的一維數(shù)組上庄岖。Data...