一躏嚎、使用xlrd
1、導(dǎo)入模塊
import xlrd
2、讀取excel表格汰具,里面包含多個子表
workbook = xlrd.open_workbook('D:/medic/check_分析.xlsx')
3、根絕子表名稱獲得表格數(shù)據(jù)
拿到第一個子表名稱
sheet1_name = workbook.sheet_names()[0]
print(sheet1_name)
根據(jù)第一個表格名稱獲得表格數(shù)據(jù)
sheet1 = workbook.sheet_by_name(sheet1_name)
print(sheet1.name,sheet1.nrows,sheet1.ncols)
拿到指定行和指定列的數(shù)據(jù)
# 獲得一行
rows = sheet1.row_values(0)
# print(rows)
print(len(rows)) # 539
# 獲得一列
cols = sheet1.col_values(0)
print(len(cols))# 3066
統(tǒng)計表格中每列空格數(shù)據(jù)
for i in range(len(rows)):
cols = sheet1.col_values(i)
count_null = cols.count('')
# if 2500<count_null:
# print(i,count_null,sheet1.row_values(0)[i])
print(i,count_null,sheet1.row_values(0)[i])
二菱魔、使用pandas
1留荔、導(dǎo)入模塊
import pandas as pd
import numpy as np
2、加載表格
header=0 表示第0行為表頭
data = pd.read_excel('D:/medic/check_f_foraccess.xlsx',header=0,nrows=17, usecols=3)
加載表格中名叫Sheet1的子表
data = pd.read_excel('D:/medic/check_f_foraccess.xlsx',sheet_name='Sheet1')
打印表格信息
data.shape
(3065, 22)
打印第0行表頭
data[0:0]
打印某類的前10行
data['病歷號'][0:10]