一宝冕、數(shù)據(jù)質(zhì)量分析
1. 了解數(shù)據(jù)集的大小維度及樣本各項記錄的含義
主要使用到的函數(shù)方法:
df.shape # 數(shù)據(jù)集的維度
df.columns # 數(shù)據(jù)集列名
df.info() # 數(shù)據(jù)集的各列的基本信息:列名行疏、數(shù)量智末、類型……
df.describe() # 對數(shù)據(jù)集進行基本的統(tǒng)計信息
df.head() # 數(shù)據(jù)集前幾行
df.tail() # 數(shù)據(jù)集最后幾行
2. 對數(shù)據(jù)集進行缺失值分析哨鸭、異常值分析
主要使用函數(shù):
df.isnull() # 查看是否為Null值
df.unique() # 查看非重復列值
二斩熊、數(shù)據(jù)特征和特征分布
1. 對三種漁船的軌跡進行可視化里逆,找到之間的區(qū)分性
2. 對三種漁船的速度进胯、方向兩個變量進行分析
1) 數(shù)據(jù)特征
可視化分析三種漁船的速度、方向原押,比較之間的異同點胁镐、相似性
2) 特征分布
用核密度圖顯示三種漁船在速度、方向上的分布情況