《算法》
搖擺序列
- 當有連續(xù)遞增或遞減的子序列時撕蔼,此時一定不是搖擺序列豁鲤,只能從這個連續(xù)遞增或遞減的子序列中取某一個或多個值時,才能使得序列為搖擺序列鲸沮,為此選擇遞增或遞減子序列中的哪個值便成為了目標琳骡。
- 貪心策略:選擇其中的什么數(shù)才能使搖擺序列最長?選擇遞增或遞減序列的首尾元素讼溺。
移除k個數(shù)字
貪心策略:移除數(shù)組中的哪個數(shù)字才能使得剩下的字符組成的數(shù)值最腥瞻尽?《機器學習》
TF-IDF
-
TF-詞頻
-
IDF-逆文檔概率
-
TF-IDF計算
樸素貝葉斯算法
- 為什么說樸素
整個形式化過程肾胯,只做最簡單,最原始的假設(shè)耘纱。 -
條件概率公式
上式的含義:在B發(fā)生的條件下A發(fā)生的概率敬肚,其中P(AB)為聯(lián)合概率,即A和B同時發(fā)生的概率
- 全概率公式
若事件B1束析,B2艳馒,…構(gòu)成一個完備事件組且都有正概率,則對任意一個事件A有如下公式:
-
貝葉斯公式
由圖5和圖6兩個公式可得员寇,貝葉斯公式如下:
《機器學習相關(guān)庫的使用》
pandas庫的使用
- pandas讀取文件弄慰,將數(shù)據(jù)加載為DataFrame格式
pd.read_table()
pd.read_csv()
...... - DataFrame格式數(shù)據(jù)的常用操作
data.head() # 查看頭上的元素
data.列名或data["列名"] # 獲取Series,代表某一列的所有數(shù)據(jù)
data.shape # 查看data的行和列數(shù)
data["列1"] + data["列2"] # 合并兩個列蝶锋,并且可以給data添加新的列
data["新列名"] = 數(shù)據(jù)
data.dtypes # 查看每一列的數(shù)據(jù)類型