前言 繼續(xù)詳細(xì)介紹缺失值處理彤敛、異常值檢測荐吉、數(shù)據(jù)一致性處理。這是數(shù)據(jù)清洗的第一步菜谣,關(guān)鍵步驟衰伯。上一篇因為篇幅的原因砍的,只介紹了異常值檢測蹂喻,本文介紹數(shù)據(jù)一致性處理。 1开泽、重復(fù)值檢測與...
前言 繼續(xù)詳細(xì)介紹缺失值處理彤敛、異常值檢測荐吉、數(shù)據(jù)一致性處理。這是數(shù)據(jù)清洗的第一步菜谣,關(guān)鍵步驟衰伯。上一篇因為篇幅的原因砍的,只介紹了異常值檢測蹂喻,本文介紹數(shù)據(jù)一致性處理。 1开泽、重復(fù)值檢測與...
前言 繼續(xù)詳細(xì)介紹缺失值處理牡拇、異常值檢測、數(shù)據(jù)一致性處理穆律。這是數(shù)據(jù)清洗的第一步惠呼,關(guān)鍵步驟。上一篇因為篇幅的原因峦耘,只介紹了缺失值處理剔蹋,本文介紹異常值檢測。 1辅髓、異常值與離群點檢...
前言 本文詳細(xì)介紹缺失值處理泣崩、異常值檢測、數(shù)據(jù)一致性處理洛口。這是數(shù)據(jù)清洗的第一步矫付,關(guān)鍵步驟。 1绍弟、缺失值類型 缺失值可分為三種類型: 完全隨機缺失(MCAR):缺失完全隨機技即,與...
1、前言 筆者上篇介紹內(nèi)網(wǎng)與外網(wǎng)身笤,內(nèi)網(wǎng)穿透豹悬,即如何實現(xiàn)外網(wǎng)如何訪問內(nèi)網(wǎng)的服務(wù)器。我們開發(fā)同學(xué)經(jīng)常用到的場景在內(nèi)網(wǎng)的開發(fā)環(huán)境液荸,可以在本地/自己的筆記本上進(jìn)行開發(fā)瞻佛。那如何操作呢,...
1适刀、前言 數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘秤朗、算法工程師的必修課,對數(shù)據(jù)的前期處理可能會占用我們研發(fā)的大部分時間笔喉,它直接影響著模型的性能和可靠性取视。筆者將介紹數(shù)據(jù)預(yù)處理的各種方法,并給出代碼...
1折欠、前言 絕大數(shù)開發(fā)都依賴網(wǎng)絡(luò)來加載文件和數(shù)據(jù)。經(jīng)常需要從外網(wǎng)訪問內(nèi)網(wǎng)設(shè)備吼过,例如怨酝,遠(yuǎn)程調(diào)試內(nèi)網(wǎng)環(huán)境;內(nèi)網(wǎng)部署的應(yīng)用發(fā)布在外網(wǎng)那先;在外網(wǎng)訪問實驗室的高性能GPU的開發(fā)環(huán)境等等农猬。關(guān)...
Markdown是一種輕量級的標(biāo)記語言,它允許人們使用易讀易寫的純文本格式編寫文檔售淡,然后轉(zhuǎn)換成結(jié)構(gòu)化的HTML頁面斤葱。以下是一些常見的Markdown語法: 標(biāo)題:# 一級標(biāo)題...
構(gòu)建Agent的重要的一步是Function calling(函數(shù)調(diào)用),本文不使用任何langchain等框架或者coze等平臺揖闸,從0開始構(gòu)建一個可以調(diào)用function的...
本文重點介紹Agent與大模型的關(guān)系,基于大模型Agnet的4個核心能力汤纸。下篇文章介紹實操Agent-如何從0開始搭建function calling衩茸。 一、Agent與大模...
本文重點介紹Fastchat是什么贮泞,各個組件的作用和關(guān)系楞慈,如何使用Fastchat框架部署大模型。 Fastchat是什么啃擦? FastChat是一個用于訓(xùn)練囊蓝、部署和評估大模型...
一令蛉、背景 隨著人工智能技術(shù)的飛速發(fā)展聚霜,大模型(Large Language Models, LLMs)已成為自然語言處理領(lǐng)域的核心工具。這些模型以其強大的語言理解和生成能力,...
@枉凝眉233 周志華的 機器學(xué)習(xí) 入門必讀
信息論2(自信息蝎宇、信息熵弟劲、聯(lián)合熵、條件熵姥芥、交叉熵函卒、相對熵(KL散度)、互信息撇眯、最大互信息系數(shù))1报嵌、前言 ??在研究機器學(xué)習(xí)一些算法原理時,經(jīng)常會出現(xiàn)各種有關(guān)信息論的概念(自信息熊榛、互信息等)锚国,此前已分享過一篇文章,但是相對簡單了一些玄坦,本次將再進(jìn)一步分析各種相關(guān)概念血筑。 2...
1困曙、前言 ??在研究機器學(xué)習(xí)一些算法原理時表伦,經(jīng)常會出現(xiàn)各種有關(guān)信息論的概念(自信息、互信息等)慷丽,此前已分享過一篇文章蹦哼,但是相對簡單了一些,本次將再進(jìn)一步分析各種相關(guān)概念要糊。 2...
1纲熏、前言 ????xgboost是在gbdt基礎(chǔ)上進(jìn)行了升級,所以xgboost也是通過每次擬合上次的殘差(上次實際值與目標(biāo)值之差)锄俄,從而每次生成一棵樹(CART回歸樹)局劲,最...
1珊膜、前言 ??線性回歸在整個機器學(xué)習(xí)算法中相對比較簡單容握,但是在處理實際問題中宣脉,使用頻率還是比較高车柠。本文將對線性回歸做簡單介紹,最后利用通俗的講解來說明邏輯回歸于線性回歸的關(guān)系...
1、前言 ??對于分類任務(wù)竹祷,經(jīng)常會遇到類別不平衡問題(不通類別訓(xùn)練樣本數(shù)目差距較大)谈跛,本文將對該問題給出常見的解決方法。 2塑陵、常用解決方法 2.1 欠采樣(下采樣) ??欠采...
1感憾、前言 ????統(tǒng)計相關(guān)問題系列第三篇,上一篇點這里 2令花、常見名詞 標(biāo)準(zhǔn)取值:將一組數(shù)據(jù)中每個數(shù)減去均值之后除以標(biāo)準(zhǔn)差阻桅,從而轉(zhuǎn)換為z分?jǐn)?shù)。以標(biāo)準(zhǔn)差為單位表示的原始值與均值差...
1嫂沉、前言 ????統(tǒng)計相關(guān)問題系列第二篇,上一篇點這里 2扮碧、常見名詞 極差(range):一組數(shù)據(jù)中最大值與最小值之差趟章。 四分位差(IQR):一組數(shù)據(jù)中第75百分位數(shù)與第25...