240 發(fā)簡信
IP屬地:北京
  • 120
    十個基礎算法

    監(jiān)督學習對于有標簽的特定數(shù)據(jù)集(訓練集)是非常有效的缴挖,但是它需要對于其他的距離進行預測嘶窄。 無監(jiān)督學習對于在給定未標記的數(shù)據(jù)集(目標沒有提前指定)上發(fā)現(xiàn)潛在關系是非常有用的。 ...

  • 120
    大數(shù)據(jù)

    HDFS 分布式文件系統(tǒng) 按塊存儲支持大規(guī)模文件存儲簡化系統(tǒng)設計數(shù)據(jù)備份 名稱節(jié)點厚者,整個HDFS集群的管家因宇。FsImage和editlog通過shell命令葛作,從上述兩個地方最...

  • 120
    模型評價方法

    第五章 模型評價方法 5.1 模型的評價方法介紹 5.1.1~5 accuracy箭窜,precision,recall嘹狞,F(xiàn)1-score岂膳,ROC曲線 分別畫圖舉例,要說出應用場...

  • 120
    auc計算方法總結

    面試的時候回答的不清楚磅网,學習&總結如下谈截。參考link 1.ROC曲線 對于二值分類器,評價指標主要有precision涧偷,recall簸喂,F(xiàn)-score(綜合考慮precisio...

  • cf

    協(xié)同過濾推薦系統(tǒng)可以分為基于用戶的推薦和基于項目的推薦。 基本數(shù)據(jù)是用戶對項目的評分表嫂丙,預測稀疏矩陣中空缺項的值娘赴。越稀疏越難。 計算相似度:cosine余弦相似度correl...

  • @IT人故事會 嗯嗯跟啤,受教诽表。以后注意寫的詳細一些。

    詞向量模型

    詞向量 重點在于把符號數(shù)字化隅肥,nlp中最直觀的方法是one-hot representation竿奏,每個詞表示為一個向量,長度為詞表大小腥放,只有一個維度值為1.優(yōu)點在于泛啸,如果采用...

  • 情感分析

    步驟: 數(shù)據(jù)與輸出重排打散 bag-of-words詞袋模型詞袋模型 n-gram模型將文本里面的內容按照字節(jié)進行大小為N的滑動窗口操作,形成了長度是N的字節(jié)片段序列秃症。n-g...

  • 詞向量模型

    詞向量 重點在于把符號數(shù)字化候址,nlp中最直觀的方法是one-hot representation吕粹,每個詞表示為一個向量,長度為詞表大小岗仑,只有一個維度值為1.優(yōu)點在于匹耕,如果采用...

  • cross-validation

    一開始提出的是LOOCV方法:每次取出一個數(shù)據(jù)作為測試集的唯一元素,其他n-1個元素作為訓練集喲用于訓練模型和調參荠雕。經(jīng)過n個模型稳其,每次一個MSE(均方誤差),將他們取均值得到...

  • 面試復盤

    百度 一面 TCP協(xié)議C++里繼承的多態(tài) 概率題炸卑,6位數(shù)倒過來還是一樣的概率 從袋子里拿紅黑球 2xN的大方塊既鞠,用1x2和2x1填滿有多少種方法 找一個最長遞增子序列 判斷兩...

  • 120
    xgboost原理

    閱讀XGBoost 與 Boosted Tree 基學習器:CART 每個葉子節(jié)點上面有一個分數(shù) 不夠厲害,所以找一個更強的模型 tree ensemble 對每個樣本的預測...

  • tree

    二叉樹的遍歷 深度(縱向)優(yōu)先在Python中一般使用列表嘱蛋,廣度優(yōu)先(橫向)一般使用迭代# 617. Merge Two Binary Trees 235 Lowest Co...

  • 生成模型與判別模型

    生成模型與判別模型 判別方法:由數(shù)據(jù)直接學習決策函數(shù)Y=f(X)或者條件概率分布P(Y|X)作為預測的模型k近鄰,感知級浑槽,決策樹蒋失,支持向量機返帕,邏輯斯蒂回歸尋找差別 生成方法:...

  • XGBOOST

    背景 https://www.kaggle.com/c/talkingdata-adtracking-fraud-detection這次比賽主要是通過日志來抓手機點擊app的...

  • python machine learning學習筆記

    第二章 訓練機器學習分類算法 感知機perceptron 自適應線性神經(jīng)元adaptive linear neurons 對機器學習算法有直觀了解 使用pandas, Num...

  • 120
    DeepLearning學習筆記#Logistic Regression with a Neural Network mindset(1)

    概述 本文主要內容:如何利用Python的來實現(xiàn)Logistic函數(shù)篙挽。包括:初始化荆萤、計算代價函數(shù)和梯度、使用梯度下降算法進行優(yōu)化等并把他們整合成為一個函數(shù)铣卡。本文將通過訓練來判...

  • 120
    DeepLearning學習筆記#Building your Deep Neural Network: Step by Step(3)

    概述 本文介紹如何利用Python的來實現(xiàn)具有多個隱藏層的圖片分類問題链韭。通過這次建立的多層神經(jīng)網(wǎng)絡模型,可以將之前的貓分類問題的準確率提升到80%煮落。要點:1. 使用非線性映射...

  • 120
    DeepLearning學習筆記#Planar data classification with one hidden layer(2)

    概述 如何利用Python的來實現(xiàn)具有一個隱藏層的平面數(shù)據(jù)分類問題。前文蝉仇,創(chuàng)建的神經(jīng)網(wǎng)絡只有一個輸出層旋讹,沒有隱藏層。本文將創(chuàng)建單隱藏層的神經(jīng)網(wǎng)絡模型轿衔。 二分類單隱藏層的神經(jīng)網(wǎng)...

  • 120
    爬蟲入門之路漫漫(2):scrapy實例

    爬取某招標網(wǎng)。 首先是幾個基礎scrapy命令: 新建一個項目 scrapy startproject 項目名稱 爬 scrapy crawl 爬蟲名稱 代碼: item.p...

  • 爬蟲入門之路漫漫(1):scrapy

    items.py:定義需要獲取的內容字段害驹,類似于實體類鞭呕。Item是用來裝載抓取數(shù)據(jù)的容器,和Java里的實體類(Entity)比較像 pipelines.py:項目管道文件宛官,...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品