KNN算法簡介 首先介紹一下KNN算法的幾個特點: KNN皱蹦,全稱K-Nearest Neighbor莉给,中文名為K近鄰 思想極度簡單弊决,最基礎(chǔ)的分類算法,非常適合入門 應(yīng)用數(shù)學(xué)知...
什么是機器學(xué)習(xí) 機器學(xué)習(xí)出現(xiàn)之前: 編寫算法規(guī)則碌宴,輸入計算機,機器執(zhí)行后輸出結(jié)果籍滴。 舉個栗子:垃圾郵件分辨 編寫規(guī)則定義什么是垃圾郵件酪夷,新郵件根據(jù)規(guī)則去判定是否為垃圾郵件。 ...
Hive自定義函數(shù)注冊 查詢引擎都自帶了一部分函數(shù)來幫助我們解決查詢過程當(dāng)中一些復(fù)雜的數(shù)據(jù)計算或者數(shù)據(jù)轉(zhuǎn)換操作酝润,但是有時候自帶的函數(shù)功能不能滿足業(yè)務(wù)的需要燎竖。這時候就需要我們自...
內(nèi)部表:普通表,相當(dāng)于mysql的物理表要销,對應(yīng)hdfs數(shù)據(jù)构回,刪除時同時刪除元數(shù)據(jù)和hdfs表數(shù)據(jù) 外部表:關(guān)鍵字external,指向已存在的hdfs數(shù)據(jù)疏咐,刪除時只刪除元數(shù)據(jù)...
Hive是一個構(gòu)建在Hadoop之上的數(shù)據(jù)倉庫軟件,它可以使已經(jīng)存儲的數(shù)據(jù)結(jié)構(gòu)化纤掸,它提供類似sql的查詢語句HiveQL對數(shù)據(jù)進(jìn)行分析處理。 Hive將HQL轉(zhuǎn)換為MapRe...
維度與指標(biāo) 指標(biāo)與維度最基本的作用是描述與衡量,維度與指標(biāo)往往成對出現(xiàn)酌壕,搭配使用掏愁。 無法衡量它歇由,就無法增長它。維度一般選取非數(shù)值字段果港,舉例如“性別”沦泌,“國家”,“產(chǎn)品類別”等...