最大似然估計(jì)是利用已知的樣本的結(jié)果,在使用某個(gè)模型的基礎(chǔ)上衙耕,反推最有可能導(dǎo)致這樣結(jié)果的模型參數(shù)值。 例子1:抽球 舉個(gè)通俗的例子:假設(shè)一個(gè)袋子裝有白球與紅球,比例未知狂男,現(xiàn)在抽...
最大似然估計(jì)是利用已知的樣本的結(jié)果,在使用某個(gè)模型的基礎(chǔ)上衙耕,反推最有可能導(dǎo)致這樣結(jié)果的模型參數(shù)值。 例子1:抽球 舉個(gè)通俗的例子:假設(shè)一個(gè)袋子裝有白球與紅球,比例未知狂男,現(xiàn)在抽...
Sentry 簡(jiǎn)介Apache Sentry是Cloudera公司發(fā)布的一個(gè)Hadoop開(kāi)源組件,2016年3月從Incubator畢業(yè)立哑,成為Apache頂級(jí)項(xiàng)目。Sentr...
Influxdb是由Golang 構(gòu)建的時(shí)序數(shù)據(jù)庫(kù)姻灶,由于由Go語(yǔ)言構(gòu)建使得其跨平臺(tái)部署相對(duì)方便铛绰。用戶只需下載其可執(zhí)行文件到相應(yīng)系統(tǒng)執(zhí)行即可。 核心概念 示例數(shù)據(jù)(解釋某些概念...
1. 簡(jiǎn)述 時(shí)間序列數(shù)據(jù):從定義上來(lái)說(shuō)产喉,就是一串按時(shí)間維度索引的數(shù)據(jù)捂掰。 時(shí)序數(shù)據(jù)庫(kù)(TSDB)特點(diǎn):持續(xù)高并發(fā)寫(xiě)入、無(wú)更新曾沈;數(shù)據(jù)壓縮存儲(chǔ)这嚣;低查詢延時(shí)。 常見(jiàn) TSDB:inf...
IOPS IOPS (Input/Output Per Second)即每秒的輸入輸出量(或讀寫(xiě)次數(shù))姐帚,是衡量磁盤(pán)性能的主要指標(biāo)之一。IOPS是指單位時(shí)間內(nèi)系統(tǒng)能處理的I/O...
Flink源碼分析系列文檔目錄 請(qǐng)點(diǎn)擊:Flink 源碼分析系列文檔目錄[http://www.reibang.com/p/d4a372809e3d] 背景 Unalign...
分布式計(jì)算的核心思想在沒(méi)有包裹業(yè)務(wù)之前并不復(fù)雜生棍,簡(jiǎn)單而言颤霎,如果有一個(gè)任務(wù)(可以是查詢,排序涂滴,搜索)可以被拆分為互不影響的若干個(gè)重復(fù)的小任務(wù)友酱,那么我們就可以使用多臺(tái)計(jì)算機(jī)并行的...
源頭 flink的checkpoint和savepoint用于恢復(fù)作業(yè)狀態(tài),在恢復(fù)作業(yè)時(shí)柔纵,如果存在多個(gè)checkpoint缔杉,將獲取最新的checkpoint來(lái)進(jìn)行恢復(fù),沒(méi)有c...
前面文章介紹了Flink的任務(wù)執(zhí)行流程搁料,每一個(gè)operator都會(huì)有對(duì)應(yīng)的Task去執(zhí)行或详,如果程序中使用了window的話,當(dāng)程序執(zhí)行到window的task時(shí)就會(huì)調(diào)用Win...
Calcite主要是做SQL解析选调、校驗(yàn)夹供、優(yōu)化等工作,比如Flink仁堪、Hive底層都是使用的calcite哮洽。本文內(nèi)容是基于Flink 1.12來(lái)講解。 首先從整體上對(duì)Calci...
Java 的類(lèi)實(shí)例一般在 JVM 堆上分配,而 Java 是通過(guò) JNI 調(diào)用 C 代碼來(lái)實(shí)現(xiàn) Socket 通信的瑰谜,那么 C 代碼在運(yùn)行過(guò)程中需要的內(nèi)存又是從哪里分配的呢欺冀?...
JDK1.4中新加入了NIO隐轩,引入了一種基于通道(Channel)和緩存區(qū)(Buffer)的I/O方式,它可以使用Native函數(shù)庫(kù)直接分配堆外內(nèi)存(native堆)渤早,然后通...