偏統(tǒng)計(jì)理論知識(shí) 1. 撲克牌54張畏梆,平均分成2份闲擦,求這2份都有2張A的概率腺律。 M表示兩個(gè)牌堆各有2個(gè)A的情況:M=4(25!25!)N表示兩個(gè)牌堆完全隨機(jī)的情況:N=27!2...
![240](https://cdn2.jianshu.io/assets/default_avatar/1-04bbeead395d74921af6a4e8214b4f61.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
偏統(tǒng)計(jì)理論知識(shí) 1. 撲克牌54張畏梆,平均分成2份闲擦,求這2份都有2張A的概率腺律。 M表示兩個(gè)牌堆各有2個(gè)A的情況:M=4(25!25!)N表示兩個(gè)牌堆完全隨機(jī)的情況:N=27!2...
數(shù)據(jù)分析框架 海盜指標(biāo) AARRR 獲取用戶(Acquisition) 提高活躍度(Activation) 提高留存率(Retention) 獲取營(yíng)收(Revenue) 自傳...
1.查詢多列數(shù)據(jù)的最大值 CASE WHEN 方式 轉(zhuǎn)換行格式后使用MAX函數(shù) 使用GREATEST函數(shù) 2.排序 跳過(guò)位次排序 連續(xù)排序 分組排序
注:MySQL8 中支持窗口函數(shù)(window functions) 在WHERE子句中引用別名列:將含有別名的列放入內(nèi)嵌視圖 在SELECT語(yǔ)句里使用條件邏輯:CASE表達(dá)...
操作環(huán)境(ubuntu16.04) 啟動(dòng)服務(wù) ./zkServer.sh start 客戶端連接 ./zkCli.sh -server 127.0.0.1:2181 創(chuàng)建節(jié)點(diǎn)...
優(yōu)化數(shù)據(jù)訪問(wèn) 是否向數(shù)據(jù)庫(kù)請(qǐng)求了不需要的數(shù)據(jù) MySQL是否在掃描額外的記錄 MySQL使用三種方式應(yīng)用WHERE條件 索引中使用WHERE 在存儲(chǔ)引擎層完成 使用索引覆蓋掃...
索引 存儲(chǔ)引擎用于快速找到記錄的一種數(shù)據(jù)結(jié)構(gòu)(索引的基本功能)在MySQL中,存儲(chǔ)引擎先在索引中找對(duì)對(duì)應(yīng)值缚陷,根據(jù)匹配的索引記錄找到對(duì)應(yīng)的數(shù)據(jù)行。 索引類型 B-Tree索引1...
創(chuàng)建數(shù)據(jù)庫(kù) use DATABASE_NAME 查看所有數(shù)據(jù)庫(kù) show dbs 插入數(shù)據(jù) db.DATABASE_NAME.insert({"name":"value"})...
HBase數(shù)據(jù)模型 表 行(由行鍵標(biāo)識(shí)) 列族 列限定符 單元格 時(shí)間戳 HBase功能組件 庫(kù)函數(shù):鏈接到每個(gè)客戶端 Master主服務(wù)器:負(fù)責(zé)管理和維護(hù)HBase表的分區(qū)...
HDFS最核心的概念 “塊” 默認(rèn)64MB 支持面向大規(guī)模數(shù)據(jù)存儲(chǔ) 降低分布式節(jié)點(diǎn)的尋址開(kāi)銷 HDFS兩大組件 名稱節(jié)點(diǎn) (管家)FsImage(維護(hù)文件系統(tǒng)樹(shù)及元數(shù)據(jù))...
Hadoop Hadoop 是一個(gè)開(kāi)源的驶兜,可運(yùn)行于大規(guī)模集群上的分布式計(jì)算平臺(tái) Hadoop 兩大核心 HDFS MapReduce Hadoop 項(xiàng)目結(jié)構(gòu)
大數(shù)據(jù)的概念 4V 數(shù)據(jù)量大(Volumn) 數(shù)據(jù)類型繁多(Variety) 結(jié)構(gòu)化數(shù)據(jù)(10%) 非結(jié)構(gòu)化數(shù)據(jù)(90%) 處理速度快(Velocity) 價(jià)值密度低(Val...
shell shell是一個(gè)程序扼仲,接受從鍵盤(pán)輸入的命令,然后把命令傳遞給操作系統(tǒng)去執(zhí)行抄淑。 一些命令 ls 列出目錄內(nèi)容 ls -l 長(zhǎng)格式輸出 file 確定文件類...