概述 數(shù)據(jù)分層是數(shù)據(jù)倉庫設(shè)計中十分重要的一個環(huán)節(jié)溢吻,優(yōu)秀的分層設(shè)計能夠讓整個數(shù)據(jù)體系更易理解和使用铆铆。而目前網(wǎng)絡(luò)中大部分可以被檢索到相關(guān)文章只是簡單地提及數(shù)據(jù)分層的設(shè)計建车,或缺少明...
業(yè)務(wù)背景 Spark讀取文件時贱鄙,對于可切分的文件,會將文件切分為一系列 Split 姨谷,每個Split對應(yīng)一個Task逗宁。一般而言,Split的大小與HDFS的Block大小相當(dāng)...
作者: 康凱森 日期: 2018-04-17 分類:OLAP 1 系統(tǒng)架構(gòu) 1.1 What is Kylin 1.2 What is Doris 2 數(shù)據(jù)模型 2.1 Ky...
談到Spark內(nèi)存管理哼拔,估計大家都會想到:static memory manager,unified memory manager瓣颅,execution memory倦逐,stor...
Kudu 是一個基于 Raft 的分布式存儲系統(tǒng),它致力于融合低延遲寫入和高性能分析這兩種場景宫补,并且能很好的嵌入到 Hadoop 生態(tài)系統(tǒng)里面檬姥,跟其他系統(tǒng)譬如 Clouder...
本文首發(fā)于Gevin的博客 原文鏈接:Flask 入門指南 未經(jīng) Gevin 授權(quán)穿铆,禁止轉(zhuǎn)載 1. 初識Flask Flask 是一個微框架(Micro framework)...
安裝所需的依賴: 安裝python: 安裝python的virtualenv環(huán)境 安裝superset 可能遇到的問題 如果執(zhí)行fabmanager create-admin...
Druid單機版安裝及離線導(dǎo)入數(shù)據(jù) 1.概述 本文快速安裝基于單機服務(wù)器,很多配置可以默認(rèn)不需要修改斋荞,數(shù)據(jù)存儲在操作系統(tǒng)級別的磁盤。推出快速安裝的目的虐秦,便于了解并指導(dǎo)基于Dr...
“麒麟出沒平酿,必有祥瑞≡寐”—— 中國古諺語 前言 隨著移動互聯(lián)網(wǎng)蜈彼、物聯(lián)網(wǎng)等技術(shù)的發(fā)展,近些年人類所積累的數(shù)據(jù)正在呈爆炸式的增長俺驶,大數(shù)據(jù)時代已經(jīng)來臨幸逆。但是海量數(shù)據(jù)的收集只是大數(shù)據(jù)...
Druid基本概念及架構(gòu)介紹 1.什么是Druid Druid是一個專為大型數(shù)據(jù)集上的高性能切片和OLAP分析而設(shè)計的數(shù)據(jù)存儲。Druid最常用作為GUI分析應(yīng)用程序提供動力...
本系列的最后一部分是有關(guān)垃圾收集(GC)日志的JVM參數(shù)。GC日志是一個很重要的工具栖袋,它準(zhǔn)確記錄了每一次的GC的執(zhí)行時間和執(zhí)行結(jié)果拍顷,通過分析GC日志可以優(yōu)化堆設(shè)置和GC設(shè)置,...
內(nèi)存管理的目的就是讓我們在開發(fā)中怎么有效的避免我們的應(yīng)用出現(xiàn)內(nèi)存泄漏的問題塘幅。內(nèi)存泄漏大家都不陌生了昔案,簡單粗俗的講尿贫,就是該被釋放的對象沒有釋放,一直被某個或某些實例所持有卻不再...