MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運算艾疟。 概念"Map(映射)"和"Reduce(歸約)"惹资,是它們的主要思想...
術(shù)語又稱技術(shù)名詞镀岛、科學(xué)術(shù)語饲齐、科技術(shù)語或技術(shù)術(shù)語缓窜,是在特定專業(yè)領(lǐng)域中一般概念的詞語指稱藤违,一個術(shù)語表示一個概念。研究術(shù)語的學(xué)科有術(shù)語學(xué)脊岳。由于文化差異...
Java HotSpot 虛擬機是 Java SE 平臺的一個核心組件。它實現(xiàn) Java 虛擬機規(guī)范垛玻,并作為 Java 運行時環(huán)境中的一個共享庫...
JVM(Java Virtual Machine Java 虛擬機)是一種用于計算設(shè)備的規(guī)范割捅,基于這套規(guī)范,許多團隊開發(fā)了多種不同的虛擬機實現(xiàn)帚桩,...
ETL是英文Extract-Transform-Load 的縮寫亿驾,用來描述將數(shù)據(jù)從來源端經(jīng)過抽取(extract)账嚎、轉(zhuǎn)換(transform)莫瞬、...
大數(shù)據(jù)平臺通過將所有數(shù)據(jù)整合起來,充分分析與挖掘數(shù)據(jù)的內(nèi)在價值郭蕉,為業(yè)務(wù)部門提供數(shù)據(jù)平臺疼邀,數(shù)據(jù)產(chǎn)品與數(shù)據(jù)服務(wù)。大數(shù)據(jù)平臺接入的數(shù)據(jù)中可能包括很多用...
Scrapy吸引人的地方在于它是一個框架召锈,任何人都可以根據(jù)需求方便的修改旁振。它也提供了多種類型爬蟲的基類,如BaseSpider涨岁、sitemap爬...
Apache Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎拐袜。Spark是UC Berkeley AMP lab (加州大學(xué)伯克利分...
Hive是建立在 Hadoop 上的數(shù)據(jù)倉庫基礎(chǔ)構(gòu)架。它提供了一系列的工具梢薪,可以用來進(jìn)行數(shù)據(jù)提取轉(zhuǎn)化加載(ETL)蹬铺,這是一種可以存儲、查詢和分析...