夜深了,,般甲,又到時(shí)間學(xué)Spark了断凶。。状婶。做為數(shù)據(jù)庫(kù)排老三的SQL Server在2019年愛(ài)上了Apache Spark。微軟官宣的頭兩個(gè)賣點(diǎn)吗货,都是SparkPⅰp础!來(lái)自西雅圖的真愛(ài)饶碘!
大家肯定相當(dāng)?shù)暮闷娲纾瑐鹘y(tǒng)數(shù)據(jù)庫(kù)老三SQL Server是怎么和大數(shù)據(jù)老大Apache Spark在一起的呢?欲知詳情熊镣,請(qǐng)猛點(diǎn)微軟的技術(shù)白皮書:Microsoft SQL Server 2019 Big Data Clusters?
這里就講講頭兩個(gè)賣點(diǎn):
第一大賣點(diǎn)卑雁!Harness the power of big data
基于Spark的大數(shù)據(jù)解決方案!有別于傳統(tǒng)的Scale-up的SQL Server绪囱,新的一套是Scale out测蹲,計(jì)算和存儲(chǔ)分離,Spark和SQL Server在同一個(gè)K8S pod上鬼吵,可以方便數(shù)據(jù)共享扣甲!
第二大賣點(diǎn)!Bring AI to your workloads!
圍繞Spark展開(kāi)的整套AI解決方案齿椅!Spark Streaming來(lái)做Ingest琉挖,然后存入HDFS,然后用Spark做數(shù)據(jù)清洗和用Spark ML做機(jī)器學(xué)習(xí)涣脚,最后就可以用來(lái)預(yù)測(cè)和查詢了示辈!