最近(2024年3月29日)汞斧,號(hào)稱比Python快6.8萬倍的Mojo編程語言開源啦夜郁!6.8萬倍?你敢相信這個(gè)數(shù)字是真的嗎粘勒?不過竞端,就連Mojo官網(wǎng)都把這個(gè)結(jié)果貼了出來(見下圖...
最近(2024年3月29日)汞斧,號(hào)稱比Python快6.8萬倍的Mojo編程語言開源啦夜郁!6.8萬倍?你敢相信這個(gè)數(shù)字是真的嗎粘勒?不過竞端,就連Mojo官網(wǎng)都把這個(gè)結(jié)果貼了出來(見下圖...
布隆過濾器,聽過也學(xué)過仲义,實(shí)際中沒怎么用到婶熬,時(shí)間長了再接觸這個(gè)概念就陌生了,說到底還是沒有徹底掌握埃撵。為了真正理解一項(xiàng)技術(shù)或一個(gè)概念赵颅,最好還是從問題出發(fā),所以布隆過濾器到底解決了...
最近在讀《左耳聽風(fēng)》暂刘,里面提到了一個(gè)匿名函數(shù)遞歸的例子饺谬,覺得很有趣,但是我覺得書里講解的還是有點(diǎn)難懂谣拣,所以嘗試用自己的理解把這個(gè)問題重新講了一遍募寨。注:本文中所用的代碼示例會(huì)同...
withColumn / withColumnRenamed 是 spark 中常用的 API,可以用于添加新字段 / 字段重命名 / 修改字段類型森缠,但是當(dāng)列的數(shù)量增加時(shí)拔鹰,...
有了Windows Terminal 你再也不需要其他任何終端了…… 下載 直接到Windows 10 自帶的應(yīng)用商店下載安裝。參考: https://github.com/...
生產(chǎn)環(huán)境的 Spark Job 都是跑在集群上的贵涵,畢竟 Spark 為大數(shù)據(jù)而生列肢,海量的數(shù)據(jù)處理必須依靠集群恰画。但是在開發(fā)Spark的的時(shí)候,不可避免我們要在本地進(jìn)行一些開發(fā)和...
什么是 Bucketing Bucketing 就是利用 buckets(按列進(jìn)行分桶)來決定數(shù)據(jù)分區(qū)(partition)的一種優(yōu)化技術(shù)瓷马,它可以幫助在計(jì)算中避免數(shù)據(jù)交換(a...
以前用Wordpress搭建過一個(gè)博客網(wǎng)站拴还,Wordpress雖然安裝簡單,功能強(qiáng)大欧聘,但是對(duì)于個(gè)人建站來說有點(diǎn)復(fù)雜了片林。最近發(fā)現(xiàn)用Hexo建站很流行,于是將網(wǎng)站從Wordpre...
在互聯(lián)網(wǎng)時(shí)代孝偎,相信幾乎每個(gè)人都聽說過「奧卡姆剃刀定律」,但是你真的懂它的意思嗎凉敲?更進(jìn)一步,你真的知道在實(shí)際中如何運(yùn)用奧卡姆剃刀定律嗎寺旺? 我們先看一下百度百科對(duì)它的定義: 奧卡...
本文將分兩部分來介紹如何在IntelliJ IDEA中運(yùn)行Java/Scala/Spark程序: 基本概念介紹 在IntelliJ IDEA中創(chuàng)建和運(yùn)行java/scala/...
AB測(cè)試的原理很簡單爷抓,只用到了最簡單的統(tǒng)計(jì)假設(shè)檢驗(yàn),但表面的簡單通常都隱藏著陷阱阻塑,這一點(diǎn)沒有經(jīng)過實(shí)踐的摸爬滾打是不容易看到的蓝撇,今天我就把前人已經(jīng)踩過的坑,一共15個(gè)陈莽,給大家分...
學(xué)習(xí)了渤昌。
Scala 中為什么不建議用return在Scala中為什么不建議用return 1. 要寫函數(shù)而不是指令 2. return 影響類型判斷 3. 使用return 返回含義模糊 最終得到的結(jié)果字符串則為scala...
在Scala中為什么不建議用return 1. 要寫函數(shù)而不是指令 2. return 影響類型判斷 3. 使用return 返回含義模糊 最終得到的結(jié)果字符串則為scala...
什么是AB測(cè)試独柑? 通俗點(diǎn)理解,AB測(cè)試就是比較兩個(gè)東西好壞的一套方法私植,這種A和B的比較在我們的生活和人生中非常常見忌栅,所以不難理解。具體到AB測(cè)試這個(gè)概念曲稼,它和我們比較哪個(gè)梨更...