1.安裝Anaconda悯蝉,里面自帶了jupyter 2.安裝scala,并配置環(huán)境變量 3.安裝spark,并配置環(huán)境變量 4.安裝pip模塊 5安裝spark' kerne...

1.安裝Anaconda悯蝉,里面自帶了jupyter 2.安裝scala,并配置環(huán)境變量 3.安裝spark,并配置環(huán)境變量 4.安裝pip模塊 5安裝spark' kerne...
使用pyodbc時讀取數(shù)據(jù)是ok 的肖粮,但寫入時會報錯 當將DataFrame寫回數(shù)據(jù)庫時就報錯了 錯誤如下: 折騰半天總是找到方法了。修改后的代碼如下:
今天剛看到ipython的一個函數(shù)執(zhí)行時間的分析器,非常好用,記錄一下。 安裝模塊 pip install line_profiler 導入模塊 %load_ext line...
['"custID","gender","state","cardholder","balance","numTrans","numIntlTrans","creditLin...
spark 數(shù)據(jù)建模準備 去重 count of rows: 7count of distinct rows: 6 +---+------+------+---+------...
numpy 數(shù)組常用函數(shù) where [1 2 3 4 5 6 7 8 9] [[1 2 3][4 5 6][7 8 9]] (array([5, 6, 7, 8], dty...
Numpy 學習筆記 (3,) 3 dtype('int64') array([0, 2, 4, 6, 8]) array([ 0. , 2.5, 5. , 7...