hdfs-block位于存儲空間径荔;spark-partition位于計算空間少辣;
hdfs-block的大小是固定的耐齐;spark-partition大小是不固定的厂抽;
hdfs-block是有冗余的需频、不會輕易丟失;spark-partition(RDD)沒有冗余設(shè)計筷凤、丟失之后重新計算得到昭殉;
#
hdfs-block位于存儲空間径荔;spark-partition位于計算空間少辣;
hdfs-block的大小是固定的耐齐;spark-partition大小是不固定的厂抽;
hdfs-block是有冗余的需频、不會輕易丟失;spark-partition(RDD)沒有冗余設(shè)計筷凤、丟失之后重新計算得到昭殉;
#