偽隨機性(英語:Pseudorandomness)是一個過程似乎是隨機的,但實際上并不是泼差。偽隨機數(shù)是看似隨機實質(zhì)是固定的周期性序列贵少,也就是有規(guī)則的隨機。
什么是隨機數(shù)
隨機數(shù)在計算機應(yīng)用中使用的比較廣泛堆缘,最為熟知的便是在密碼學(xué)中的應(yīng)用滔灶。隨機數(shù)有3個特性,具體如下:
隨機性:不存在統(tǒng)計學(xué)偏差吼肥,是完全雜亂的數(shù)列
不可預(yù)測性:不能從過去的數(shù)列推測出下一個出現(xiàn)的數(shù)
不可重現(xiàn)性:除非將數(shù)列本身保存下來录平,否則不能重現(xiàn)相同的數(shù)列
Random算法
Random的使用是把要隨機的集合順序排列,從集合中隨機挑選
Random詳細(xì)用法請看我這篇文章Java中Random的用法
Shuffle算法
Shuffle算法和排序算法正好相反缀皱,是從有序到亂序的一個過程斗这,俗稱洗牌算法。
在Java中啤斗,有現(xiàn)成的shuffle算法實現(xiàn)表箭,即Collections類中的兩個重載的shuffle方法:
public static void shuffle(List<?> list) {
Random rnd = r;
if (rnd == null)
r = rnd = new Random();
shuffle(list, rnd);
}
private static Random r;
public static void shuffle(List<?> list, Random rnd) {
int size = list.size();
if (size < SHUFFLE_THRESHOLD || list instanceof RandomAccess) {
for (int i=size; i>1; i--)
swap(list, i-1, rnd.nextInt(i));
} else {
Object arr[] = list.toArray();
// Shuffle array
for (int i=size; i>1; i--)
swap(arr, i-1, rnd.nextInt(i));
// Dump array back into list
ListIterator it = list.listIterator();
for (int i=0; i<arr.length; i++) {
it.next();
it.set(arr[i]);
}
}
}
真隨機與偽隨機
隨機數(shù)分為真隨機數(shù)和偽隨機數(shù),我們程序使用的基本都是偽隨機數(shù)钮莲,其中偽隨機又分為強偽隨機數(shù)和弱偽隨機數(shù)免钻。
真隨機數(shù)彼水,通過物理實驗得出,比如擲錢幣伯襟、骰子猿涨、轉(zhuǎn)輪握童、使用電子元件的噪音姆怪、核裂變等。需要滿足隨機性澡绩、不可預(yù)測性稽揭、不可重現(xiàn)性。
偽隨機數(shù)肥卡,通過一定算法和種子得出溪掀。軟件實現(xiàn)的是偽隨機數(shù)。
強偽隨機數(shù)步鉴,難以預(yù)測的隨機數(shù)揪胃。需要滿足隨機性和不可預(yù)測性。
弱偽隨機數(shù)氛琢,易于預(yù)測的隨機數(shù)喊递。需要滿足隨機性。
上面介紹Random算法和Shuffle算法的時候阳似,代碼實現(xiàn)都是偽隨機算法骚勘。可以這樣說:
只要這個隨機數(shù)是由確定算法生成的撮奏,那就是偽隨機俏讹。只能通過不斷算法優(yōu)化,使你的隨機數(shù)更接近隨機畜吊。
有限狀態(tài)機不能產(chǎn)生真正的隨機數(shù)的泽疆,所以,現(xiàn)代計算機中玲献,無法通過一個純算法來生成真正的隨機數(shù)殉疼,無論是哪種語言,單純的算法生成的數(shù)字都是偽隨機數(shù)青自,都是由可確定的函數(shù)通過一個種子株依,產(chǎn)生的偽隨機數(shù)。
這也就意味著延窜,如果知道了種子恋腕,就可以推斷接下來的隨機數(shù)序列的信息。這就有了可預(yù)測性逆瑞。
那么真隨機數(shù)怎么產(chǎn)生的呢荠藤?
通過真實隨機事件取得的隨機數(shù)才是真隨機數(shù)伙单。
真正的隨機數(shù)是使用物理現(xiàn)象產(chǎn)生的:比如擲錢幣、骰子哈肖、轉(zhuǎn)輪吻育、使用電子元件的噪音、核裂變等等淤井。這樣的隨機數(shù)發(fā)生器叫做物理性隨機數(shù)發(fā)生器布疼,它們的缺點是技術(shù)要求比較高,效率低币狠。
現(xiàn)有的真隨機數(shù)生成器游两,比如PuTTYgen的隨機數(shù)是讓用戶移動鼠標(biāo)達(dá)到一定的長度,之后把鼠標(biāo)的運動軌跡轉(zhuǎn)化為種子漩绵;Intel通過電阻和振蕩器來生成熱噪聲作為信息熵資源贱案;Unix/Linux的dev/random和/dev/urandom采用硬件噪音生成隨機數(shù);
所以止吐,要想生成真的隨機數(shù)宝踪,是無法用任何一個純算法實現(xiàn)的。都需要借助外部物理現(xiàn)象碍扔。
Java中的隨機數(shù)生成器
Java語言提供了幾種隨機數(shù)生成器瘩燥,如前面提到的Random類,還有SecureRandom類蕴忆。
偽隨機數(shù)生成器
偽隨機數(shù)發(fā)生器采用特定的算法颤芬,將隨機數(shù)種子seed轉(zhuǎn)換成一系列的偽隨機數(shù)。偽隨機數(shù)依賴于seed的值套鹅,給定相同的seed值總是生成相同的隨機數(shù)站蝠。偽隨機數(shù)的生成過程只依賴CPU,不依賴任何外部設(shè)備卓鹿,生成速度快菱魔,不會阻塞。
Java提供的偽隨機數(shù)發(fā)生器有java.util.Random類和java.util.concurrent.ThreadLocalRandom類吟孙。
Random類采用AtomicLong實現(xiàn)澜倦,保證多線程的線程安全性,但正如該類注釋上說明的杰妓,多線程并發(fā)獲取隨機數(shù)時性能較差藻治。
多線程環(huán)境中可以使用ThreadLocalRandom作為隨機數(shù)發(fā)生器,ThreadLocalRandom采用了線程局部變量來改善性能巷挥,這樣就可以使用long而不是AtomicLong桩卵,此外,ThreadLocalRandom還進(jìn)行了字節(jié)填充,以避免偽共享雏节。
強隨機數(shù)發(fā)生器
強隨機數(shù)發(fā)生器依賴于操作系統(tǒng)底層提供的隨機事件胜嗓。強隨機數(shù)生成器的初始化速度和生成速度都較慢,而且由于需要一定的熵累積才能生成足夠強度的隨機數(shù)钩乍,所以可能會造成阻塞辞州。熵累積通常來源于多個隨機事件源,如敲擊鍵盤的時間間隔寥粹,移動鼠標(biāo)的距離與間隔变过,特定中斷的時間間隔等。所以排作,只有在需要生成加密性強的隨機數(shù)據(jù)的時候才用它牵啦。
Java提供的強隨機數(shù)發(fā)生器是java.security.SecureRandom類,該類也是一個線程安全類妄痪,使用synchronize方法保證線程安全,但jdk并沒有做出承諾在將來改變SecureRandom的線程安全性楞件。因此衫生,同Random一樣,在高并發(fā)的多線程環(huán)境中可能會有性能問題土浸。
在linux的實現(xiàn)中罪针,可以使用/dev/random和/dev/urandom作為隨機事件源。由于/dev/random是堵塞的黄伊,在讀取隨機數(shù)的時候泪酱,當(dāng)熵池值為空的時候會堵塞影響性能,尤其是系統(tǒng)大并發(fā)的生成隨機數(shù)的時候还最。
真隨機數(shù)發(fā)生器
在Linux系統(tǒng)中墓阀,SecureRandom的實現(xiàn)借助了/dev/random和/dev/urandom,可以使用硬件噪音生成隨機數(shù)拓轻;
http://random.org/斯撮,從1998年開始提供在線真隨機數(shù)服務(wù)了,它用大氣噪音生成真隨機數(shù)扶叉。他也提供了Java工具類勿锅,可以拿來使用。地址:https://sourceforge.net/projects/randomjapi/