NumPy 音頻和圖像處理

# 來源：NumPy Cookbook 2e Ch5

將圖像加載進(jìn)內(nèi)存

import numpy as np 
import matplotlib.pyplot as plt

# 首先生成一個(gè) 512x512 的圖像
# 在里面畫 30 個(gè)正方形
N = 512 
NSQUARES = 30

# 初始化
img = np.zeros((N, N), np.uint8) 
# 正方形的中心是 0 ~ N 的隨機(jī)數(shù)
centers = np.random.random_integers(0, N, size=(NSQUARES, 2))
# 正方形的邊長是 0 ~ N/9 的隨機(jī)數(shù)
radii = np.random.randint(0, N/9, size=NSQUARES) 
# 顏色是 100 ~ 255 的隨機(jī)數(shù)
colors = np.random.randint(100, 255, size=NSQUARES)

# 生成正方形
for i in xrange(NSQUARES):
    # 為每個(gè)正方形生成 x 和 y 坐標(biāo)
    xindices = range(centers[i][0] - radii[i], centers[i][0]  + radii[i])   
    xindices = np.clip(xindices, 0, N - 1)   
    yindices = range(centers[i][1] - radii[i], centers[i][1]  + radii[i])   
    
    # clip 過濾范圍之外的值
    # 相當(dāng)于 yindices = yindices[(0 < yindices) & (yindices < N - 1)]
    yindices = np.clip(yindices, 0, N - 1)
    if len(xindices) == 0 or len(yindices) == 0:
        continue
    # 將 x 和 y 坐標(biāo)轉(zhuǎn)換成網(wǎng)格
    # 如果不轉(zhuǎn)換成網(wǎng)格姿鸿，只會給對角線著色
    coordinates = np.meshgrid(xindices, yindices)     
    img[coordinates] = colors[i]
   
# tofile 以二進(jìn)制保存數(shù)組的內(nèi)容，沒有形狀和類型信息 
img.tofile('random_squares.raw') 
# np.memmap 以二進(jìn)制加載數(shù)組贞言，如果類型不是 uint8冠胯，則需要執(zhí)行
# 如果數(shù)組不是一維，還需要指定形狀
img_memmap = np.memmap('random_squares.raw', shape=img.shape)

# 顯示圖像（會自動(dòng)將灰度圖映射為偽彩色）
plt.imshow(img_memmap) 
plt.axis('off') 
plt.show()

組合圖像

import numpy as np import 
matplotlib.pyplot as plt 
from scipy.misc import lena

ITERATIONS = 10 
lena = lena() 
SIZE = lena.shape[0] 
MAX_COLOR = 255. 
x_min, x_max = -2.5, 1 
y_min, y_max = -1, 1

# 數(shù)組初始化
x, y = np.meshgrid(np.linspace(x_min, x_max, SIZE),
                   np.linspace(y_min, y_max, SIZE)) 
c = x + 1j * y 
z = c.copy() 
fractal = np.zeros(z.shape, dtype=np.uint8) + MAX_COLOR 

# 生成 mandelbrot 圖像 
for n in range(ITERATIONS):
    mask = np.abs(z) <= 4
    z[mask] = z[mask] ** 2 +  c[mask]
    fractal[(fractal == MAX_COLOR) & (-mask)] = (MAX_COLOR - 1) * n / ITERATIONS

# 繪制 mandelbrot 圖像 
plt.subplot(211) 
plt.imshow(fractal) 
plt.title('Mandelbrot') 
plt.axis('off')

# 將 mandelbrot 和 lena 組合起來
plt.subplot(212) 
# choose 的作用是躲查，如果 fractal 的元素小于 lena 的對應(yīng)元素
# 就選擇 fractal它浅，否則選擇 lena
# 相當(dāng)于 np.fmin(fractal, lena)
plt.imshow(np.choose(fractal < lena, [fractal, lena])) 
plt.axis('off') 
plt.title('Mandelbrot + Lena')
plt.show()

使圖像變模糊

import numpy as np 
import matplotlib.pyplot as plt 
from random import choice 
import scipy 
import scipy.ndimage

# Initialization 
NFIGURES = 5 
k = np.random.random_integers(1, 5, NFIGURES) 
a = np.random.random_integers(1, 5, NFIGURES)
colors = ['b', 'g', 'r', 'c', 'm', 'y', 'k']

# 繪制原始 的 lena 圖像
lena = scipy.misc.lena() 
plt.subplot(211) 
plt.imshow(lena) 
plt.axis('off')

# 繪制模糊的 lena 圖像
plt.subplot(212) 
# 使用 sigma=4 的高斯過濾器
blurred = scipy.ndimage.gaussian_filter(lena, sigma=4)
plt.imshow(blurred) 
plt.axis('off')

# 在極坐標(biāo)中繪圖
# 極坐標(biāo)無視 subplot
theta = np.linspace(0, k[0] * np.pi, 200) 
plt.polar(theta, np.sqrt(theta), choice(colors))

for i in xrange(1, NFIGURES):
    theta = np.linspace(0, k[i] * np.pi, 200)   
    plt.polar(theta, a[i] * np.cos(k[i] * theta), choice(colors))
plt.axis('off')
plt.show()

重復(fù)聲音片段

import scipy.io.wavfile 
import matplotlib.pyplot as plt 
import urllib2 
import numpy as np

# 下載音頻文件
response = urllib2.urlopen('http://www.thesoundarchive.com/ austinpowers/smashingbaby.wav') 
print(response.info()) 

# 將文件寫到磁盤
WAV_FILE = 'smashingbaby.wav' 
filehandle = open(WAV_FILE, 'w') 
filehandle.write(response.read()) 
filehandle.close() 

# 使用 SciPy 讀取音頻文件
sample_rate, data = scipy.io.wavfile.read(WAV_FILE) 
print("Data type", data.dtype, "Shape", data.shape)
# ('Data type', dtype('uint8'), 'Shape', (43584L,))

# 繪制原始音頻文件
plt.subplot(2, 1, 1)
plt.title("Original") 
plt.plot(data)

# 繪制重復(fù)后的音頻文件
plt.subplot(2, 1, 2)
# tile 用于重復(fù)數(shù)組
repeated = np.tile(data, 3)
plt.title("Repeated") 
plt.plot(repeated) 

# 保存重復(fù)后的音頻文件
scipy.io.wavfile.write("repeated_yababy.wav", sample_rate, repeated)
plt.show()

生成聲音

# 聲音可以表示為某個(gè)振幅、頻率和初相的正弦波
# 如果我們把鋼琴上的鍵編為 1 ~ 88镣煮，
# 那么它的頻率就是 440 * 2 ** ((n - 49) / 12)
# 其中 n 是鍵的編號

import scipy.io.wavfile 
import numpy as np
import matplotlib.pyplot as plt

RATE = 44100 
DTYPE = np.int16

# 生成正弦波 
def generate(freq, amp, duration, phi): 
    t = np.linspace(0, duration, duration * RATE) 
    data = np.sin(2 * np.pi * freq * t + phi) * amp
    
    return data.astype(DTYPE)

# 初始化
# 彈奏 89 個(gè)音符
NTONES = 89 
# 振幅是 200 ~ 2000
amps = 2000. * np.random.random((NTONES,)) + 200. 
# 時(shí)長是 0.01 ~ 0.2
durations = 0.19 * np.random.random((NTONES,)) + 0.01 
# 鍵從 88 個(gè)中任取
keys = np.random.random_integers(1, 88, NTONES) 
# 頻率使用上面的公式生成
freqs = 440.0 * 2 ** ((keys - 49.)/12.) 
# 初相是 0 ~ 2 * pi
phi = 2 * np.pi * np.random.random((NTONES,))

tone = np.array([], dtype=DTYPE)

for i in xrange(NTONES):   
    # 對于每個(gè)音符生成正弦波
    newtone = generate(freqs[i], amp=amps[i],  duration=durations[i], phi=phi[i])   
    # 附加到音頻后面
    tone = np.concatenate((tone, newtone))

# 保存文件
scipy.io.wavfile.write('generated_tone.wav', RATE, tone)

# 繪制音頻數(shù)據(jù)
plt.plot(np.linspace(0, len(tone)/RATE, len(tone)), tone) 
plt.show()

設(shè)計(jì)音頻濾波器

import scipy.io.wavfile 
import matplotlib.pyplot as plt 
import urllib2 
import numpy as np

# 下載音頻文件
response = urllib2.urlopen('http://www.thesoundarchive.com/ austinpowers/smashingbaby.wav') 
print(response.info()) 

# 將文件寫到磁盤
WAV_FILE = 'smashingbaby.wav' 
filehandle = open(WAV_FILE, 'w') 
filehandle.write(response.read()) 
filehandle.close() 

# 使用 SciPy 讀取音頻文件
sample_rate, data = scipy.io.wavfile.read(WAV_FILE) 
print("Data type", data.dtype, "Shape", data.shape)
# ('Data type', dtype('uint8'), 'Shape', (43584L,))

# 繪制原始音頻文件
plt.subplot(2, 1, 1)
plt.title("Original") 
plt.plot(data)

# 設(shè)計(jì)濾波器姐霍，iirdesign 設(shè)計(jì)無限脈沖響應(yīng)濾波器
# 參數(shù)依次是 0 ~ 1 的正則化頻率、
# 最大損失典唇、最低衰減和濾波類型
b,a = scipy.signal.iirdesign(wp=0.2, ws=0.1, gstop=60, gpass=1, ftype='butter')

# 傳入剛才的返回值镊折，使用 lfilter 函數(shù)來調(diào)用濾波器
filtered = scipy.signal.lfilter(b, a, data)

# 繪制濾波后的音頻
plt.subplot(2, 1, 2) 
plt.title("Filtered") 
plt.plot(filtered)

# 保存濾波后的音頻
scipy.io.wavfile.write('filtered.wav', sample_rate, filtered. astype(data.dtype))
plt.show()

Sobel 過濾器的邊界檢測

# Sobel 過濾器用于提取圖像的邊界
# 也就是將圖像轉(zhuǎn)換成線框圖風(fēng)格
import scipy 
import scipy.ndimage 
import matplotlib.pyplot as plt

# 導(dǎo)入 Lena
lena = scipy.misc.lena()

# 繪制 Lena（左上方）
plt.subplot(221) 
plt.imshow(lena) 
plt.title('Original') 
plt.axis('off')


# Sobel X 過濾器過濾后的圖像（右上方）
sobelx = scipy.ndimage.sobel(lena, axis=0, mode='constant')
plt.subplot(222) 
plt.imshow(sobelx) 
plt.title('Sobel X') 
plt.axis('off')

# Sobel Y 過濾器過濾的圖像（左下方） 
sobely = scipy.ndimage.sobel(lena, axis=1, mode='constant')
plt.subplot(223) 
plt.imshow(sobely) 
plt.title('Sobel Y') 
plt.axis('off')

# 默認(rèn)的 Sobel 過濾器（右下方）
default = scipy.ndimage.sobel(lena)
plt.subplot(224) 
plt.imshow(default) 
plt.title('Default Filter') 
plt.axis('off')
plt.show()

最后編輯于：2017.12.08 03:14:22

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市蚓聘，隨后出現(xiàn)的幾起案子腌乡，更是在濱河造成了極大的恐慌，老刑警劉巖夜牡，帶你破解...
沈念sama閱讀 222,000評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件与纽，死亡現(xiàn)場離奇詭異，居然都是意外死亡塘装，警方通過查閱死者的電腦和手機(jī)急迂，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,745評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來蹦肴，“玉大人僚碎，你說我怎么就攤上這事∫趸希” “怎么了勺阐？”我有些...
開封第一講書人閱讀 168,561評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長矛双。經(jīng)常有香客問我渊抽，道長，這世上最難降的妖魔是什么议忽？我笑而不...
開封第一講書人閱讀 59,782評論 1贊 298
?港島之戀（遺憾婚禮）
正文為了忘掉前任懒闷，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘愤估。我一直安慰自己帮辟，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 68,798評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布玩焰。她就那樣靜靜地躺著由驹，像睡著了一般。火紅的嫁衣襯著肌膚如雪昔园。梳的紋絲不亂的頭發(fā)上荔棉，一...
開封第一講書人閱讀 52,394評論 1贊 310
城市分裂傳說
那天，我揣著相機(jī)與錄音蒿赢，去河邊找鬼。笑死渣触，一個(gè)胖子當(dāng)著我的面吹牛羡棵，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播嗅钻，決...
沈念sama閱讀 40,952評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼皂冰，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了养篓？” 一聲冷哼從身側(cè)響起秃流，我...
開封第一講書人閱讀 39,852評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎柳弄，沒想到半個(gè)月后舶胀，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,409評論 1贊 318
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡碧注，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,483評論 3贊 341
?白月光啟示錄
正文我和宋清朗相戀三年嚣伐，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片萍丐。...
茶點(diǎn)故事閱讀 40,615評論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡轩端，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出逝变，到底是詐尸還是另有隱情基茵，我是刑警寧澤，帶...
沈念sama閱讀 36,303評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布壳影，位于F島的核電站拱层，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏态贤。R本人自食惡果不足惜舱呻，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,979評論 3贊 334
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧箱吕，春花似錦芥驳、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,470評論 0贊 24
一樁弒父案兆旬，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至怎栽，卻和暖如春丽猬，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背熏瞄。一陣腳步聲響...
開封第一講書人閱讀 33,571評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工脚祟，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人强饮。一個(gè)月前我還...
沈念sama閱讀 49,041評論 3贊 377
代替公主和親
正文我出身青樓由桌，卻偏偏與公主長得像，于是被迫代替她去往敵國和親邮丰。傳聞我的和親對象是個(gè)殘疾皇子行您，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,630評論 2贊 359

NumPy 音頻和圖像處理

NumPy 音頻和圖像處理

將圖像加載進(jìn)內(nèi)存

組合圖像

使圖像變模糊

重復(fù)聲音片段

生成聲音

設(shè)計(jì)音頻濾波器

Sobel 過濾器的邊界檢測

推薦閱讀更多精彩內(nèi)容