自從Recorder H5 GitHub開源庫優(yōu)化后靠粪,對邊錄邊轉(zhuǎn)碼成小語音片段文件實時上傳服務(wù)器這種操作支持非常良好震桶,因此以前不太好支持的H5語音通話已經(jīng)有了更好的突破空間休傍。因此花了兩晚時間打造了一個H5語音通話聊天的demo。
一蹲姐、把玩方法
- 準(zhǔn)備局域網(wǎng)內(nèi)兩臺設(shè)備(Peer A磨取、Peer B)用最新版本瀏覽器(demo未適配低版本)分別打開demo頁面(也可以是同一瀏覽器打開兩個標(biāo)簽)
- 勾選頁面中的H5版語音通話聊天,在Peer A中點擊新建連接
- 把Peer A的本機信手動復(fù)制傳輸給Peer B柴墩,粘貼到遠程信息中忙厌,并點擊確定連接
- 把Peer B自動生成的本機信息手動復(fù)制傳輸給Peer A,粘貼到遠程信息中江咳,并點擊確定連接
- 雙方P2P連接已建立逢净,使用頁面上方的錄音功能,隨時開啟錄音歼指,音頻數(shù)據(jù)會實時發(fā)送給對方
局域網(wǎng)H5版對講機??
二汹胃、技術(shù)特性
(1)數(shù)據(jù)傳輸
github demo中考慮到減少對服務(wù)器的依賴,因此采用了WebRTC P2P傳輸功能东臀,無需任何服務(wù)器支持即可實現(xiàn)局域網(wǎng)內(nèi)的兩個設(shè)備之間互相連接着饥,連接代碼也算簡單。有服務(wù)器支持可能就要逆天了惰赋,不過代碼也會更復(fù)雜宰掉。
如果正式使用,可能不太會考慮使用WebRTC赁濒,用WebSocket通過服務(wù)器進行轉(zhuǎn)發(fā)可能是最佳的選擇轨奄。
WebRTC局域網(wǎng)P2P連接要點(實際代碼其實差不多,只不過多做了點兼容):
/******Peer A(本機)******/
var peerA=new RTCPeerConnection(null,null)
//開啟會話拒炎,等待遠程連接
peerA.createOffer().then(function(offer){
peerA.setLocalDescription(offer);
peerAOffer=offer;
});
var peerAICEList=[......] //通過peerA.onicecandidate監(jiān)聽獲得所有的ICE連接信息候選項挪拟,如果有多個網(wǎng)絡(luò)適配器,就會有多個候選
//創(chuàng)建連接通道對象击你,A端通過這個來進行數(shù)據(jù)發(fā)送
var peerAChannel=peerA.createDataChannel("RTC Test");
/******Peer B(遠程)******/
var peerB=new RTCPeerConnection(null,null)
//連接到Peer A
peerB.setRemoteDescription(peerAOffer);
//開啟應(yīng)答會話玉组,等待Peer A確認連接
peerB.createAnswer().then(function(answer){
peerB.setLocalDescription(answer);
peerBAnswer=answer;
});
//把Peer A的連接點都添加進去
peerB.addIceCandidate(......peerAICEList)
var peerBICEList=[......] //通過peerB.onicecandidate監(jiān)聽獲得所有的ICE連接信息候選項谎柄,如果有多個網(wǎng)絡(luò)適配器,就會有多個候選
var peerBChannel=... //通過peerB.ondatachannel得到連接通道對象惯雳,B端通過這個來進行數(shù)據(jù)發(fā)送
/*******最終完成連接********/
//連接到Peer B
peerA.setRemoteDescription(peerBAnswer);
//把Peer B的連接點都添加進去
peerA.addIceCandidate(......peerBICEList)
/*
peerA peerB分別等待peerA/BChannel.onopen回調(diào)即完成P2P連接
朝巫,然后通過監(jiān)聽peerA/BChannel.onmessage獲得對方發(fā)送的信息
,通過peerA/BChannel.send(data) 發(fā)送數(shù)據(jù)石景。
*/
(2)音頻采集和編碼
由于是在我的Recorder庫中新加的demo劈猿,因此音頻采集和編碼都是現(xiàn)成的,Recorder庫有好的兼容性和穩(wěn)定性潮孽,因此節(jié)省了最大頭的工作量揪荣。
編碼最佳使用MP3格式,因為此格式已優(yōu)化了實時編碼性能往史,可做到邊錄邊轉(zhuǎn)碼仗颈,16kbps 16khz的情況下可做到2kb每秒的文件大小,音質(zhì)還可以怠堪,實時傳輸時為3kb每秒揽乱,15分鐘大概3M的流量名眉。
用wav格式也可以粟矿,不過此格式編碼出來的數(shù)據(jù)量太大,16位 16khz接近50kb每秒的實時傳輸數(shù)據(jù)损拢,15分鐘要37M多流量陌粹。其他格式由于暫未對實時編碼進行優(yōu)化,使用中會導(dǎo)致明顯卡頓福压。
降噪掏秩、靜音檢測等高級功能是沒有的,畢竟是非專業(yè)人員?? 要求高點可以荆姆,但不要超出范圍太多啦蒙幻。
(3)音頻實時接收和播放
接收到一個音頻片段后,本應(yīng)該是立即播放的胆筒,但由于編碼邮破、網(wǎng)絡(luò)傳輸導(dǎo)致的延遲,可能上個片段還未播放完(甚至未開始播放)仆救,因此需要緩沖處理抒和。
因為存在緩沖,就需要進行實時同步處理彤蔽,如果緩沖內(nèi)積壓了過多的音頻片段摧莽,會導(dǎo)致語音播放滯后太多,因此需要適當(dāng)進行對數(shù)據(jù)進行丟棄顿痪,實測發(fā)現(xiàn)網(wǎng)絡(luò)正常镊辕、設(shè)備性能靠譜的情況下基本沒有丟棄的數(shù)據(jù)油够。
然后就是播放了,本應(yīng)是播完一個就播下一個丑蛤,測試發(fā)現(xiàn)這是不靠譜的叠聋。因為結(jié)束一個片段后再開始播放下一個發(fā)出聲音,這個過程會中斷比較長時間受裹,明顯感覺得出來中間存在短暫停頓碌补。因此必須在片段未播完時準(zhǔn)備好下一個片段的播放,并且提前開始播放棉饶,達到抹掉中間的停頓厦章。
我寫了兩個播放方式:
- 實時解碼播放
- 雙Audio輪換播放
最開始用一個Audio停頓感太明顯,因此用兩個Audio輪換抹掉中間的停頓照藻,但發(fā)現(xiàn)不同格式Auido播放差異巨大袜啃,播放wav非常流暢,但播放mp3還是存在停頓(后面用解碼的發(fā)現(xiàn)是得到的PCM時長變長了幸缕,導(dǎo)致事件觸發(fā)會出現(xiàn)誤差群发,為什么會變長?怪異)发乔。
因此后面寫了一個解碼然后再播放熟妓,mp3這次終于能正常連續(xù)播放了,wav格式和雙Audio的播放差異不大栏尚。實時解碼里面也用到了雙Audio中的技巧起愈,其實也是用到了兩個BufferSource進行類似的輪換操作,以抹掉兩個片段間的停頓译仗。
不過最終播放效果還是不夠好抬虽,音質(zhì)變差了點,并且多了點噪音纵菌。如果有現(xiàn)成的播放代碼拿過來用就就好了阐污。
三、應(yīng)用場景
- 數(shù)據(jù)傳輸改成WebSocket咱圆,做個仿微信語音通話H5版還是可以的(受限于Recorder瀏覽器支持)
- 局域網(wǎng)H5版對講機(前端玩具)
- ......沒有想到
完笛辟。