[LBS] 騰訊 - 構(gòu)建大規(guī)陌斐桑基于wifi的室內(nèi)定位系統(tǒng)經(jīng)驗(yàn)分享

論文標(biāo)題.png

1. 摘要&引言

  • 基于GPS的室外定位當(dāng)前被廣泛使用,但是很少的室內(nèi)定位系統(tǒng)被部署和使用乏沸。本篇論文作者分享了5年的經(jīng)驗(yàn)關(guān)于如何部署和評估一個大規(guī)模的基于wifi的室內(nèi)定位系統(tǒng)冲粤。本系統(tǒng)當(dāng)前在1469個商場美莫、393個辦公樓、35個醫(yī)院部署覆蓋了35座城市梯捕,系統(tǒng)每天給幾百萬的用戶提供定位服務(wù)厢呵。作者發(fā)布了相關(guān)的數(shù)據(jù)集,包括1469個商場和一個辦公樓相關(guān)的指紋數(shù)據(jù)傀顾。系統(tǒng)整體架構(gòu)見下圖所示襟铭。。 相關(guān)數(shù)據(jù)集可以在github中看到:https://github.com/IndoorFingerprint/IndoorFingerprintData
  • 室內(nèi)定位常使用的技術(shù)包括:wifi短曾、藍(lán)牙寒砖、UWB等。藍(lán)牙嫉拐、UWB定位需要專門的硬件部署哩都,不太適合大規(guī)模的部署。所以本文考慮使用wifi進(jìn)行室內(nèi)定位婉徘,因?yàn)樵诖蠖鄶?shù)商場漠嵌、辦公樓等區(qū)域都會有wifi的部署,不需要額外部署專門的設(shè)備盖呼。基于Wifi的室內(nèi)定位技術(shù)大致可以分為三類:angle-based(AOA)儒鹿、time-based(TOA)、fingerprint-based塌计。AOA和TOA的wifi定位技術(shù)對WIFI設(shè)備有極高的要求挺身,AOA定位技術(shù)要求有精確的角度測量、TOA技術(shù)要求有精確的時間測量锌仅≌录兀基于指紋的定位技術(shù)包括:CSI和RSSI墙贱。CSI的獲取只有某一些WIFI卡才能獲取比如Inter 5300卡和Atheros AR系列卡。因此最終采用基于RSSI測量的指紋定位技術(shù)贱傀,RSSI值可以在大多數(shù)的WIFI設(shè)備上獲取惨撇。
系統(tǒng)整體架構(gòu).png

2. 指紋收集

  • 指紋收集是非常費(fèi)時費(fèi)力的,人工收集指紋的方式不太適合大規(guī)模的部署室內(nèi)定位系統(tǒng)府寒,因此本文提出了一種基于眾包的方法收集指紋數(shù)據(jù)魁衙。本文提出了一個通過兩階段的方式是的大規(guī)模的指紋收集成為可能,首先第一個階段獲取WIFI AP數(shù)據(jù)的粗略的位置株搔,通過這種方式獲取初始的指紋庫數(shù)據(jù)剖淀。然后我們通過用戶的反饋迭代更新我們的指紋庫數(shù)據(jù),通過這種方式獲取更高質(zhì)量的指紋庫數(shù)據(jù)纤房。

2.1 WIFI AP位置估計

  • WIFI AP的位置估計分為兩個階段:第一個階段我們通過名稱匹配的方式獲取一些AP的位置纵隔,這些AP的名稱通常和POI名稱有一定的關(guān)聯(lián),在樓層指引的幫助下我們能夠獲取這些AP的較準(zhǔn)確的物理位置炮姨。第二個階段我們使用推測出的AP位置捌刮,去推測剩余AP的位置信息。

  • 第一階段:使用名稱信息估計AP的位置舒岸。 為了匹配Wifi AP的名稱和POI绅作,我們采用NLP工具(Spacy,https://spacy.io/)處理AP名稱蛾派,并且我們考慮名稱縮寫的相似性俄认。最終我們采用Google的wide&deep模型匹配AP的名稱和POI的名稱。在所有的4百萬的AP庫能夠通過名稱匹配的WIFI AP占比約為19.63%碍脏。其中商場梭依、辦公樓、醫(yī)院中能夠通過名稱匹配獲取位置占比分別為:38.23%典尾、13.50%、7.65%糊探。為了評估名稱匹配模型的準(zhǔn)確率钾埂,人工收集8000個AP的真值,最終計算得到模型匹配的準(zhǔn)確率為98.4%科平。

  • 第二階段:估計剩余AP的位置褥紫。 要估計剩余AP的位置,首先需要計算剩余AP與已估計位置AP的相似度瞪慧。
    本文首先想到的是通過計算AP之間的共現(xiàn)次數(shù)髓考,來計算兩個AP之間的相似度,計算公式見公式(1)弃酌。其中N表示AP_xAP_k被同一臺手機(jī)掃描到的次數(shù)氨菇,M表示掃描到AP_x或者AP_k的次數(shù)之和儡炼。但是公式(1)中沒有考慮到掃描的信號強(qiáng)度值,因此在公式(1)的基礎(chǔ)之上加上了信號強(qiáng)度信息得到公式(2)查蓉。注意公式(2)中分子項(xiàng)需要對分子乌询、分母都?xì)w一化到0-1之間。

Prox(AP_x, AP_k) = \frac{N}{M} \qquad (1)
Prox(AP_x, AP_k) = \frac{\sum_{i=1}^N \frac{Mean(RSSI_{xi}, RSSI_{ki})}{|RSSI_{xi} - RSSI_{ki}|}}{M} \qquad (2)

  • 在估計AP的位置之前豌研,我們首先需要估計AP的樓層信息妹田。如果與AP_x最相似的N_f個AP都在同一層,則AP_x的樓層信息可以被立馬確定鹃共,否則將這個AP的樓層信息放在之后的迭代中預(yù)測鬼佣。 為了平衡準(zhǔn)確率和迭代次數(shù),論文中將N_f的值設(shè)置為3霜浴。得到AP的樓層信息之后晶衷,AP的位置信息通過同樓層的AP位置加權(quán)得到,具體計算公式見公式(3)坷随。當(dāng)AP的位置被估計之后房铭,則可以將這個AP加入已知位置的AP庫中。
AP位置估計.png
  • 在商場温眉、辦公樓缸匪、醫(yī)院三個場景下被估計出位置的AP占比分別為:91.10%,91.40%类溢,86.87%凌蔬。為了評估AP位置估計的準(zhǔn)確率,我們?nèi)斯な占?000個AP位置真值闯冷,最終誤差估計的中位數(shù)在三個環(huán)境中分別為:5.16米砂心、8.65米、23.61米蛇耀。

2.2 指紋收集

  • 指紋收集過程分為兩步:初始化階段和更新階段辩诞;指紋的兩個重要組成部分是:位置(Location)和這個位置相關(guān)的特征(unique features associated with this location)。 傳統(tǒng)的基于wifi的指紋僅僅使用AP的信號強(qiáng)度作為唯一的特征纺涤,本文中加入了位置的請求次數(shù)作為額外的特征译暂。
室內(nèi)指紋收集.png
  • 位置指紋初始化: 本文采用基于迭代的方式更新指紋數(shù)據(jù),首先通過眾包的方式初始化指紋庫數(shù)據(jù)撩炊,然后通過用戶的反饋刪除那些不正確的指紋數(shù)據(jù)外永。每次請求的時候,根據(jù)用戶手機(jī)接收到的AP及其信號強(qiáng)度我們可以粗略估計用戶的位置拧咳,具體計算公式見公式(4)伯顶。我們能夠通過眾包的方式很快的收集到很多的指紋數(shù)據(jù)。1469個商場平均需要花費(fèi)6.6天的時間收集到87.4%位置的指紋數(shù)據(jù)。剩下的位置用戶很少到訪祭衩,因此對于定位服務(wù)影響不大灶体。
粗略用戶位置.png
  • 位置指紋更新: 通過指紋的初始化可以獲取很多指紋數(shù)據(jù),但是可能不是很正確汪厨。因此本文繼續(xù)通過大量的用戶反饋修正初始指紋庫數(shù)據(jù)赃春。通過一些獎勵機(jī)制獲取用戶反饋,比如給用戶發(fā)一些優(yōu)惠券等劫乱。大約可以獲取5%的用戶反饋织中,反饋的形式就是讓用戶給系統(tǒng)定位結(jié)果進(jìn)行打分(1~5分)。只有當(dāng)我們接收的用戶得分與之前的得分相等或者更高的時候衷戈,我們才更新我們的指紋庫數(shù)據(jù)狭吼,否則我們使用最新的AP數(shù)據(jù)獲取位置的最新指紋數(shù)據(jù)。對于商場場景平均經(jīng)歷6天的時間殖妇,所有的指紋庫數(shù)據(jù)都會獲得5分的評分刁笙。
指紋庫更新.png

3. 數(shù)據(jù)處理

3.1 基于多特征的定位

  • 本文的指紋定位使用的特征包括:RSSI和請求次數(shù)特征。為了計算數(shù)據(jù)庫中網(wǎng)格的RSSI列表和在線收集的RSSI列表相似度谦趣,我們首先要定位兩個列表的共同AP疲吸,然后計算RSSI列表相似度。計算的指標(biāo)包括:euclidean distance, rank distance, distribute distance, reverse-pair rate前鹅。 如果共同的AP數(shù)量少于3摘悴,則這個網(wǎng)格將排除不考慮。本文還引入了請求次數(shù)作為另外一個指紋特征舰绘,請求次數(shù)特征能夠告訴我們當(dāng)用戶發(fā)起定位的時候哪個位置更受歡迎蹂喻。作者發(fā)現(xiàn)發(fā)起定位請求的地方大多數(shù)在某個POI的入口,比如飯店的入口捂寿。
  • 為了比較好的將兩種特征結(jié)合起來口四,我們使用熟知的LambdaRank模型。LambdaRank模型將網(wǎng)格的特征作為輸入秦陋,對網(wǎng)格進(jìn)行排序蔓彩,排在最前面的網(wǎng)格就是最終估計的位置。本文將用戶反饋的數(shù)據(jù)訓(xùn)練LambdaRank模型驳概。
指紋定位過程.png

3.2 現(xiàn)實(shí)世界中的挑戰(zhàn)

  • 室內(nèi)外邊界檢測: 邊界檢測對于精確定位至關(guān)重要粪小,比如當(dāng)一個用戶進(jìn)入到一個商場,如果仍然使用GPS服務(wù)抡句,則會產(chǎn)生較大的定位誤差。目前常用的方法是使用智能手機(jī)的傳感器比如亮度和大氣壓傳感器杠愧,用來判別室內(nèi)外待榔。本文僅僅使用GPS和WiFi的信號強(qiáng)度分布用于室內(nèi)外的判別,其基本原理是:WIFI在室內(nèi)外信號強(qiáng)度分布有明顯差異,室內(nèi)環(huán)境強(qiáng)于室外環(huán)境锐锣,然而GPS信號強(qiáng)度在室外環(huán)境強(qiáng)于室內(nèi)環(huán)境腌闯。下圖5展示了室內(nèi)外WiFi和GPS信號強(qiáng)度分布,作者在不同的位置收集了WiFi和GPS信號強(qiáng)度分布訓(xùn)練了室內(nèi)外判別模雕憔,模型獲得的準(zhǔn)確率為98.7%姿骏。注意室內(nèi)外判別跟具體的某個AP沒有關(guān)系,只跟采集到的AP信號強(qiáng)度分布有關(guān)斤彼。
室內(nèi)外WiFi和GPS信號強(qiáng)度分布.png
  • 建筑中的中空區(qū)域: 在中空區(qū)域(例如電梯口或者室內(nèi)橋)中分瘦,我們發(fā)現(xiàn)會出現(xiàn)大量的樓層識別錯誤。并且我們發(fā)現(xiàn)在中空區(qū)域邊緣的AP信號強(qiáng)度分布出現(xiàn)了兩個波峰琉苇,而其他區(qū)域的AP信號強(qiáng)度分布沒有這樣的表現(xiàn)嘲玫,只出現(xiàn)一個波峰。最終在樓層定位的時候并扇,我們將中空區(qū)域的AP刪除因?yàn)橐胨鼈儗a(chǎn)生較大誤差去团。
商場中的中空區(qū)域.png

AP信號強(qiáng)度分布(中空區(qū)域vs其他區(qū)域).png

4. 大規(guī)模系統(tǒng)實(shí)驗(yàn)

4.1 商場定位

  • 本文提出的室內(nèi)定位系統(tǒng)部署在1469個商場中,所有的WiFi AP都是第三方部署的穷蛹。并且作者發(fā)布了商場的指紋庫數(shù)據(jù)土陪,數(shù)據(jù)采集是基于5mx5m的網(wǎng)格。室內(nèi)定位系統(tǒng)每天可以收到8810萬的定位請求肴熏。 本文提出的定位系統(tǒng)獲得了4.56的評分基于41500個投票結(jié)果鬼雀,投票的時間范圍是從2020年1月到2022年3月。為了評估模型的效果作者手動收集4個商場的groundtruth扮超,包括大中小各種類型的商場取刃。并且選擇一個大型和一個中型的商場,跟蘋果比較室內(nèi)的定位結(jié)果出刷。 最終總共收集了31140個參考點(diǎn)進(jìn)行定位評估(參考點(diǎn)的位置璧疗,通過激光測距儀測量當(dāng)前位置與墻等位置的距離,進(jìn)而通過樓層平面圖推測參考點(diǎn)位置)馁龟,其中大商場包括20300個崩侠,中型商場5230個,小型和特殊形狀的商場分別2510個和3100個坷檩。并且對比了不同系列的Iphone手機(jī)和不同品牌的Android手機(jī)却音,商場定位效果如圖9所示。

  • 從下圖9可以看出矢炼,在大型和中型的商場本文提出的室內(nèi)定位系統(tǒng)可以獲得6.12米和6.43米中等誤差定位精度系瓢。本文提出的系統(tǒng)獲得了與蘋果通過人工收集指紋方式(蘋果室內(nèi)定位:https://register.apple.com/resources/indoor/Apple-Indoor-Maps-Program.pdf)差不多的定位精度。在小型和特定形狀的商場句灌,蘋果沒有指紋采集的情況下夷陋,定位效果顯著下降但是本文提出的室內(nèi)定位系統(tǒng)沒有出現(xiàn)顯著的下降欠拾。

    本文室內(nèi)定位系統(tǒng)與iPhone手機(jī)定位效果對比.png

  • 下圖10展示了不同品牌手機(jī)的定位效果對比,從下圖可以看出不同品牌的手機(jī)定位效果沒有顯著的差異骗绕。


    不同品牌手機(jī)的定位結(jié)果.png
  • AP位置估計: 在4個商場中通過名稱匹配的方式藐窄,分別可以獲取1592,288酬土,101和176個AP的位置荆忍,分別各自占比52.8%,51.33%撤缴,47.64%刹枉,39.82%,將這種AP使用綠色點(diǎn)表示腹泌。進(jìn)一步通過近似估計的方案嘶卧,可以估計出1251,237凉袱,84和230個AP的位置芥吟,把這些AP標(biāo)記為紅色。最終有位置的AP的占比分別為94.38%专甩,93.58%钟鸵,87.26%,91.85%涤躲,還有一些沒有估計出位置的AP標(biāo)記為灰色棺耍。

不同類型商場的平面圖.png
  • 中空區(qū)域的處理: 通過使用本文提出的中空區(qū)域處理策略,樓層定位準(zhǔn)確率有了顯著的提升:55.63% -> 98.92%, 56.12% -> 99.31%, 56.75% -> 99.53%, 53.82% -> 98.25%种樱。對應(yīng)四個商場樓層識別混淆矩陣如下圖11所示蒙袍。
樓層識別混淆矩陣.png
  • AP物理位置改變: 在我們長期對兩個大型商場評估的過程中,我們發(fā)現(xiàn)經(jīng)過一年大約19.1%的AP會發(fā)生移動嫩挤,如果不更新指紋庫數(shù)據(jù)的話會導(dǎo)致很大的定位誤差害幅。通過我們提出的用戶反饋的指紋庫更新策略,能夠很好的解決這樣的問題岂昭。從下圖12可以看出如果長期不更新指紋庫數(shù)據(jù)以现,會導(dǎo)致非常大的定位誤差。
指紋庫更新對定位效果的影響.png
  • 多路徑效應(yīng)影響: 本文對工作日和非工作日约啊,不同時間段的定位誤差做了一個詳細(xì)的對比分析邑遏。從圖13我們可以發(fā)現(xiàn),對于不同時間段工作日和非工作日定位誤差差距不是很大恰矩。
不同時間段的定位誤差.png

4.2 辦公樓定位

  • 雖然本文的定位系統(tǒng)在商場獲得了比較好的定位精度(平均約6.82米)记盒,但是在辦公樓定位精度較差。主要的原因還是辦公樓的AP部署比較稀疏外傅,為了進(jìn)一步提高定位精度孽鸡,本文在辦公樓定位結(jié)合了wifi定位和IMU傳感器數(shù)據(jù)蹂午。一般來說信號強(qiáng)度的采集頻率很低在0.0167Hz ~ 0.5Hz之間,但是IMU數(shù)據(jù)的采集頻率一般在100Hz左右彬碱。利用加速度計、陀螺儀和地磁器的傳感器數(shù)據(jù)和PDR算法奥洼,可以大致估計用戶的行走速度巷疼、方向和位移。為了測試融合后的模型效果灵奖,本文測試了10條不同的軌跡嚼沿,長度范圍從50米到150米。50個志愿者分別去走這10條軌跡瓷患,最終的整體表現(xiàn)如圖15a所示骡尽。從圖15a我們可以看到使用IMU數(shù)據(jù),中位數(shù)誤差從9.13米下降到3.79米擅编。并且作者也測試了不同RSSI采集頻率對定位誤差的影響攀细,從圖15b我們可以看出中位數(shù)誤差大概在7.37米,4.76米爱态,3.79米谭贪,3.26米和2.55米,分別對應(yīng)不同的采樣頻率锦担。
辦公樓定位:結(jié)合wifi指紋和IMU數(shù)據(jù).png

4.3 醫(yī)院定位

  • 醫(yī)院定位和商場定位有很大的不同之處:醫(yī)院部署的AP一般比較少俭识,并且大部分AP都不能通過名字和POI進(jìn)行關(guān)聯(lián)。但是醫(yī)院通常會有一些收銀臺洞渔,并且還有自助打印機(jī)供患者打印檢查報告套媚。為了保證更好的支付和服務(wù)通常會部署WIFI ap在附近。最終醫(yī)院的中位數(shù)定位誤差在11.85米磁椒。
某個醫(yī)院第一層平面圖.png

5.結(jié)論

  • 應(yīng)用和服務(wù): 本文的室內(nèi)定位系統(tǒng)可以提供基于位置的廣告堤瘤、打車、外賣服務(wù)衷快。但是在停車場這種場景下宙橱,如何提供室內(nèi)定位服務(wù)具有很大的挑戰(zhàn),因?yàn)閃ifi AP部署的非常少蘸拔。使用方式: 本文提出的室內(nèi)定位系統(tǒng)师郑,提出了三種方式使用定位服務(wù):包括App, SDK, Web RESTful API。

參考資料

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末宝冕,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子邓萨,更是在濱河造成了極大的恐慌地梨,老刑警劉巖菊卷,帶你破解...
    沈念sama閱讀 222,104評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異宝剖,居然都是意外死亡洁闰,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評論 3 399
  • 文/潘曉璐 我一進(jìn)店門万细,熙熙樓的掌柜王于貴愁眉苦臉地迎上來扑眉,“玉大人,你說我怎么就攤上這事赖钞⊙兀” “怎么了?”我有些...
    開封第一講書人閱讀 168,697評論 0 360
  • 文/不壞的土叔 我叫張陵雪营,是天一觀的道長弓千。 經(jīng)常有香客問我,道長献起,這世上最難降的妖魔是什么洋访? 我笑而不...
    開封第一講書人閱讀 59,836評論 1 298
  • 正文 為了忘掉前任,我火速辦了婚禮征唬,結(jié)果婚禮上捌显,老公的妹妹穿的比我還像新娘。我一直安慰自己总寒,他們只是感情好扶歪,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著摄闸,像睡著了一般善镰。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上年枕,一...
    開封第一講書人閱讀 52,441評論 1 310
  • 那天炫欺,我揣著相機(jī)與錄音,去河邊找鬼熏兄。 笑死品洛,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的摩桶。 我是一名探鬼主播桥状,決...
    沈念sama閱讀 40,992評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼硝清!你這毒婦竟也來了辅斟?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,899評論 0 276
  • 序言:老撾萬榮一對情侶失蹤芦拿,失蹤者是張志新(化名)和其女友劉穎士飒,沒想到半個月后查邢,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,457評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡酵幕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評論 3 341
  • 正文 我和宋清朗相戀三年扰藕,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片裙盾。...
    茶點(diǎn)故事閱讀 40,664評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡实胸,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出番官,到底是詐尸還是另有隱情,我是刑警寧澤钢属,帶...
    沈念sama閱讀 36,346評論 5 350
  • 正文 年R本政府宣布徘熔,位于F島的核電站,受9級特大地震影響淆党,放射性物質(zhì)發(fā)生泄漏酷师。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評論 3 334
  • 文/蒙蒙 一染乌、第九天 我趴在偏房一處隱蔽的房頂上張望山孔。 院中可真熱鬧,春花似錦荷憋、人聲如沸台颠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽串前。三九已至,卻和暖如春实蔽,著一層夾襖步出監(jiān)牢的瞬間荡碾,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評論 1 272
  • 我被黑心中介騙來泰國打工局装, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留坛吁,地道東北人。 一個月前我還...
    沈念sama閱讀 49,081評論 3 377
  • 正文 我出身青樓铐尚,卻偏偏與公主長得像拨脉,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子塑径,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評論 2 359

推薦閱讀更多精彩內(nèi)容