sumary
Research Objective
In crowd scenarios, predicte trajectory of pedestrains with social behaviors.
擁擠環(huán)境下墨榄,基于社會(huì)行為的行人軌跡預(yù)測(cè)
Backgroud and Problem
- These behaviors have been well investigated by plenty of studies, while it is hard to be fully expressed by hand-craft rules.
這些行為已經(jīng)被之前的工作很好的研究庆猫,然而它難以被手工設(shè)計(jì)的規(guī)則充分表現(xiàn)出來(lái)停局。 - Recent studies based on LSTM networks have shown great ability to learn social behaviors. However, many of these methods rely on previous neighboring hidden states but ignore the important current intention of the neighbors.
最近的一些基于LSTM網(wǎng)絡(luò)的研究展示了學(xué)習(xí)社會(huì)行為的強(qiáng)大的能力稚茅,然而拷邢,這些方法依賴(lài)先前的隱藏狀態(tài),而忽視了最重要的當(dāng)前鄰居的意圖忽洛。
--------------------------------- - In order to address this issue, we propose a data-driven state refinement module for LSTM network (SRLSTM), which activates the utilization of the current intention of neighbors, and jointly and iteratively refines the current states of all participants in the crowd through a message passing mechanism.
為了處理這個(gè)問(wèn)題,我打算設(shè)計(jì)一種SRLSTM網(wǎng)絡(luò)环肘,它進(jìn)行了當(dāng)前鄰居意圖的利用欲虚。
Methods
To effectively extract the social effect of neighbors, we further introduce a social-aware information selection mechanism consisting of an element-wise motion gate and a pedestrian-wise attention to select useful message from neighboring pedestrians.
為了有效率的提取鄰近行人的信息,我們?cè)O(shè)計(jì)了SR模塊悔雹。
- 使用單層感知機(jī)將輸入向量嵌入成32維
- 設(shè)置LSTM隱藏層為64維
- 設(shè)置滑動(dòng)時(shí)間步長(zhǎng)為20欣喧,觀測(cè)8,預(yù)測(cè)12
- min-batch 所有的相同時(shí)間段的行人軌跡
- Adam優(yōu)化器訓(xùn)練300輪 學(xué)習(xí)率設(shè)置為0.001
- SR層基本參數(shù)都設(shè)置好了唆阿,只訓(xùn)練 額外的重定義層
component of model
MG 動(dòng)作檢測(cè)
PA 行人注意力
許多個(gè) 表示重定義層
鄰近區(qū)域的范圍 用超參數(shù)來(lái)進(jìn)行標(biāo)定
(這些都是可以添加的模塊锈锤,其中 MG PA NS=10,L=2,c/p=c效果是最好的)
1.Problem formulation
擁擠環(huán)境下的行人軌跡預(yù)測(cè)
2.V-LSTM
考慮所有行人之間的關(guān)系但是忽略了他們之間的相互作用
3. SR-LSTM
位置距離信息 (學(xué)習(xí)參數(shù))得到 r
r h h 的得到 u 多個(gè)u得到 (阿爾法)
rhh 得到 g 感知門(mén)
Evaluation
Experimental results on two public datasets, i.e. ETH and UCY牙咏,we
achieve state-of-the-art results.
在兩個(gè)公共數(shù)據(jù)集(ETH嘹裂、UCY)上的實(shí)驗(yàn)結(jié)果顯示我們的取得了最好的結(jié)果。
1.Dataset
ETH 和 UCY 包含了豐富的社會(huì)交互信息寄狼,包括五個(gè)數(shù)據(jù)集ETH-univ, ETH-hotel, UCY-zara01,UCY-zara02 and UCY-univ,包含了1536個(gè)行人一共伊磺,和上千條軌跡。
1.Data Processing
- Rela / Nabs 相對(duì)位置移動(dòng) 絕對(duì)位置移動(dòng)
- UEF 幀率校正
- RR 隨機(jī)調(diào)整方向
2.component of model(在網(wǎng)絡(luò)添加一些有效果的模塊)
MG 動(dòng)作檢測(cè)
PA 行人注意力
許多個(gè) 表示重定義層
鄰近區(qū)域的范圍 用超參數(shù)來(lái)進(jìn)行標(biāo)定
(這些都是可以添加的模塊屑埋,其中 MG PA NS=10痰滋,L=2,c/p=c效果是最好的)
(得到最終最好的網(wǎng)絡(luò)模型,與之前的網(wǎng)絡(luò)模型進(jìn)行比較)
3.Evaluation method
leave-one-out
MAD 所有時(shí)間步軌跡偏差的平均值
FAD 最近的一個(gè)點(diǎn)的軌跡偏差
軌跡序列間隔是o.4ms敲街,觀測(cè)步長(zhǎng)是8,預(yù)測(cè)步長(zhǎng)是12
4.Implementation details
超參數(shù)
(得到最優(yōu)的自己的模型)
5. comparison with existing works
Social-LSTM
SGAN
Sophie
V-LSTM
SR-LSTM
message passing:進(jìn)行當(dāng)前狀態(tài)的重新表示
6. Qualitative Results
feature refinement from current state
從當(dāng)前狀態(tài)的特征重定義
7.xxxx
motion gate 感知他和他的鄰近行人之間的隱藏特征信息
Pedestrian-wise attention(這個(gè)行人所注意的是哪些信息)
social-aware information selection mechanism 就是由這兩部分組成的
Conclusion
This result demonstrates the effectiveness of our proposed SR-LSTM.
這個(gè)結(jié)果證明了我們方法的有效性逻恐。
** 當(dāng)前所有行人的隱藏特征 **
我們狀態(tài)細(xì)化模塊進(jìn)行了特征的提取峻黍,它自適應(yīng)的定義當(dāng)前行人們的特征基于信息傳遞機(jī)制, an element-wise motion gate and a pedestrian-wise attention姆涩,選取每個(gè)行人的有用的信息。