题目:暂且未定,先借用前辈的【使用强化学习来决定中间目标的机器人行走路径诱导】
要求:研读前辈们写的论文,在他们的基础上,更进一步或者提出新的观点方法
所有东西都是只考虑2D形式的,
本研究
本研究
図2 目標とするシステムの流れ
図2 目標とするシステムの流れ
大约就是如图的样子,机器人可以避开障碍物到达终点
地图是提前准备好了的,需要开发一个诱导行走的算法
前辈研究内容中采用了Helbing论文的步行者模型,加上自己提出了中间目标这个概念,另一个前辈在这个基础上增加了通过不同中间目标的顺序来选择最效率的路径。这个前辈采用了强化学习来得到通过不同中间目标的顺序来选择最效率的路径
语言的话c,python都行
进度:4月到7月研究前辈论文,思考自己做什么,7月前写一个大致规划(2页左右,稍微解释下自己打算用什么做什么等等)
参考资料:
有英文的,日文的我可以翻译,都是前辈写的论文
Helbing,Farkas,and Vicsek:“Simulation dynamical features of escape panic”, Nature 407,pp.487-490,2000