본문 바로가기

Airsim/Vision기반 충돌 회피(1)

[충돌회피-1]프로젝트 시작 및 참고 논문

가을학기 대학원 입학전 교수님에게 미리 연구실 생활을 하고싶다하여 7월부터 연구실 생활을 하게되었다.

연구 주제가 강화학습 기반 충돌회피 및 path planning이다 보니 강화학습 공부하면서 토이 프로젝트로

Airsim에서 구현을 해보라는 사수형님의 제안에 프로젝트를 시작하게 되었다. 

 

내가 필력이 그렇게 좋은것은 아니지만 이렇게 블로그에 내가 햇던 과정들을 기록하는게 나중에 연구를 하거나 

논문을 쓸때 도움이 될거같아 기록을 남긴다. 또한 글을 적으면서 그때 생각했던 것도 같이 적을거라 사담이 들어갈거같다. 


처음에는 강화학습만 2주 가량 공부하다가 박사과정 선배님이 주신 충돌회피 관련 논문중 가장 맘에 드는 아래 논문을

참고하였다. 참고 논문:Smooth Trajectory Collision Avoidance through Deep Reinforcement Learning

 

논문 선택 이유:(자세한 이유는 논문을 보면 나와있다.)

1.trajectory smooth 에대한 reward가 있다는 것 (학습이 빨리 될거같다)

 

2. unit vector를 사용한다. 

 

3.reward function이 매우 자세하고 직관적이다. 

 

4.shallow depth image를 사용하여 model generalization에 도움이 됨

 

논문을 notion에 정리하였지만 아직 보완해야할 부분들이 있어 나중에 프로젝트가 종료되면 올리겠다.

 

선배들도 내가 고른 논문이 toy project로 정말 괜찮다고 하셔서 공부용으로 한번 시도해보는거 괜찮을거같다.

 

다음부터는 드론 agent를 코딩 할것이다.