학술논문
안전하고 효과적인 자율주행을 위한 불확실성 순차 모델링
이용수 46
- 영문명
- Uncertainty Sequence Modeling Approach for Safe and Effective Autonomous Driving
- 발행기관
- 한국스마트미디어학회
- 저자명
- 윤재웅 이주홍
- 간행물 정보
- 『스마트미디어저널』Vol11, No.9, 9~20쪽, 전체 12쪽
- 주제분류
- 공학 > 컴퓨터학
- 파일형태
- 발행일자
- 2022.10.31
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
심층강화학습은 자율주행 도메인에서 널리 사용되는 end-to-end 데이터 기반 제어 방법이다. 그러나 기존의 강화학습 접근 방식은 자율주행 과제에 적용하기에는 비효율성, 불안정성, 불확실성 등의 문제로 어려움이 존재한다. 이러한 문제들은 자율주행 도메인에서 중요하게 작용한다. 최근의 연구들은 이런 문제를 해결하고자 많은 시도가 이루어지고 있지만 계산 비용이 많고 특별한 가정에 의존한다. 본 논문에서는 자율주행 도메인에 불확실성 순차 모델링이라는 방법을 도입하여 비효율성, 불안정성, 불확실성을 모두 고려한 새로운 알고리즘 MCDT를 제안한다. 강화학습을 높은 보상을 얻기 위한 의사 결정 생성 문제로 바라보는 순차 모델링 방식은 기존 연구의 단점을 회피하고 효율성과 안정성을 보장하며, 여기에 불확실성 추정 기법을 융합해 안전성까지 고려한다. 제안 방법은 OpenAI Gym CarRacing 환경을 통해 실험하였고 실험 결과는 MCDT 알고리즘이 기존의 강화학습 방법에 비해 효율적이고 안정적이며 안전한 성능을 내는 것을 보인다.
영문 초록
Deep reinforcement learning(RL) is an end-to-end data-driven control method that is widely used in the autonomous driving domain. However, conventional RL approaches have difficulties in applying it to autonomous driving tasks due to problems such as inefficiency, instability, and uncertainty. These issues play an important role in the autonomous driving domain. Although recent studies have attempted to solve these problems, they are computationally expensive and rely on special assumptions. In this paper, we propose a new algorithm MCDT that considers inefficiency, instability, and uncertainty by introducing a method called uncertainty sequence modeling to autonomous driving domain. The sequence modeling method, which views reinforcement learning as a decision making generation problem to obtain high rewards, avoids the disadvantages of exiting studies and guarantees efficiency, stability and also considers safety by integrating uncertainty estimation techniques. The proposed method was tested in the OpenAI Gym CarRacing environment, and the experimental results show that the MCDT algorithm provides efficient, stable and safe performance compared to the existing reinforcement learning method.
목차
Ⅰ. 서론
Ⅱ. 관련 연구
Ⅲ. 연구 동기 및 제안 방법
Ⅳ. 실험 방법 및 결과
Ⅴ. 결론
REFERENCES
키워드
해당간행물 수록 논문
- Design of an efficient routing algorithm on the WK-recursive network
- Unity Engine 기반 수중 로봇 3차원 포지셔닝 프로그램 구현
- UV LED의 광효율 및 방열성능 향상을 위한 new packaging 특성 연구
- 작업자의 안전관리를 위한 웨어러블 산소포화도 측정 플랫폼
- AI기반 스마트 수질환경관리 서비스 플랫폼 개발
- 혼합현실 컨트롤에 최적화된 인터랙션을 위한 손 동작과 컨트롤 방식 Matching체계의 제안
- 머신비전 기반의 가전제품 표면결함 자동검출 시스템
- 안전하고 효과적인 자율주행을 위한 불확실성 순차 모델링
- 3차원 환경 복원을 위한 다수 카메라 최적 배치 학습 기법
- 스마트미디어저널 Vol11, No.9 목차
참고문헌
관련논문
공학 > 컴퓨터학분야 BEST
- 지도서비스를 이용한 위치 기반 관광 빅데이터의 시각화
- 청소년들의 스마트폰 중독예방을 위한 이야기치료 집단상담 프로그램 개발
- 공서비스 공급 관점에서 살펴본 비의료 건강관리서비스 인증 시범사업과 의료민영화 논쟁
공학 > 컴퓨터학분야 NEW
- 스마트미디어저널 제14권 제2호 목차
- A Study on Dataset Development and Model Vulnerability to Backdoors
- Ransomware Detection Using Deep Q-Network and L2PGD Attack Analysis on a Custom Dataset
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
