학술논문
AWS DeepRacer를 활용한 강화학습 알고리즘의 성능 평가 및 실제 트랙 검증
이용수 9
- 영문명
- Performance Evaluation and Actual Track Verification of Reinforcement Learning Algorithms Using the AWS DeepRacer
- 발행기관
- 한국산업기술융합학회(구. 산업기술교육훈련학회)
- 저자명
- 우지원(Ji-Won Woo) 한상욱(Sangwook Han) 이상록(Sangrok Lee)
- 간행물 정보
- 『산업기술연구논문지』제29권 3호, 1~9쪽, 전체 9쪽
- 주제분류
- 공학 > 산업공학
- 파일형태
- 발행일자
- 2024.09.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 논문에서는 AWS 딥레이서를 활용하여 다양한 주행 환경에서 PPO와 SAC 강화학습 알고리즘의 성능을 평가하고 분석하였다. 강화학습 알고리즘의 성능에 영향을 미치는 요소들은 주행 트랙의 복잡성, 최대 주행 속도, 그리고 보상함수 등을 고려하였다. 단순한 트랙에서 최대 주행 속도가 1.5m/s에서는 PPO 알고리즘이 SAC 알고 리즘보다 적은 훈련시간으로 학습이 가능하지만, SAC 알고리즘이 PPO 알고리즘에 비해 보다 정확하게 중앙선을 따라 주행한다. 주행 속도가 2.5m/s로 빨라지거나, 주행 트랙이 복잡해지면 PPO 알고리즘은 훈련시간이 증가하더 라도 트랙을 완주하지만, SAC 알고리즘은 학습시간이 부족하여 완주하지 못하였다. 이같은 시뮬레이션 결과를 검증하기 위해 실제 트랙을 구현하고, 실물 딥레이서 차량에 학습한 모델을 적용하였다. 결과적으로 실제 트랙에서 시뮬레이션 결과와 유사하게 안정적으로 자율 주행이 가능함을 확인하였다.
영문 초록
This study evaluated and analyzed the performance of the PPO and SAC reinforcement learning algorithms in various driving environments using the AWS DeepRacer. Factors affecting the performance of the reinforcement learning algorithm include the complexity of the driving track, maximum speed, and reward function. The PPO algorithm can be learned with less training time than the SAC algorithm at a maximum speed of 1.5 m/s on asimple track. , the SAC algorithm drives along the centerline more accurately than the PPO algorithm. When the maximum speed is 2.5 m/s or the driving track is complex, the PPO algorithm can complete the track even if the training time increases; in contrast, the SAC algorithm cannot complete the track owing to insufficient learning time. To verify the simulation results, we implemented an actual trackand uploaded the simulation model to a DeepRacer vehicle. The experimental confirmed that stable autonomous driving was possible on an actual track, similar to the simulation results.
목차
Ⅰ. 서 론
Ⅱ. 실험 환경
Ⅲ. 시뮬레이션 성능 분석
Ⅳ. 실제 주행 트랙 검증
Ⅴ. 결 론
References
해당간행물 수록 논문
- 산업기술연구논문지 제29권 3호 목차
- 조직 양면성과 직원몰입에 대한 창발적 리더십의 효과
- 페길화에 의한 재조합 산화환원 조절단백-1의 환원력 유지 최적화
- 보 단부에 철판을 매립한 PC 콘크리트 보의 실험연구
- 선삭 가공 공정에서 절삭력에 미치는 영향에 대한 실험계획법을 이용한 가공성 평가
- 조선용 B Gr. 강의 용접부 미세조직과 기계적 성질에 미치는 용접기법의 영향
- 열화율 기반 태양광 발전량 예측 머신러닝 모델 개발
- 병렬 운전을 통한 4kW급 인공위성용 아날로그 LLC 공진형 컨버터 개발
- 디지털 플랫폼 기반 패션기업의 성공 요인 연구 : B2C 공급망 전략 측면
- 계통연계형 PV(Photovoltaic) 설계 및 과도상태 특성 연구
- 딥러닝 기반의 주차 층수 탐지 애플리케이션의 개발
- 반도체 장비 교육을 위한 PLC기반 PID제어 가상 시스템 개발 및 구현에 관한 연구
- 자율주행 자동차의 주행을 위한 딥러닝 모델 연구
- 매립지 침출수 처리에서 질산화 공정 최적화 : pH 및 무기탄소원농도가 질소 제거에 미치는 영향
- M&A기업에서의 컬처덱을 통한 기업문화 정립에 관한 실행연구
- AWS DeepRacer를 활용한 강화학습 알고리즘의 성능 평가 및 실제 트랙 검증
- 자계 이방성 축 방향에 따른 안테나 공진 주파수 특성
- 텍스트 분할을 적용한 KoBART 기반의 실시간 장문 뉴스 요약 시스템 구현
- 다이나믹어포던스와 디지털파라메트릭 융합디자인 연구 - 공기 청정기 홀커버 디자인을 중심으로
- Estimating the Position of Logistics Management Robots Using a Modified Monte Carlo Algorithm
- 산업기술연구논문지 제29권 3호 목차
- Predicting Osteoporosis Prevalence Based on Ambient-Air Pollution Using Artificial Intelligence
- Integrating English Language Learning into Vocational Training at Korea Polytechnics
- Comparison of Changes in Obesity-Related Factors in C57BL/6N Mice Induced by High-Fat Diet or High-Fat Diet with Fructose Water
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!