학술논문
트랜스포머 기반의 다중 시점 3차원 인체자세추정
이용수 42
- 영문명
- Multi-View 3D Human Pose Estimation Based on Transformer
- 발행기관
- 한국스마트미디어학회
- 저자명
- 최승욱(Seoung Wook Choi) 이진영(Jin Young Lee) 김계영(Gye Young Kim)
- 간행물 정보
- 『스마트미디어저널』Vol12, No.11, 48~56쪽, 전체 9쪽
- 주제분류
- 공학 > 컴퓨터학
- 파일형태
- 발행일자
- 2023.12.31
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
3차원 인체자세추정은 스포츠, 동작인식, 영상매체의 특수효과 등의 분야에서 널리 활용되고 있는 기술이다. 이를 위한 여러 방법들 중 다중 시점 3차원 인체자세추정은 현실의 복잡한 환경에서도 정밀한 추정을 하기 위해 필수적인 방법이다. 하지만 기존 다중 시점 3차원 인체자세추정 모델들은 3차원 특징 맵을 사용함에 따라 시간 복잡도가 높은 단점이 있다. 본 논문은 계산 복잡도가 적은 트랜스포머 기반 기존 단안 시점 다중 프레임 모델을 다중 시점에 대한 3차원 인체자세추정으로 확장하는 방법을 제안한다. 다중 시점으로 확장하기 위하여 먼저 2차원 인체자세 검출자 CPN(Cascaded Pyramid Network)을 활용하여 획득한 4개 시점의 17가지 관절에 대한 2차원 관절좌표를 연결한 8차원 관절좌표를 생성한다. 그 다음 이들을 패치 임베딩 한 뒤 17×32 데이터로 변환하여 트랜스포머 모델에 입력한다. 마지막으로, 인체자세를 출력하는 MLP(Multi-Layer Perceptron) 블록을 매 반복 마다 사용한다. 이를 통해 4개 시점에 대한 3차원 인체자세추정을 동시에 수정한다. 입력 프레임 길이 27을 사용한 Zheng[5]의 방법과 비교했을 때 제안한 방법의 모델 매개변수의 수는 48.9%, MPJPE(Mean Per Joint Position Error)는 20.6mm(43.8%) 감소했으며, 학습 횟수 당 평균 학습 소요 시간은 20배 이상 빠르다.
영문 초록
The technology of Three-dimensional human posture estimation is used in sports, motion recognition, and special effects of video media. Among various methods for this, multi-view 3D human pose estimation is essential for precise estimation even in complex real-world environments. But Existing models for multi-view 3D human posture estimation have the disadvantage of high order of time complexity as they use 3D feature maps. This paper proposes a method to extend an existing monocular viewpoint multi-frame model based on Transformer with lower time complexity to 3D human posture estimation for multi-viewpoints. To expand to multi-viewpoints our proposed method first generates an 8-dimensional joint coordinate that connects 2-dimensional joint coordinates for 17 joints at 4-vieiwpoints acquired using the 2-dimensional human posture detector, CPN(Cascaded Pyramid Network). This paper then converts them into 17×32 data with patch embedding, and enters the data into a transformer model, finally. Consequently, the MLP(Multi-Layer Perceptron) block that outputs the 3D-human posture simultaneously updates the 3D human posture estimation for 4-viewpoints at every iteration. Compared to Zheng[5]'s method the number of model parameters of the proposed method was 48.9%, MPJPE(Mean Per Joint Position Error) was reduced by 20.6 mm (43.8%) and the average learning time per epoch was more than 20 times faster.
목차
Ⅰ. 서론
Ⅱ. 입력 데이터 전처리
Ⅲ. 다중 시점 3차원 인체자세추정
Ⅳ. 실험 및 결과
Ⅴ. 결론 및 향후 연구
REFERENCES
키워드
해당간행물 수록 논문
- 스마트미디어저널 Vol12, No.11 목차
- 지하공간 BIM 기반 발파진동 영향 시각화 기술
- 소프트 보팅을 이용한 합성곱 오토인코더 기반 스트레스 탐지
- 정부24 앱 사용자 리뷰 분석을 통한 문제 파악 및 개선방안
- Prophet와 GRU을 이용하여 단중기 전력소비량 예측
- 시내버스 승하차 의도분석 기반 사고방지 AI 시스템 연구
- ICS 사이버 공격 탐지를 위한 딥러닝 전처리 방법 연구
- 트랜스포머 기반의 다중 시점 3차원 인체자세추정
- 가상 인플루언서의 매력성과 소비자 태도의 관계: 몰입의 매개효과 검증
- 5G 및 B5G 네트워크에서 그래프 신경망 및 강화학습 기반 최적의 VNE 기법
- Insights for Improving Road Safety:Focusing on Vehicle Accidents in Daegu Metropolitan City
- Forecasting Fish Import Using Deep Learning: A Comprehensive Analysis of Two Different Fish Varieties in South Korea
- 대화문 재구조화를 통한 한국어 대화문 요약
- 충전 특성과 어텐션 기반 LSTM을 활용한 개선된 리튬이온 배터리 SOH 예측 모델
- 건설기술정보 제공물량의 만족도 및 사용 가치 간의 관계 분석
- Detection of Traditional Costumes: A Computer Vision Approach
- 파일 공유를 지원하는 분산 저장 시스템에서 실시간 비디오 재생 기법
- 뷰티 SNS 마케팅과 브랜드 이미지 및 중국 여성 소비자의 브랜드 태도 간의 관계
- 텍스트 마이닝과 네트워크 이론을 활용한 권역별 국가하천 점용허가 키워드 분석
- ERG 이론을 바탕으로 한 바이마장족(白马藏族)지역사회 환경 의 고령친화적 개선 방안 연구
- 온라인 협업의 수렴과정 개선을 위한 온라인 화이트보드 툴 콘셉트 제안
- 쉬저우(徐州) 지엔즈(剪紙) 문양(紋樣)의 문화 창작물 제품 디자인 적용에 관한 연구
참고문헌
관련논문
공학 > 컴퓨터학분야 BEST
- 지도서비스를 이용한 위치 기반 관광 빅데이터의 시각화
- 청소년들의 스마트폰 중독예방을 위한 이야기치료 집단상담 프로그램 개발
- 공서비스 공급 관점에서 살펴본 비의료 건강관리서비스 인증 시범사업과 의료민영화 논쟁
공학 > 컴퓨터학분야 NEW
- 스마트미디어저널 제14권 제2호 목차
- A Study on Dataset Development and Model Vulnerability to Backdoors
- Ransomware Detection Using Deep Q-Network and L2PGD Attack Analysis on a Custom Dataset
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
