학술논문
다중 GPU기반 홀로그램 생성을 위한 병렬처리 성능 최적화 기법
이용수 94
- 영문명
- An Optimization Method for Hologram Generation on Multiple GPU-based Parallel Processing
- 발행기관
- 한국스마트미디어학회
- 저자명
- 국중진(Joongjin Kook)
- 간행물 정보
- 『스마트미디어저널』Vol8, No.2, 1~7쪽, 전체 7쪽
- 주제분류
- 공학 > 컴퓨터학
- 파일형태
- 발행일자
- 2019.05.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
홀로그램의 생성을 위한 연산은 포인트 클라우드의 규모에 따라 연산량이 기하급수적으로 증가하기 때문에 최근에는 다중의 GPU를 기반으로 CUDA 또는 OpenCL 라이브러리를 활용한 병렬처리가 이루어지고 있다. GPU기반의 병렬처리를 위한 CUDA 커널은 GPU의 코어 개수와 메모리 크기를 고려하여 쓰레드(thread), 블록(block), 그리드(grid)를 구성해야 하며, 다중 GPU 환경인 경우 GPU의 개수에 따른 그리드, 블록, 또는 쓰레드 단위의 분산처리가 필요하다. 본 논문에서는 CGH 생성에 대한 성능평가를 위해 포인트 클라우드의 포인트 개수를 10~1,000,000개 범위에서 점진적으로 증가시키면서 CPU, 단일 GPU, 다중 GPU 환경에서 연산 속도를 비교해 보았으며, 다중 GPU 환경에서 CGH(Computer Generated Hologram) 생성 연산을 가속화하기 위한 CUDA 기반의 병렬처리 과정에서 요구되는 메모리 구조 설계와 연산 방법을 제안한다.
영문 초록
Since, the computations for hologram generation increases exponentially according to the size of the point cloud, parallel processing using CUDA and/or OpenCL library is recently performed based on multiple GPUs. The CUDA kernel for parallelization needs to consist of threads, blocks, and grids considering the number of cores and the memory size in the GPU. Also, in case of multiple GPU environments, the distribution in grid-by-grid, in block-by-block, or in thread-by-thread is needed according to the number of GPUs. To evaluate the performance of CGH generation, we compared the computational speed in CPU, in a single GPU, and in multi-GPU environments by gradually increasing the number of points in a point cloud from 10 to 1,000,000. In this paper, we present a memory structure design and a calculation method required in the CUDA-based parallel processing to accelerate the CGH (Computer Generated Hologram) generation operation in multiple GPU environments.
목차
Ⅰ. 서 론
Ⅱ. 관련연구
Ⅲ. CGH 생성을 위한 메모리 구조와 알고리즘
Ⅳ. CGH 생성 성능 평가 및 결론
해당간행물 수록 논문
- 층간소음을 확장음장 관점에서 본 진동체화식의 표상
- 미등록 어휘에 대한 선택적 복사를 적용한 문서 자동요약
- 사용자 편의성 향상을 위한 스마트 단말에서의 워크스코어 어플리케이션 GUI 개발
- 블록체인 프레임워크 기반 IoT 자산관리시스템
- 진동가속도 분석시스템에서 고속푸리에변환을 이용한 기준진동수의 검출 및 감쇠인식
- 사물인식을 위한 딥러닝 모델 선정 플랫폼
- 딥러닝 설명을 위한 슈퍼픽셀 제외·포함 다중스케일 접근법
- 다중 GPU기반 홀로그램 생성을 위한 병렬처리 성능 최적화 기법
- EH-WSN에서 에너지 효율 향상 및 전송지연 축소를 위한 MAC 프로토콜 설계
- 음절 단위 임베딩과 딥러닝 기법을 이용한 복합명사 분해
- Image-to-Image Translation with GAN for Synthetic Data Augmentation in Plant Disease Datasets
- 전술메쉬 트래픽 QoS 조율을 위한 네트워킹 노드의 개념 설계 및 실시간 모니터링
참고문헌
관련논문
공학 > 컴퓨터학분야 BEST
- 청소년들의 스마트폰 중독예방을 위한 이야기치료 집단상담 프로그램 개발
- 지도서비스를 이용한 위치 기반 관광 빅데이터의 시각화
- 틱톡의 숏폼 콘텐츠 특성이 관광지 이미지 및 방문의도에 미치는 영향
공학 > 컴퓨터학분야 NEW
더보기최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!