학술논문
Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구
이용수 137
- 영문명
- A Study on Image Generation from Sentence Embedding Applying Self-Attention
- 발행기관
- 한국스마트미디어학회
- 저자명
- 유경호(Kyungho Yu) 노주현(Juhyeon No) 홍택은(Taekeun Hong) 김형주(Hyoungju Kim) 김판구(Pankoo Kim)
- 간행물 정보
- 『스마트미디어저널』Vol10, No.1, 63~69쪽, 전체 7쪽
- 주제분류
- 공학 > 컴퓨터학
- 파일형태
- 발행일자
- 2021.03.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
사람이 어떤 문장을 보고 그 문장에 대해 이해하는 것은 문장 안에서 주요한 단어를 이미지로 연상시켜 그 문장에 대해 이해한다. 이러한 연상과정을 컴퓨터가 할 수 있도록 하는 것을 text-to-image라고 한다. 기존 딥 러닝 기반 text-to-image 모델은 Convolutional Neural Network(CNN)-Long Short Term Memory(LSTM), bi-directional LSTM을 사용하여 텍스트의 특징을 추출하고, GAN에 입력으로 하여 이미지를 생성한다. 기존 text-to-image 모델은 텍스트 특징 추출에서 기본적인 임베딩을 사용하였으며, 여러 모듈을 사용하여 이미지를 생성하므로 학습 시간이 오래 걸린다. 따라서 본 연구에서는 자연어 처리 분야에서 성능 향상을 보인 어텐션 메커니즘(Attention Mechanism)을 문장 임베딩에 사용하여 특징을 추출하고, 추출된 특징을 GAN에 입력하여 이미지를 생성하는 방법을 제안한다. 실험 결과 기존 연구에서 사용되는 모델보다 inception score가 높았으며 육안으로 판단하였을 때 입력된 문장에서 특징을 잘 표현하는 이미지를 생성하였다. 또한, 긴 문장이 입력되었을 때에도 문장을 잘 표현하는 이미지를 생성하였다.
영문 초록
When a person sees a sentence and understands the sentence, the person understands the sentence by reminiscent of the main word in the sentence as an image. Text-to-image is what allows computers to do this associative process. The previous deep learning-based text-to-image model extracts text features using Convolutional Neural Network (CNN)-Long Short Term Memory (LSTM) and bi-directional LSTM, and generates an image by inputting it to the GAN. The previous text-to-image model uses basic embedding in text feature extraction, and it takes a long time to train because images are generated using several modules. Therefore, in this research, we propose a method of extracting features by using the attention mechanism, which has improved performance in the natural language processing field, for sentence embedding, and generating an image by inputting the extracted features into the GAN. As a result of the experiment, the inception score was higher than that of the model used in the previous study, and when judged with the naked eye, an image that expresses the features well in the input sentence was created. In addition, even when a long sentence is input, an image that expresses the sentence well was created.
목차
Ⅰ. 서론
Ⅱ. 관련 연구
Ⅲ. Self-Attention을 적용한 문장으로부터 이미지 생성
Ⅳ. 실험 및 결과 분석
Ⅴ. 결론
키워드
해당간행물 수록 논문
- Out-of-Vocabulary 단어에 강건한 병렬 Tri-LSTM 문장 임베딩을 이용한 감정분석
- 기계학습 분산 환경을 위한 부하 분산 기법
- 실시간 시선 추적기반 스마트 의료기기 고찰
- ELMo 임베딩 기반 문장 중요도를 고려한 중심 문장 추출방법
- 빅데이터 분석능력과 가치가 비즈니스 성과에 미치는 영향
- 광주광역시의 AI 특화분야를 위한 실용적인 접근 사례 제시
- IoT 헬스 데이터 공유를 위한 HFN 기반 권한 관리
- VGGNet을 활용한 석재분류 인공지능 알고리즘 구현
- 사회연결망분석을 활용한 웹 접근성 평가 지표 개발 방향 제안에 대한 연구
- 인공지능 기반 개인 맞춤형 의류 추천 서비스 개발
- 청각장애 운전자의 사용자경험에 기반한 자동차 내 청각정보 유형 분석
- Few-Shot Image Synthesis using Noise-Based Deep Conditional Generative Adversarial Nets
- 대용량 분산 Abyss 스토리지의 CDA (Connected Data Architecture) 기반 AI 서비스의 설계 및 활용
- Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구
참고문헌
관련논문
공학 > 컴퓨터학분야 BEST
- 청소년들의 스마트폰 중독예방을 위한 이야기치료 집단상담 프로그램 개발
- 지도서비스를 이용한 위치 기반 관광 빅데이터의 시각화
- 틱톡의 숏폼 콘텐츠 특성이 관광지 이미지 및 방문의도에 미치는 영향
공학 > 컴퓨터학분야 NEW
- 착용형 증강현실 기반 체험형 콘텐츠 연구
- 스마트미디어저널 Vol13, No.4 목차
- Incorporating BERT-based NLP and Transformer for An Ensemble Model and its Application to Personal Credit Prediction
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!