학술논문
온라인 학습 기반 LDA 모형을 이용한 이미지 주석 군집화에 대한 연구
이용수 29
- 영문명
- Clustering of image annotations using online learning-based LDA model
- 발행기관
- 한국자료분석학회
- 저자명
- 황인옥(Inok Hwang) 김향경(HyangKyung Kim) 이지원(Ji Won Lee) 김성용(Seongyong Kim)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.25 No.2, 537~548쪽, 전체 12쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2023.04.30
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
LDA 모형은 문서집합의 문서 및 단어를 분석하여 잠재 토픽을 파악하고자 이용되는 잠재토픽모형의 하나로, 다양한 분야에서 널리 이용되고 있다. 그러나 Blei, Ng, Jordan(2003)이 처음 제안한 LDA 모형은 전체 데이터를 이용하여 모수를 추정하는 배치학습에 기반하여, 데이터의 크기가 큰 경우 메모리 및 계산속도 등의 문제로 분석이 어려운 한계점이 있다. 이러한 문제를 해결하기 위해 온라인 학습 기반의 LDA 모형이 제안되었는데, 이 방법은 온라인 학습에 기반하며 메모리의 소모가 적고 배치학습보다 분석 속도가 빠른 것으로 알려져 있다. 본 논문에서는 Visual Genome에서 제공하는 10,000개 이상의 이미지에 대한 주석으로 이루어진 문서에 온라인 학습 기반의 LDA 모형을 적용하여 각 이미지의 주제를 파악하고자 한다. 분석을 위해 이미지 주석에 대한 전처리를 수행하였으며, 최적의 모형을 찾기 위해 잠재집단의 수 및 여러 초모수의 다양한 조합을 설정하고, 테스트 데이터로부터 혼잡도 및 동질성 척도를 구하여 다양한 모형을 비교하였다. 분석 결과 10개의 잠재집단을 가진 모형이 최적으로 도출되었으며, 각 집단의 상위단어를 통해 ‘사람’, ‘동물’, ‘도심’, ‘바다’, ‘화장실’, ‘부엌’ 등의 주제를 파악할 수 있었다.
영문 초록
LDA model is one of the latent topic models used to investigate latent topics by analyzing documents and words in corpus, and has been widely used in various fields. However, LDA model proposed by Blei, Ng, Jordan (2003) is based on batch learning, which estimates parameters using whole data at once, which has limitations such as large memory requirement and computation time for large data. To resolve this problems, an online learning-based LDA model has been proposed. This method has been known to consume less memory and have a faster analysis speed than batch learning. In this paper, we investigate the topic of each image by applying an online learning-based LDA model to corpus composed of annotations for more than 10,000 images provided by Visual Genome. For analysis, preprocessing was performed on image annotations. Various combinations of the number of latent topic and several hyper-parameters were set, and measures of perplexity and coherence are compared to find optimal model. As a result of comparison, a model with 10 latent groups was selected, and topics such as ‘human’, ‘animal’, ‘downtown’, ‘sea’, ‘bathroom’, and ‘kitchen’ were derived through the top words of each group.
목차
1. 서론
2. LDA 모형
3. 이미지 주석 분석
4. 결론
References
해당간행물 수록 논문
- 온라인 학습 기반 LDA 모형을 이용한 이미지 주석 군집화에 대한 연구
- BK21 사업단의 연구 성과물에 대한 서울과 지방대학 비교 분석
- 민영화와 효율성
- COVID-19 환자를 간호하는 중환자실 간호사의 소진 영향요인
- 직무도전성이 학습민첩성을 매개로 주관적 경력성공에 미치는 영향
- 효율적인 물류 운송 배차를 위한 최적 프로세스 연구
- 공간자료에 대한 통계적 위험 경계선 결정 방법에 대한 연구
- 공공도서관의 수요특성에 대한 연구
- CNN 기반 주간 위성 이미지를 활용한 격자 단위 인구추정
- 앙상블 비모수적 변수 선택 방법
- 경영컨설턴트의 셀프리더십이 혁신행동에 미치는 영향
- 면적속도 기반 DTW를 이용한 이탈 항적 탐지
- 시험불안, 사회불안이 간호대학생의 섭식 태도에 미치는 영향
- 민영치매보험의 현물급부에 대한 이용 및 이용 의향에 대한 영향요인 분석
- PIN 추정을 위한 최적모형에 관한 연구
- 증권산업의 NCR제도 개정과 회계정보의 가치관련성
- 연속적 간격법의 타당성
- 비정규직의 일자리 이동성 분석
- 정보전이지수를 이용한 원자재가격과 산업별 주식수익률의 연계성에 대한 Covid-19과 러우전쟁의 영향 분석
- 태풍에 따른 기상요소와 사과의 낙과 피해율 분석
- 코스닥 기업의 ESG 활동이 기업 위험에 미치는 영향
- 시뮬레이션 방법에 의한 보조재생함수의 근사
- 미세먼지의 야외 여가활동 수요에 대한 효과
- 기술분석보고서 발간이 주가급락위험에 미치는 영향에 대한 연구
- 금융 분야의 범주 불균형 문제 해결을 위한 성과 최적화 기반의 부스팅 학습
- 은닉 마르코프 모델을 이용한 적응형 학습경로 생성에 관한 연구
- 한국 가계부채의 결정요인에 대한 실증분석
- 결핵 치료 중 사망에 대한 다수준 분석
- 영구적·일시적 현금흐름 뉴스와 할인율 뉴스에 따른 모멘텀 수익률 분석
- 일반학교와 혁신학교 교사의 마을학습 교육과정에 대한 인식 차이
- Journal of The Korean Data Analysis Society (JKDAS) Vol.25 No.2 목차
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!