본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

잠재 디리슈레 분류 모형을 이용한 어플리케이션의 토픽 분류

이용수 13

영문명
Topics Classification of Applications using the Latent Dirichlet Allocation Model
발행기관
한국자료분석학회
저자명
오명섭(Myungsup Oh) 김성관(Sungkwan Kim) 강창완(Changwan Kang) 김규곤(Kyu Kon Kim) 최승배(Seungbae Choi) 전영준(Youngjun Jeon)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.18 No.4, 1895~1903쪽, 전체 9쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2016.08.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

최근 어플리케이션 마켓(application store)에는 아주 많은 수의 앱이 실시간으로 업로드 되고 있다. 이와 같은 상황에서 스마트폰 사용자들의 트렌드 및 사용형태를 분석하는 것은 매우 의미 있다고 볼 수 있다. 그러나 실제 어플리케이션 마켓에 분류되어 있는 토픽(혹은 category)은 실제 어플리케이션 특징과 불일치하거나 매우 한정적으로 등록되어 있어 앱 사용 형태 분석에 어려움을 주고 있다. 특히 매일 많은 수의 어플리케이션들이 마켓에 업로드 되기 때문에 직접 분류를 하는 방법은 현실적으로 한계가 있다. 본 연구에서는 어플리케이션 마켓에 있는 앱 설명글을 이용하여 어플리케이션들을 토픽별로 분류하는 것을 목적으로 한다. 사용한 분류방법은 토픽분석의 대표적 모델인 잠재 디리슈레 분류(latent Dirichlet allocation, LDA) 모형을 사용하였다. 본 연구에서 사용한 데이터는 구글 플레이 마켓(Google play store)에 있는 각 어플리케이션의 설명글을 크롤링 했으며 분석데이터는 사용빈도가 높은 상위 5,000개의 단어들로 구성된 텍스트데이터이다. LDA 모형적용 결과 50개 토픽별 주제어(keyword)를 분류하였고 7,776개 어플리케이션들을 50개 토픽별로 할당하였다. 또한 50개 토픽들을 3개의 그룹으로 군집화하여 그 특징을 살펴보았다.

영문 초록

Recently, a lot of applications are uploaded at application store in real time. For marketers, analysis for smartphone users s trend is a very meaningful work. But the topics in applications store are mismatched their characteristics and then there are many problems in analysing app users behaviors. Specially, as many applications are uploaded every day, the classification of applications is a hard work. In this study, we crawl the app descriptions of Google play store and classify the applications by topics using latent Dirichlet allocation (LDA) model. As results of fitting LDA, we discriminate 7,776 applications into 50 topics.

목차

1. 서론
2. 잠재 디리슈레 분류 모형
3. 사례분석
4. 결론
Reference

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

오명섭(Myungsup Oh),김성관(Sungkwan Kim),강창완(Changwan Kang),김규곤(Kyu Kon Kim),최승배(Seungbae Choi),전영준(Youngjun Jeon). (2016).잠재 디리슈레 분류 모형을 이용한 어플리케이션의 토픽 분류. Journal of The Korean Data Analysis Society (JKDAS), 18 (4), 1895-1903

MLA

오명섭(Myungsup Oh),김성관(Sungkwan Kim),강창완(Changwan Kang),김규곤(Kyu Kon Kim),최승배(Seungbae Choi),전영준(Youngjun Jeon). "잠재 디리슈레 분류 모형을 이용한 어플리케이션의 토픽 분류." Journal of The Korean Data Analysis Society (JKDAS), 18.4(2016): 1895-1903

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제