학술논문
Bi-LSTM 모델을 이용한 음악 생성 시계열 예측
이용수 41
- 영문명
- Prediction of Music Generation on Time Series Using Bi-LSTM Model
- 발행기관
- 한국스마트미디어학회
- 저자명
- 김광진 이칠우
- 간행물 정보
- 『스마트미디어저널』Vol11, No.10, 65~75쪽, 전체 11쪽
- 주제분류
- 공학 > 컴퓨터학
- 파일형태
- 발행일자
- 2022.11.30
4,120원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델( Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.
영문 초록
Deep learning is used as a creative tool that could overcome the limitations of existing analysis models and generate various types of results such as text, image, and music. In this paper, we propose a method necessary to preprocess audio data using the Niko's MIDI Pack sound source file as a data set and to generate music using Bi-LSTM. Based on the generated root note, the hidden layers are composed of multi-layers to create a new note suitable for the musical composition, and an attention mechanism is applied to the output gate of the decoder to apply the weight of the factors that affect the data input from the encoder. Setting variables such as loss function and optimization method are applied as parameters for improving the LSTM model. The proposed model is a multi-channel Bi-LSTM with attention that applies notes pitch generated from separating treble clef and bass clef, length of notes, rests, length of rests, and chords to improve the efficiency and prediction of MIDI deep learning process. The results of the learning generate a sound that matches the development of music scale distinct from noise, and we are aiming to contribute to generating a harmonistic stable music.
목차
Ⅰ. 서론
Ⅱ. 본론
Ⅲ. 다층 Bi-LSTM에 의한 음원 인식
Ⅳ. 결론
REFERENCES
키워드
해당간행물 수록 논문
- Bi-LSTM 모델을 이용한 음악 생성 시계열 예측
- 다크웹 환경에서 산업기술 유출 탐지 시스템
- 디지털 소외계층을 위한 지능형 IoT 애플리케이션의 공개 API 기반 대화형 음성 상호작용 기법
- ESG-oriented Governance Work System for Smart Highway Implementation
- 텍스트마이닝을 활용한 빅데이터 기반의 디지털 트랜스포메이션 연구동향 파악
- 개인정보의 위임 제공 및 데이터 기밀성을 보장하는 블록체인에 제공 정보의 저장
- 소셜미디어를 통한 직원의 기업전망 평가와 고용증가와의 상관성
- 대한소아치과학회 연차총회에서 발표된 구술 및 포스터 초록의 출판률 변화
- InferSent를 활용한 오픈 도메인 기계독해
- 스마트미디어저널 Vol11, No.10 목차
참고문헌
관련논문
공학 > 컴퓨터학분야 BEST
- 청소년들의 스마트폰 중독예방을 위한 이야기치료 집단상담 프로그램 개발
- 지도서비스를 이용한 위치 기반 관광 빅데이터의 시각화
- 틱톡의 숏폼 콘텐츠 특성이 관광지 이미지 및 방문의도에 미치는 영향
공학 > 컴퓨터학분야 NEW
더보기최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!