학술논문
스펙트로그램을 이용한 CNN 음성인식 모델
이용수 16
- 영문명
- Speech Recognition Model Based on CNN using Spectrogram
- 발행기관
- 한국전자통신학회
- 저자명
- 정원석(Won-Seog Jeong) 이행우(Haeng-Woo Lee)
- 간행물 정보
- 『한국전자통신학회 논문지』제19권 제4호, 685~692쪽, 전체 8쪽
- 주제분류
- 공학 > 전자/정보통신공학
- 파일형태
- 발행일자
- 2024.08.31
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 논문에서는 명령어 음성신호의 인식 성능을 개선하기 위한 새로운 합성곱 신경망(CNN: Convolutional Neural Network) 모델을 제안한다. 이 방법은 입력신호의 단구간 푸리에 변환(STFT: Short-Time Fourier Transform) 후 스펙트로그램 이미지를 구하고 CNN 모델을 이용한 지도학습을 통하여 명령어 인식 성능을 개선하였다. 입력신호를 단시간 구간별로 푸리에 변환한 다음 스펙트로그램 이미지를 구하고 CNN 딥러닝 모델을 이용하여 다중 분류 학습을 수행한다. 이는 시간영역 음성신호를 특성이 잘 표현되도록 주파수영역으로 변환하고 변환 파라미터에 대한 스펙트로그램 이미지를 이용하여 딥러닝 훈련을 수행함으로써 명령어를 효과적으로 분류한다. 본 연구에서 제안한 음성인식시스템의 성능을 검증하기 위하여 Tensorflow와 Keras 라이브러리를 사용한 시뮬레이션 프로그램을 작성하고 모의실험을 수행하였다. 실험 결과, 제안한 심층학습 알고리즘을 이용하면 92.5%의 정확도를 얻을 수 있는 것으로 확인되었다.
영문 초록
In this paper, we propose a new CNN model to improve the recognition performance of command voice signals. This method obtains a spectrogram image after performing a short-time Fourier transform (STFT) of the input signal and improves command recognition performance through supervised learning using a CNN model. After Fourier transforming the input signal for each short-time section, a spectrogram image is obtained and multi-classification learning is performed using a CNN deep learning model. This effectively classifies commands by converting the time domain voice signal to the frequency domain to express the characteristics well and performing deep learning training using the spectrogram image for the conversion parameters. To verify the performance of the speech recognition system proposed in this study, a simulation program using Tensorflow and Keras libraries was created and a simulation experiment was performed. As a result of the experiment, it was confirmed that an accuracy of 92.5% could be obtained using the proposed deep learning algorithm.
목차
Ⅰ. 서 론
Ⅱ. 스펙트로그램과 CNN 모델
Ⅲ. 딥러닝 명령어 분류시스템
Ⅳ. 모의실험 및 분석
Ⅴ. 결 론
References
키워드
해당간행물 수록 논문
- 한국전자통신학회 논문지 제19권 제4호 목차
- 리튬이온 배터리의 화재 시험을 통한 열 전달 메커니즘 및 손상 평가
- 육상 양식장 빅데이터 분석 시스템 개발을 위한 데이터 시각화 도구 개발
- 테이퍼된 스트립 선로로 급전된 광대역 프린트 1X2 다이폴 배열 안테나
- RS-422 통신과 임베디드 프로세서를 이용한 무장 조종간의 설계 및 평가
- 연속 이중 폐쇄 루프 완전 제어 전략 기반 직접 구동 풍력 전력망 연결 시스템 연구
- 철도산업에서 AI기반 예측 유지보수를 위한 사례 연구 및 시사점
- 한국어 생의학 개체명 인식 성능 비교와 오류 분석
- 생성형 인공지능(Generative AI)에 대한 지각된 가치와 지속이용의도 결정요인 탐색
- 합성곱 신경망을 이용한 종 수준의 동물플랑크톤 분류기 및 시각화
- 재가노인의 MCI예방을 위한 AI,메타버스와 재활운동 융합적 기대효과
- 정보보안 기술 스트레스와 조직 공정성이 준수 의도에 미치는 영향: 계획된 행동이론을 중심으로
- 사물 인터넷 기반의 스마트 터널 사고 경보 시스템
- AI 및 IoT 기반 스마트팜 병충해 예측시스템 개발: YOLOv5 및 Isolation Forest 모델 적용 연구
- 압력 및 가속도 센서를 활용한 운동 자세 교정 시스템
- 고추 작물의 정밀 질병 진단을 위한 딥러닝 모델 통합 연구: YOLOv8, ResNet50, Faster R-CNN의 성능 분석
- 비대칭 환경에서 듀얼홉 통신시스템의 자원할당 성능분석
- 가변 입력 전압 조건하에서 태양광 시스템 적용을 위한 승압형 DC-DC 컨버터 연구
- 스펙트로그램을 이용한 CNN 음성인식 모델
참고문헌
관련논문
공학 > 전자/정보통신공학분야 BEST
더보기공학 > 전자/정보통신공학분야 NEW
- 한국전자통신학회 논문지 제19권 제5호 목차
- WSN에서의 효율적 라우팅을 위한 에너지 기반 PEGASIS 프로토콜
- 분할 빔 기반 이중 빔 형성을 위한 반사배열안테나 시스템의 위상 가중치에 관한 연구
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!