본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

음성 인식에서 위상 정보의 활용

이용수 46

영문명
Utilization of Phase Information for Speech Recognition
발행기관
한국전자통신학회
저자명
이창영(Chang-Young Lee)
간행물 정보
『한국전자통신학회 논문지』제10권 제9호, 993~1000쪽, 전체 8쪽
주제분류
공학 > 전자/정보통신공학
파일형태
PDF
발행일자
2015.09.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

MFCC는 음성 신호 처리에서 귀중한 특징 벡터들 중 하나이다. MFCC에서 명백한 결점은 푸리에 변환의 크기를 취함에 의해 위상 정보가 손실된다는 것이다. 이 논문에서 우리는 푸리에 변환의 실수부와 허수부 크기를 따로 취급함으로써 위상 정보를 활용하는 방법을 생각한다. 퍼지 벡터 양자화와 은닉 마코브 모델을 이용한 음성인식에 이 방법을 적용함으로써, 종전 방법에 비해 음성 인식 오류율을 줄일 수 있음을 보인다. 우리는 또한 수치해석을 통하여, FFT의 실수부와 허수부 각각에서 6개의 성분을 취하여 모두 12개의 MFCC 성분을 사용하는 것이 음성인식에 최적임을 보인다.

영문 초록

Mel-Frequency Cepstral Coefficients(: MFCC) is one of the noble feature vectors for speech signal processing. An evident drawback in MFCC is that the phase information is lost by taking the magnitude of the Fourier transform. In this paper, we consider a method of utilizing the phase information by treating the magnitudes of real and imaginary components of FFT separately. By applying this method to speech recognition with FVQ/HMM, the speech recognition error rate is found to decrease compared to the conventional MFCC. By numerical analysis, we show also that the optimal value of MFCC components is 12 which come from 6 real and imaginary components of FFT each.

목차

I. Introduction
II. Review of the MFCC Extraction
III. Utilization of the Phase Information
IV. Experiment
V. Results and Discussion
VI. Conclusion

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이창영(Chang-Young Lee). (2015).음성 인식에서 위상 정보의 활용. 한국전자통신학회 논문지, 10 (9), 993-1000

MLA

이창영(Chang-Young Lee). "음성 인식에서 위상 정보의 활용." 한국전자통신학회 논문지, 10.9(2015): 993-1000

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제