학술논문
차분 특징을 이용한 평균-교사 모델의 음향 이벤트 검출 성능 향상
이용수 25
- 영문명
- Performance Improvement of Mean-Teacher Models in Audio Event Detection Using Derivative Features
- 발행기관
- 한국전자통신학회
- 저자명
- 곽진열(Jin-Yeol Kwak) 정용주(Yong-Joo Chung)
- 간행물 정보
- 『한국전자통신학회 논문지』제16권 제3호, 401~406쪽, 전체 6쪽
- 주제분류
- 공학 > 전자/정보통신공학
- 파일형태
- 발행일자
- 2021.06.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
최근 들어, 음향 이벤트 검출을 위하여 CRNN(: Convolutional Recurrent Neural Network) 구조에 기반 한 평균-교사 모델이 대표적으로 사용되고 있다. 평균-교사 모델은 두 개의 병렬 형태의 CRNN을 가진 구조이며, 이들의 출력들의 일치성을 학습 기준으로 사용함으로서 약-전사 레이블(label)과 비-전사 레이블 음향 데이터에 대해서도 효과적인 학습이 가능하다. 본 연구에서는 최신의 평균-교사 모델에 로그-멜 스펙트럼에 대한 차분 특징을 추가적으로 사용함으로서 보다 나은 성능을 이루고자 하였다. DCASE 2018/2019 Challenge Task 4용 학습 및 테스트 데이터를 이용한 음향 이벤트 검출 실험에서 제안된 차분특징을 이용한 평균-교사모델은 기존의 방식에 비해서 최대 8.1%의 상대적 ER(: Error Rate)의 향상을 얻을 수 있었다.
영문 초록
Recently, mean-teacher models based on convolutional recurrent neural networks are popularly used in audio event detection. The mean-teacher model is an architecture that consists of two parallel CRNNs and it is possible to train them effectively on the weakly-labelled and unlabeled audio data by using the consistency learning metric at the output of the two neural networks. In this study, we tried to improve the performance of the mean-teacher model by using additional derivative features of the log-mel spectrum. In the audio event detection experiments using the training and test data from the Task 4 of the DCASE 2018/2019 Challenges, we could obtain maximally a 8.1% relative decrease in the ER(Error Rate) in the mean-teacher model using proposed derivative features.
목차
Ⅰ. 서론
Ⅱ. 특징 추출
Ⅲ. 뉴럴네트워크 구조
Ⅳ. 실험결과
Ⅴ. 결론
키워드
해당간행물 수록 논문
- 차분 특징을 이용한 평균-교사 모델의 음향 이벤트 검출 성능 향상
- 시간영역 비교기를 이용한 ZQ 보정회로 설계
- RF파워가 SiO2/PES 기판위에 증착한 ITZO 박막의 광학적 및 전기적 특성에 미치는 효과
- 유리차수 적분을 이용한 전동기 속도제어
- 센서 및 MCU기반 지능형 환기창 빅데이터전송용 시스템 안정화에 관한 연구
- 삼중 상관 정보원에서 SIC 대한 non-SIC 비직교 다중 접속의 확장 전송률 용적에 관해
- LiDAR 센서 활용 객체 인식기술이 적용된 농업용 자율주행 이송 로봇 개발
- 복합 연자성 소재의 전동기 코어손실 예측을 위한 실험적 분석
- 포복경 영양 번식 최적화 알고리즘 기반 태양전지 최대 전력 점 추적에 관한 연구
- 해수면 높이와 해수면 온도 자료를 이용한 동아시아 해역의 패턴 분석
- DRAM 커패시터의 질화막 내산화성 평가에 관한 연구
- 대칭 1차원 5-이웃 CA 기반의 키 수열 생성기 설계
- 음성 통계 모형에 따른 음성 왜곡량 감소를 위한 비선형 음성강조법
- 능동위상배열안테나의 적응형 패턴 널 형성에 관한 연구
- 버섯재배 무균 생육환경 조성을 위한 스마트팜 통합제어 시스템
- 외란 관측기 기반의 이산시간 전동기 추종제어
- Portable ESS를 위한 4kW급 인버터 설계
- 50kW 풍력블레이드 설계에 관한 연구
- 5GHz 대역의 무선랜 통신을 위한 광대역 패치 안테나
- UHF 레이더 자료의 품질 평가
- 인공지능 기반 영어 발음 인식에 관한 연구
- 우주 인증용 대전자전중계기의 전원공급기 설계 및 구현에 대한 연구
- 무인항공기를 이용한 야적퇴비 적재량 산정 정확도 평가
- 지게차 전도 방지를 위한 시뮬레이터 설계
- UHF 윈드프로파일러 레이더의 펄스 해상도에 따른 풍속의 정확성 평가
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!