인간의 감정 인지나 표현은 복합적인 것이 많은데 (예: 화내는 감정은 표정, 목소리, 언어에 모두 영향을 줌) 오디오-비디오가 함께 묶여 있으면서 감성 라벨링이 되어 있는 오픈 데이터셋을 하나 소개합니다.
The Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS) 라고 부르는 데이터셋은 남자12명, 여자12명의 전문 배우가 calm, happy, sad, angry, fearful, surprise, disgust로 주어진 감정 상황에서 발화하는 것을 기록한 오디오-비디오 데이터입니다. 양이 많지는 않지만 (오디오-비디오: 음성 2880 파일 + 노래 2024 파일, 오디오만: 음성 1440 파일, 노래 1012 파일) 향후 감성에 관한 연구에서 활용해 볼 생각입니다.
The Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS)
Citing the RAVDESS
The RAVDESS is released under a Creative Commons Attribution license, so please cite the RAVDESS if it is used in your work in any form. Published academic papers should use the academic paper citation for our PLoS1 paper. Personal works, such as mach…