🫠基于语音的情感分析系统,详细代码在GitHub:https://github.com/L-mj0
0x01数据处理
这里我们使用的是RAVDESS数据集Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS)
,以及CREMA-D
关于数据集1
- RAVDESS 的这一部分包含 1440 个文件:每个演员 60 次试验 x 24 个演员 = 1440。RAVDESS 包含 24 名专业演员(12 名女性,12 名男性),用中性北美口音说出两个词汇匹配的语句。言语情绪包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶等表情。每个表情都有两个情绪强度级别(正常、强烈),还有一个额外的中性表情。
大约 28 分钟