Speech recognition 分类

🫠基于语音的情感分析系统，详细代码在GitHub：https://github.com/L-mj0

0x01数据处理

这里我们使用的是RAVDESS数据集Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS)，以及CREMA-D

RAVDESS 的这一部分包含 1440 个文件：每个演员 60 次试验 x 24 个演员 = 1440。RAVDESS 包含 24 名专业演员（12 名女性，12 名男性），用中性北美口音说出两个词汇匹配的语句。言语情绪包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶等表情。每个表情都有两个情绪强度级别（正常、强烈），还有一个额外的中性表情。

LPrincess大约 28 分钟