首页 » 面部情绪识别的计算机视觉研究:深度神经网络的新视角

面部情绪识别的计算机视觉研究:深度神经网络的新视角

by AIBackup

在人类交流中,面部表情包含了丰富的非语言信息,这些信息可以为口头交流提供额外的线索和含义。

据研究表明,60-80%的交流是非语言的,这些非语言信息包括面部表情、眼神交流、语调、手势和身体距离。尤其是面部表情分析,已经成为了一个热门的研究话题。

在心理学和计算机视觉领域,情绪被分类为类别模型或维度模型(价值和唤醒)。

  • 类别模型中,Ekman等人定义了基本的人类情绪,包括快乐、愤怒、厌恶、恐惧、悲伤和惊讶。
  • 维度模型中,情绪通过连续的数值尺度进行评估,以确定价值和唤醒。面部情绪识别(FER)是计算机视觉中的一个重要任务,它有许多实际应用,近年来,随着深度神经网络的进步,FER的研究数量有所增加。

在这项研究中,研究人员使用了squeeze-and-excitation模块(SENet)与ResNet-18,以实现一个相对轻量级的FER模型。这个模型的可训练参数(大约1127万)比ResNet-50所需的参数(大约2300万)和视觉变换器所需的参数(大约8600万)少。该方法的有效性在两个FER数据集上进行了评估,即AffectNet和Real-World Affective Faces Database(RAF-DB)。

这两个数据集都包含了大量的面部情绪数据,包括来自不同文化和种族的数据。研究结果表明,使用AffectNet进行训练,可以达到79.08%的训练准确率和56.54%的验证准确率。使用RAF-DB进行训练,可以达到76.51%的训练准确率和65.67%的验证准确率。通过在RAF-DB上应用预先使用AffectNet获得的权重进行迁移学习,RAF-DB数据集的预测准确率显著提高。这些结果表明,可以针对具有特定文化、地区或社会环境的较小数据集进行迁移学习,以实现特定应用。迁移学习使模型能够通过较小的数据库学习特定人群的面部情绪,并获得准确的结果。

原文链接:A study on computer vision for facial emotion recognition

也许你还会喜欢