面部情绪识别的计算机视觉研究：深度神经网络的新视角

by AIBackup 2023-05-26

written by AIBackup 2023-05-26

在人类交流中，面部表情包含了丰富的非语言信息，这些信息可以为口头交流提供额外的线索和含义。

据研究表明，60-80%的交流是非语言的，这些非语言信息包括面部表情、眼神交流、语调、手势和身体距离。尤其是面部表情分析，已经成为了一个热门的研究话题。

在心理学和计算机视觉领域，情绪被分类为类别模型或维度模型（价值和唤醒）。

在类别模型中，Ekman等人定义了基本的人类情绪，包括快乐、愤怒、厌恶、恐惧、悲伤和惊讶。
在维度模型中，情绪通过连续的数值尺度进行评估，以确定价值和唤醒。面部情绪识别（FER）是计算机视觉中的一个重要任务，它有许多实际应用，近年来，随着深度神经网络的进步，FER的研究数量有所增加。

在这项研究中，研究人员使用了squeeze-and-excitation模块（SENet）与ResNet-18，以实现一个相对轻量级的FER模型。这个模型的可训练参数（大约1127万）比ResNet-50所需的参数（大约2300万）和视觉变换器所需的参数（大约8600万）少。该方法的有效性在两个FER数据集上进行了评估，即AffectNet和Real-World Affective Faces Database（RAF-DB）。

这两个数据集都包含了大量的面部情绪数据，包括来自不同文化和种族的数据。研究结果表明，使用AffectNet进行训练，可以达到79.08%的训练准确率和56.54%的验证准确率。使用RAF-DB进行训练，可以达到76.51%的训练准确率和65.67%的验证准确率。通过在RAF-DB上应用预先使用AffectNet获得的权重进行迁移学习，RAF-DB数据集的预测准确率显著提高。这些结果表明，可以针对具有特定文化、地区或社会环境的较小数据集进行迁移学习，以实现特定应用。迁移学习使模型能够通过较小的数据库学习特定人群的面部情绪，并获得准确的结果。

原文链接：A study on computer vision for facial emotion recognition

面部情绪识别的计算机视觉研究：深度神经网络的新视角

TidyBot：以大型语言模型为基础的个性化机器人助手

YouTube博主AssemblyAI：AI领域的知识分享者

也许你还会喜欢

OpenAI推出新功能：函数调用，AI计算能力再升级（案例）

AI新突破：零样本文本引导的视频到视频转换技术

Galactic：以每秒100k步速度扩展端到端强化学习的重排任务

超越人类：探索“磨刀人”和生物黑客的未来

数据工程领域30个最实用的Python库

AI大清洗：生成型AI如何改变SEO内容流量、工作岗位和依赖网站的未来