专利出售信息
发明 基于膨胀卷积的多模态融合视线估计方法特价15
人机交互 心理分析 虚拟显示 计算机视觉 卷积神经网络 人工智能 目标检测 图像处理 图像识别 深度 【人机交互 心理分析 虚拟显示 计算机视觉 卷积神经网络 人工智能 目标检测 图像处理 图像识别 深度】 1人
G06V40/16 G06V40/18 G06V10/56 G06V10/44 G06V10/70 G06V10/80 G06V10/82 G06N3/04 G06N3/08
摘要:本发明公开了一种基于膨胀卷积的多模态融合视线估计方法,利用膨胀卷积设计了一种GENet的网络提取眼睛的RGB和深度图像的特征图,并利用卷积神经网络的全连接层自动融合头部姿态和两种图像的特征图,从而进行视线估计。在公开数据集Eyediap上验证了设计的模型,并将设计的模型同其它视线估计模型进行比较。实验结果表明在卷积神经网络中膨胀卷积的引入能够进一步降低误差;当输入为深度人眼图、RGB人眼图、和头部姿态三个模态时,估计误差最小;在视线估计这项任务中头部姿态起着重要作用,而提出的模型对于头部姿态的变化具有较强的鲁棒性;同时通过与近几年其他视线估计的先进方法进行对比,本发明提出的模型依旧取得了优越的性能。
发布人员
  • 04-02

免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。