首页 >> 无人驾驶 >

未剪辑视频中的视听人物搜索

2022-06-17 10:16:01 来源: 用户: 

人类可以轻松识别出他们最喜欢的演员在电影中出现或讲话的时刻。然而,计算机视觉系统很难完成这项任务。它具有挑战性,因为外观、面部表情、姿势和光照会随着视频的进展而变化。

最近的一项研究提出了一个新的数据集和基准,用于在未修剪的长视频中检索视听人物。

该数据集包括一组 15 分钟的电影视频,这些视频用人物身份进行了注释。身份与面孔和声音相匹配。开发了一个使用视听线索预测人们身份的双流模型作为基线。

为两项任务引入了基准测试:Seen 和 Seen & Heard。当查询面孔出现在屏幕上或谈话时,它们的目标是检索所有片段。结果表明,新数据集补充了以前仅专注于视觉分析的数据集。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章