计算机科学与技术学科数据科学研究所学术报告(俞俊 杭州电子科技大学)
学科建设与研究生办 2019-12-24 83
报告主题:视觉问答-利用深度学习沟通视觉与语言
报 告 人:俞俊
报告时间:2019年12月27日下午2:50-3:30
报告地点:学院第一会议室
报告详情:视觉问答(Visual Question Answering,VQA),是一种涉及计算机视觉和自然语言处理的学习任务,系统对视频及图像的内容和问题进行深度理解和推理后,给出相应的回答,相比于其他视频分析手段,视频问答能根据用户的提问,对视频内容进行细粒度语义理解。在面对复杂视频时可有效过滤冗余信息,方便用户进行决策。视频问答被广泛应用在社交媒体监管、智能监控分析、国防智能决策、智慧视频教育等多个领域,本报告将介绍团队近年来在视觉问答方面所作的研究工作。
邀请人:郑忠龙