一、开题报告题目:面向图文跨模态检索的关键技术研究
二、开题报告答辩人:吴东庆
三、开题答辩时间:2021年12月13日19:00
四、开题答辩地点:腾讯会议线上答辩(523-225-998)
五、开题答辩内容简介:
互联网和移动通信技术的快速发展,对图文跨模态检索提出了更高的要求。论文在对国内外相关工作研究的基础上,对图像文本匹配实现过程中的模态内信息理解不充分、模态间信息对齐不精确、匹配模型参数多、计算量大等关键技术问题展开研究,以缩小图像和文本之间的语义差异和提高图像文本双向检索的准确性和速度为目的,聚焦跨模态图像文本匹配中的关键难点问题,结合深度学习、注意力机制、知识蒸馏等主要理论,提取出更全面、更深层次的图像表示和文本表示,实现了更精确的模态内关系建模和更细粒度的模态间信息交互,设计更高效、更快速的图像文本匹配模型,具有重要的应用价值和理论意义。
六、答辩人简介:
吴东庆,男,我院2020级博士研究生,主要研究方向跨模态检索、图像文本匹配,专业控制科学与工程。