| 图像和语音的跨模态检索分类器模型、检索系统和检索方法 |
| 袁媛; 卢孝强; 郭毛
|
| 2019-02-21
|
专利权人 | 中国科学院西安光学精密机械研究所
|
公开日期 | 2019-07-05
|
授权国家 | 中国
|
专利类型 | 发明专利
|
产权排序 | 1
|
摘要 | 为解决现有图像检索方法检索效率低、可能会丢失一些有用或重要的细节信息、不能很好满足用户真正检索需求的技术问题,本发明提供了一种图像和语音的跨模态检索分类器模型、检索系统和检索方法。本发明构建了一个图像‑语音神经网络结构,利用图像及其语音描述之间的相关性作为监督信息,对深度神经网络进行训练,得到图像和语音关联关系的函数模型,从而实现图像和语音的跨模态检索,提高了图像检索效率和检索准确率,使检索过程中的人机交互变得更容易。 |
申请日期 | 2019-02-21
|
专利号 | CN201910131147.7
|
语种 | 中文
|
专利状态 | 申请中
|
申请号 | CN201910131147.7
|
公开(公告)号 | CN109977258A
|
IPC 分类号 | G06F16/68
; G06F16/58
; G06K9/62
; G06N3/04
|
文献类型 | 专利
|
条目标识符 | http://ir.opt.ac.cn/handle/181661/93850
|
专题 | 光谱成像技术研究室
|
推荐引用方式 GB/T 7714 |
袁媛,卢孝强,郭毛. 图像和语音的跨模态检索分类器模型、检索系统和检索方法. CN201910131147.7[P]. 2019-02-21.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论