OPT OpenIR

浏览/检索结果: 共5条,第1-5条 帮助

已选(0)清除 条数/页:   排序方式:
Vision-to-Language Tasks Based on Attributes and Attention Mechanism 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2021, 卷号: 51, 期号: 2, 页码: 913-926
作者:  Li, Xuelong;  Yuan, Aihong;  Lu, Xiaoqiang
Adobe PDF(3082Kb)  |  收藏  |  浏览/下载:150/0  |  提交时间:2021/02/22
Deep learning  image captioning  multimodal  visual question answering (VQA)  
3G structure for image caption generation 期刊论文
Neurocomputing, 2019, 卷号: 330, 页码: 17-28
作者:  Yuan, Aihong;  Li, Xuelong;  Lu, Xiaoqiang
Adobe PDF(3091Kb)  |  收藏  |  浏览/下载:147/1  |  提交时间:2019/03/04
图像内容的语义描述与理解 学位论文
, 北京: 中国科学院大学, 2018
作者:  袁爱红
Adobe PDF(5264Kb)  |  收藏  |  浏览/下载:179/0  |  提交时间:2018/12/25
图像文本描述  视觉问答  多模式学习  递归神经网络  
Multi-modal gated recurrent units for image description 期刊论文
Multimedia Tools and Applications, 2018, 卷号: 77, 期号: 22, 页码: 29847-29869
作者:  Li, Xuelong;  Yuan, Aihong;  Lu, Xiaoqiang
Adobe PDF(2037Kb)  |  收藏  |  浏览/下载:126/0  |  提交时间:2018/12/18
Image Description  Gated Recurrent Unit  Convolutional Neural Network  Multi-modal Embedding  
FFGS: Feature fusion with gating structure for image caption generation 会议论文
Computer Vision - 2nd CCF Chinese Conference, CCCV 2017, Proceedings, Tianjin, China, 2017-10-11
作者:  Yuan, Aihong;  Li, Xuelong;  Lu, Xiaoqiang;  Lu, Xiaoqiang (luxq666666@gmail.com)
Adobe PDF(381Kb)  |  收藏  |  浏览/下载:208/2  |  提交时间:2018/01/02