CASIA OpenIR

浏览/检索结果: 共243条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
AnyFace++: A Unified Framework for Free-style Text-to-Face Synthesis and Manipulation 期刊论文
IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024, 页码: 1-15
作者:  Sun, Jianxin;  Deng, Qiyao;  Li, Qi;  Sun, Muyi;  Liu, Yunfan;  Sun, Zhenan
Adobe PDF(16839Kb)  |  收藏  |  浏览/下载:40/8  |  提交时间:2024/02/23
Visual Semantic Segmentation Based on Few/Zero-Shot Learning: An Overview 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 5, 页码: 1106-1126
作者:  Wenqi Ren;  Yang Tang;  Qiyu Sun;  Chaoqiang Zhao;  Qing-Long Han
Adobe PDF(12695Kb)  |  收藏  |  浏览/下载:11/2  |  提交时间:2024/04/10
Computer vision  deep learning  few-shot learning  low-shot learning  semantic segmentation  zero-shot learning  
Adaptively Enhancing Facial Expression Crucial Regions via a Local Non-local Joint Network 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 331-348
作者:  Guanghui Shi;  Shasha Mao;  Shuiping Gou;  Dandan Yan;  Licheng Jiao;  Lin Xiong
Adobe PDF(3926Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/04/23
Facial expression recognition, deep neural network, multiple network ensemble, attention network, facial crucial regions  
Comprehensive Relation Modelling for Image Paragraph Generation 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 369-382
作者:  Xianglu Zhu;  Zhang Zhang;  Wei Wang;  Zilei Wang
Adobe PDF(1963Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/04/23
Image paragraph generation, visual relationship, scene graph, graph convolutional network (GCN), long short-term memory  
A Multi-modal Global Instance Tracking Benchmark (MGIT): Better Locating Target in Complex Spatio-temporal and causal Relationship 会议论文
, New Orleans, 2023-12
作者:  Shiyu, Hu;  Dailing, Zhang;  Meiqi, Wu;  Xiaokun, Feng;  Xuchen, Li;  Xin, Zhao;  Kaiqi, Huang
Adobe PDF(6215Kb)  |  收藏  |  浏览/下载:70/14  |  提交时间:2024/01/22
融合图片信息的神经机器翻译方法研究 学位论文
, 2023
作者:  黄鑫
Adobe PDF(10395Kb)  |  收藏  |  浏览/下载:138/11  |  提交时间:2023/06/26
神经机器翻译  跨模态信息融合  多任务学习  对比学习  
WL-MSR: Watch and Listen for Multimodal Subtitle Recognition 会议论文
, Greece, 2023-6-4
作者:  Liu, Jiawei;  Wang, Hao;  Wang, Weining;  He, Xingjian;  Liu, Jing
Adobe PDF(1673Kb)  |  收藏  |  浏览/下载:128/32  |  提交时间:2023/07/06
面向对话文本的自动摘要关键技术研究 学位论文
, 2023
作者:  林海涛
Adobe PDF(6631Kb)  |  收藏  |  浏览/下载:145/9  |  提交时间:2023/06/12
对话摘要  数据标注  无监督方法  角色交互  多任务学习  
面向多语义和多模态的视觉目标检测研究 学位论文
, 2023
作者:  杨力
Adobe PDF(19168Kb)  |  收藏  |  浏览/下载:155/13  |  提交时间:2023/06/25
目标检测  指代目标检测  多语义  多模态  视觉-语言  
基于平行学习的艺术绘画图像描述算法研究 学位论文
, 2023
作者:  鲁越
Adobe PDF(15730Kb)  |  收藏  |  浏览/下载:110/3  |  提交时间:2023/06/25
平行学习  艺术绘画  图像描述  内容描述  情感描述