CASIA OpenIR

浏览/检索结果: 共2293条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
CGNN: A Compatibility-aware Graph Neural Network for Social Media Bot Detection 期刊论文
IEEE Transactions on Computational Social System, 2024, 页码: Early Access
作者:  Huang, Haitao;  Tian, Hu;  Zheng, Xiaolong;  Zhang, Xingwei;  Zeng, Dajun;  Wang, Feiyue
Adobe PDF(2267Kb)  |  收藏  |  浏览/下载:14/6  |  提交时间:2024/07/08
graph neural network  heterogeneous compatibility  social media bot detection  
基于多模态协同的驾驶行为预测 学位论文
, 2024
作者:  董清辉
Adobe PDF(5017Kb)  |  收藏  |  浏览/下载:17/0  |  提交时间:2024/07/08
人车共驾,驾驶行为预测,多模态协同,轨迹预测,多任务学习  
人脸三维结构恢复和层次化解析 学位论文
, 2024
作者:  于畅
Adobe PDF(31650Kb)  |  收藏  |  浏览/下载:21/2  |  提交时间:2024/07/06
人脸层次化解析  三维人脸表征  胶囊网络  可解释表征  
SceneFake: An initial dataset and benchmarks for scene fake audio detection 期刊论文
PATTERN RECOGNITION, 2024, 卷号: 152, 页码: 12
作者:  Yi, Jiangyan;  Wang, Chenglong;  Tao, Jianhua;  Zhang, Chu Yuan;  Fan, Cunhang;  Tian, Zhengkun;  Ma, Haoxin;  Fu, Ruibo
收藏  |  浏览/下载:8/0  |  提交时间:2024/07/04
Scene manipulation  Fake audio detection  Speech enhancement  SceneFake dateset  
WavDepressionNet: Automatic Depression Level Prediction via Raw Speech Signals 期刊论文
IEEE TRANSACTIONS ON AFFECTIVE COMPUTING, 2024, 卷号: 15, 期号: 1, 页码: 285-296
作者:  Niu, Mingyue;  Tao, Jianhua;  Li, Yongwei;  Qin, Yong;  Li, Ya
收藏  |  浏览/下载:1/0  |  提交时间:2024/07/03
Assessment block  depression level prediction  representation block  speech signals  WavDepressionNet  
Emotion selectable end-to-end text-based speech editing 期刊论文
ARTIFICIAL INTELLIGENCE, 2024, 卷号: 329, 页码: 16
作者:  Wang, Tao;  Yi, Jiangyan;  Fu, Ruibo;  Tao, Jianhua;  Wen, Zhengqi;  Zhang, Chu Yuan
收藏  |  浏览/下载:7/0  |  提交时间:2024/07/03
Emotion selectable  Text-based speech editing  Emotion decoupling  Mask prediction  Few-shot learning  Text-to-speech  
SSCFormer: Push the Limit of Chunk-Wise Conformer for Streaming ASR Using Sequentially Sampled Chunks and Chunked Causal Convolution 期刊论文
IEEE SIGNAL PROCESSING LETTERS, 2024, 卷号: 31, 页码: 421-425
作者:  Wang, Fangyuan;  Xu, Bo;  Xu, Bo
收藏  |  浏览/下载:1/0  |  提交时间:2024/07/03
Convolution  Complexity theory  Computational modeling  Decoding  Training  Kernel  Transformers  Conformer  streaming ASR  sequentially sampled chunks  chunked causal convolution  linear complexity  
多尺度视觉语义增强的多模态命名实体识别方法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1234-1245
作者:  王海荣;  徐玺;  王彤;  陈芳萍
Adobe PDF(2077Kb)  |  收藏  |  浏览/下载:17/7  |  提交时间:2024/07/02
多模态命名实体识别  多任务学习  多模态融合  Transformer  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移