CASIA OpenIR

浏览/检索结果: 共36条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向工具使用的机器人技能学习方法研究 学位论文
, 2023
作者:  魏俊杭
Adobe PDF(15327Kb)  |  收藏  |  浏览/下载:145/9  |  提交时间:2023/10/25
机器人工具使用  多模态感知  自监督学习  复杂长序任务  
Speech Emotion Recognition Using Cascaded Attention Network with Joint Loss for Discrimination of Confusions 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 595-604
作者:  Yang Liu, Haoqin Sun, Wenbo Guan, Yuqi Xia, Zhen Zhao
Adobe PDF(1966Kb)  |  收藏  |  浏览/下载:82/33  |  提交时间:2023/08/02
Speech emotion recognition (SER), 3-dimensional (3D) feature, cascaded attention network (CAN), triplet loss, joint loss  
Second-Order Global Attention Networks for Graph Classification and Regression 会议论文
, Beijing, China, August 27-28, 2022
作者:  Hu Fenyu;  Cui Zeyu;  Wu Shu;  Liu Qiang;  Wu Jinlin;  Wang Liang;  Tan Tieniu
Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:166/67  |  提交时间:2023/07/06
基于多模态学习的视觉神经信息编解码方法研究 学位论文
, 2023
作者:  周琼怡
Adobe PDF(21688Kb)  |  收藏  |  浏览/下载:122/11  |  提交时间:2023/06/23
视觉神经信息编解码  多模态学习  归一化流  多被试语义解码  无监督解耦表征学习  
Learning to predict salient faces: a novel visual-audio saliency model 会议论文
, Virtual conference, 2020.8.23-2020.8.28
作者:  Yufan Liu;  Minglang Qiao;  Mai Xu;  Bing Li;  Weiming Hu;  Ali Borji
Adobe PDF(4223Kb)  |  收藏  |  浏览/下载:86/12  |  提交时间:2023/05/06
Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation 期刊论文
IEEE Transactions on Multimedia, 2023, 卷号: 26, 页码: 1 - 13
作者:  Liu, Jiawei;  Wang, Weining;  Chen, Sihan;  Zhu, Xinxin;  Liu, Jing
Adobe PDF(7741Kb)  |  收藏  |  浏览/下载:112/20  |  提交时间:2023/05/03
Text-guided sounding-video generation  Videoaudio representation  Contrastive learning  Transformer  
Compressing Speaker Extraction Model with Ultra-low Precision Quantization and Knowledge Distillation 期刊论文
Neural Networks, 2022, 卷号: 154, 页码: 13-21
作者:  Yating Huang;  Yunzhe Hao;  Jiaming Xu;  Bo Xu
Adobe PDF(801Kb)  |  收藏  |  浏览/下载:179/47  |  提交时间:2022/09/17
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  黄雅婷
Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:295/17  |  提交时间:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
面向样本缺失场景的情绪与压力状态评估方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  武金婷
Adobe PDF(7138Kb)  |  收藏  |  浏览/下载:207/8  |  提交时间:2022/09/02
情绪识别  心理压力检测  零样本学习  迁移学习  孪生网络  
WASE: LEARNING WHEN TO ATTEND FOR SPEAKER EXTRACTION IN COCKTAIL PARTY ENVIRONMENTS 会议论文
, Toronto, June 6-11, 2021
作者:  Yunzhe Hao;  Jiaming Xu;  Peng Zhang;  Bo Xu
Adobe PDF(2034Kb)  |  收藏  |  浏览/下载:192/31  |  提交时间:2022/06/23