已选(0)清除
条数/页: 排序方式: |
| Learning Video-Text Aligned Representations for Video Captioning 期刊论文 ACM Trans. Multimedia Comput. Commun. Appl., 2023, 页码: 1-21 作者: Yaya Shi; Haiyang Xu; Chunfeng Yuan; Bing Li; Weiming Hu,; Zhengjun Zha Adobe PDF(3574Kb)  |  收藏  |  浏览/下载:145/58  |  提交时间:2023/04/28 |
| 基于深度学习的骨架手势识别方法研究 学位论文 工学博士, 自动化大厦13层第一会议室: 中国科学院自动化研究所, 2021 作者: 刘建波 Adobe PDF(6653Kb)  |  收藏  |  浏览/下载:223/9  |  提交时间:2022/01/06 手势识别 骨架 3D 卷积神经网络 解耦表示 自注意力机制 |
| 基于身份空间约束的伪造人脸图像鉴别研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 姜君 Adobe PDF(13429Kb)  |  收藏  |  浏览/下载:173/6  |  提交时间:2022/01/11 图像合成 深度伪造 伪造人脸鉴别 生成对抗网络 |
| A Large-Scale Chinese Multimodal NER Dataset with Speech Clues 会议论文 , Online, 2021-8 作者: Sui DB(隋典伯); Zhengkun Tian; Yubo Chen; Kang Liu; Jun Zhao Adobe PDF(749Kb)  |  收藏  |  浏览/下载:171/51  |  提交时间:2022/06/28 |
| 多通道语音增强优化建模方法研究 学位论文 , 中科院自动化研究所: 中国科学院大学, 2021 作者: 李冠君 Adobe PDF(5732Kb)  |  收藏  |  浏览/下载:240/6  |  提交时间:2021/06/07 多通道语音增强,非点源噪声场景,点源噪声场景,复杂噪声场景,自动语音识别 |
| 基于深度学习的三维点云目标识别方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 杨翼荣 Adobe PDF(14078Kb)  |  收藏  |  浏览/下载:240/5  |  提交时间:2021/06/18 点云处理 神经网络 空间划分卷积 四元数 旋转等变 |
| Deep Neural Network-based Generalized Sidelobe Canceller for Dual-channel Far-field Speech Recognition 期刊论文 Neural Networks, 2021, 期号: Volume 141,, 页码: Pages 225-237 作者: Li GJ(李冠君) Adobe PDF(1911Kb)  |  收藏  |  浏览/下载:164/37  |  提交时间:2021/06/18 Deep neural networkGeneralized sidelobe cancellerDual-channelFar-field speech recognition |
| A time-frequency channel attention and vectorization network for automatic depression level prediction 期刊论文 Neurocomputing, 2021, 期号: 450, 页码: 208-218 作者: Mingyue Niu; Bin Liu; Jianhua Tao; Qifei Li Adobe PDF(2001Kb)  |  收藏  |  浏览/下载:147/40  |  提交时间:2021/06/01 Sphere embedding normalization DenseNet Transition layer Time-frequency channel attention block Time-frequency vectorization block Depression detection |
| Knowledge-driven Egocentric Multimodal Activity Recognition 期刊论文 ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS, 2020, 卷号: 16, 期号: 4, 页码: 21 作者: Huang, Yi; Yang, Xiaoshan; Gao, Junyu; Sang, Jitao; Xu, Changsheng Adobe PDF(1875Kb)  |  收藏  |  浏览/下载:269/40  |  提交时间:2021/03/08 Egocentric videos wearable sensors graph neural networks |
| Learning to predict salient faces: a novel visual-audio saliency model 会议论文 , Virtual conference, 2020.8.23-2020.8.28 作者: Yufan Liu; Minglang Qiao; Mai Xu; Bing Li; Weiming Hu; Ali Borji Adobe PDF(4223Kb)  |  收藏  |  浏览/下载:79/12  |  提交时间:2023/05/06 |