CASIA OpenIR

浏览/检索结果: 共131条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
视觉自监督学习关键技术研究 学位论文
, 2024
作者:  李朝闻
Adobe PDF(42567Kb)  |  收藏  |  浏览/下载:27/1  |  提交时间:2024/05/27
请输入关键词  
文本无关说话人识别中句级特征提取方法研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 664-688
作者:  陈晨;  韩纪庆;  陈德运;  何勇军
Adobe PDF(2278Kb)  |  收藏  |  浏览/下载:6/3  |  提交时间:2024/05/20
说话人识别  句级特征提取  任务分段式策略  任务驱动式策略  联合学习  
基于i向量和变分自编码相对生成对抗网络的语音转换 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1824-1833
作者:  李燕萍;  曹盼;  左宇涛;  张燕;  钱博
Adobe PDF(5653Kb)  |  收藏  |  浏览/下载:8/5  |  提交时间:2024/05/20
语音转换  相对生成对抗网络  i向量  非平行文本  变分自编码器  多对多  
Cogeneration of Innovative Audio-visual Content: A New Challenge for Computing Art 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 4-28
作者:  Mengting Liu;  Ying Zhou;  Yuwei Wu;  Feng Gao
Adobe PDF(14438Kb)  |  收藏  |  浏览/下载:26/1  |  提交时间:2024/04/23
Artificial intelligence (AI) art, audio-visual, artificial intelligence generated content (AIGC), multimodal, artistic evaluation  
A Review of Predictive and Contrastive Self-supervised Learning for Medical Images 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 483-513
作者:  Wei-Chien Wang;  Euijoon Ahn;  Dagan Feng;  Jinman Kim
Adobe PDF(2691Kb)  |  收藏  |  浏览/下载:23/6  |  提交时间:2024/04/23
Self-supervised learning (SSL), contrastive learning, deep learning, medical image analysis, computer vision  
Subband fusion of complex spectrogram for fake speech detection 期刊论文
SPEECH COMMUNICATION, 2023, 卷号: 155, 页码: 8
作者:  Fan, Cunhang;  Xue, Jun;  Dong, Shunbo;  Ding, Mingming;  Yi, Jiangyan;  Li, Jinpeng;  Lv, Zhao
收藏  |  浏览/下载:28/0  |  提交时间:2024/03/26
Automatic speaker verification  Complex spectrogram  Fake speech detection  Phase information  Subband  
Opportunities and challenges for biometrics 专著
Switzerland:Springer, 2020
作者:  Sun, Zhenan;  Li, Qi;  Liu, Yunfan;  Zhu, Yuhao
Adobe PDF(590Kb)  |  收藏  |  浏览/下载:85/34  |  提交时间:2024/02/23
GCNet: Graph Completion Network for Incomplete Multimodal Learning in Conversation 期刊论文
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2023, 卷号: 45, 期号: 7, 页码: 8419-8432
作者:  Lian, Zheng;  Chen, Lan;  Sun, Licai;  Liu, Bin;  Tao, Jianhua
Adobe PDF(3959Kb)  |  收藏  |  浏览/下载:143/1  |  提交时间:2023/11/17
Oral communication  Correlation  Data models  Task analysis  Feature extraction  Tensors  Benchmark testing  Conversational data  graph complete network (GCNet)  incomplete multimodal learning  speaker-sensitive modeling  temporal-sensitive modeling  
SMIN: Semi-Supervised Multi-Modal Interaction Network for Conversational Emotion Recognition 期刊论文
IEEE TRANSACTIONS ON AFFECTIVE COMPUTING, 2023, 卷号: 14, 期号: 3, 页码: 2415-2429
作者:  Lian, Zheng;  Liu, Bin;  Tao, Jianhua
Adobe PDF(2103Kb)  |  收藏  |  浏览/下载:115/3  |  提交时间:2023/11/15
Emotion recognition  Feature extraction  Training  Acoustics  Semisupervised learning  Benchmark testing  Hidden Markov models  Semi-supervised multi-modal interaction network (SMIN)  conversational emotion recognition  semi-supervised learning  intra-modal interaction  cross-modal interaction  
CONTEXT-AWARE MASK PREDICTION NETWORK FOR END-TO-END TEXT-BASED SPEECH EDITING 会议论文
, Online, 2022
作者:  Wang T(汪涛)
Adobe PDF(2851Kb)  |  收藏  |  浏览/下载:82/40  |  提交时间:2023/08/07