CASIA OpenIR

浏览/检索结果: 共24条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
Multi-Granularity Pruning for Model Acceleration on Mobile Devices 会议论文
, 线上, 2022-07
作者:  Zhao TL(赵天理);  Zhang X(张希);  Zhu WT(朱文涛);  Wang JX(王家兴);  Yang S(杨森);  Liu J(刘季);  Cheng J(程健)
Adobe PDF(1919Kb)  |  收藏  |  浏览/下载:101/46  |  提交时间:2023/06/21
Deep Neural Networks  Network Pruning  Structured Pruning  Non-structured Pruning  Single Instruction Multiple Data  
Towards Automatic Model Compression via A Unified Two-Stage Framework 期刊论文
Pattern Recognition (PR), 2023, 卷号: 140, 页码: 109527
作者:  Weihan Chen;  Peisong Wang;  Jian Cheng
Adobe PDF(765Kb)  |  收藏  |  浏览/下载:107/33  |  提交时间:2023/06/20
Deep Neural Networks  Model Compression  Quantization  Pruning  
Towards Fully Sparse Training: Information Restoration with Spatial Similarity 会议论文
, Vancouver, British Columbia, Canada, 2022-04
作者:  Xu WX(许伟翔);  Wang PS(王培松);  Cheng J(程健)
Adobe PDF(556Kb)  |  收藏  |  浏览/下载:81/25  |  提交时间:2023/06/20
TBERT: Dynamic BERT Inference with Top-k Based Predictors 会议论文
, Antwerp, Belgium, 2023-4-17
作者:  Liu, Zejian;  Zhao, Kun;  Cheng, Jian
Adobe PDF(3426Kb)  |  收藏  |  浏览/下载:93/24  |  提交时间:2023/06/19
Transformer  Dynamic Inference  Pruning  
基于软硬件协同设计的深度学习模型压缩与加速 学位论文
, 2023
作者:  刘泽健
Adobe PDF(10064Kb)  |  收藏  |  浏览/下载:89/5  |  提交时间:2023/06/18
软硬件协同设计  模型压缩  DNN 加速器  自动化优化  
Optimization-Based Post-Training Quantization With Bit-Split and Stitching 期刊论文
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2023, 卷号: 45, 期号: 2, 页码: 2119-2135
作者:  Wang, Peisong;  Chen, Weihan;  He, Xiangyu;  Chen, Qiang;  Liu, Qingshan;  Cheng, Jian
Adobe PDF(921Kb)  |  收藏  |  浏览/下载:176/50  |  提交时间:2023/03/20
Deep neural networks  compression  quantization  post-training quantization  
Towards Binarized MobileNet via Structured Sparsity 会议论文
, Hainan, China, 2021-12-26
作者:  Zhenmeng, Zuo;  Zhexin, Li;  Peisong, Wang;  Weihan, Chen;  Jian, Cheng
Adobe PDF(476Kb)  |  收藏  |  浏览/下载:205/62  |  提交时间:2022/06/15
面向视觉注意力模型的定点量化加速算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李哲鑫
Adobe PDF(2261Kb)  |  收藏  |  浏览/下载:204/9  |  提交时间:2022/06/15
定点量化  模型压缩  模型加速  视觉注意力模型  混合精度  
EBERT: Efficient BERT Inference with Dynamic Structured Pruning 会议论文
, Online, 2021
作者:  Liu, Zejian;  Li, Fanrong;  Li, Gang;  Cheng, Jian
Adobe PDF(1219Kb)  |  收藏  |  浏览/下载:144/44  |  提交时间:2022/06/14
ECBC: Efficient Convolution via Blocked Columnizing 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 13
作者:  Zhao, Tianli;  Hu, Qinghao;  He, Xiangyu;  Xu, Weixiang;  Wang, Jiaxing;  Leng, Cong;  Cheng, Jian
Adobe PDF(3003Kb)  |  收藏  |  浏览/下载:293/32  |  提交时间:2022/01/27
Convolution  Tensors  Layout  Memory management  Indexes  Transforms  Performance evaluation  Convolutional neural networks (CNNs)  direct convolution  high performance computing for mobile devices  im2col convolution  memory-efficient convolution (MEC)