CASIA OpenIR  > 学术期刊  > 自动化学报
非平衡数据流在线主动学习方法
李艳红; 任霖; 王素格; 李德玉
发表期刊自动化学报
ISSN0254-4156
2024
卷号50期号:7页码:1389-1401
摘要数据流分类是数据流挖掘领域一项重要研究任务, 目标是从不断变化的海量数据中捕获变化的类结构. 目前, 几乎没有框架可以同时处理数据流中常见的多类非平衡、概念漂移、异常点和标记样本成本高昂问题. 基于此, 提出一种非平衡数据流在线主动学习方法(Online active learning method for imbalanced data stream, OALM-IDS). AdaBoost是一种将多个弱分类器经过迭代生成强分类器的集成分类方法, AdaBoost.M2引入了弱分类器的置信度, 此类方法常用于静态数据. 定义了基于非平衡比率和自适应遗忘因子的训练样本重要性度量, 从而使AdaBoost.M2方法适用于非平衡数据流, 提升了非平衡数据流集成分类器的性能. 提出了边际阈值矩阵的自适应调整方法, 优化了标签请求策略. 将概念漂移程度融入模型构建过程中, 定义了基于概念漂移指数的自适应遗忘因子, 实现了漂移后的模型重构. 在6个人工数据流和4个真实数据流上的对比实验表明, 提出的非平衡数据流在线主动学习方法的分类性能优于其他5种非平衡数据流学习方法.
关键词主动学习 数据流分类 多类非平衡 概念漂移
DOI10.16383/j.aas.c211246
引用统计
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/58793
专题学术期刊_自动化学报
推荐引用方式
GB/T 7714
李艳红,任霖,王素格,等. 非平衡数据流在线主动学习方法[J]. 自动化学报,2024,50(7):1389-1401.
APA 李艳红,任霖,王素格,&李德玉.(2024).非平衡数据流在线主动学习方法.自动化学报,50(7),1389-1401.
MLA 李艳红,et al."非平衡数据流在线主动学习方法".自动化学报 50.7(2024):1389-1401.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
AAS-CN-2021-1246.pdf(3133KB)期刊论文出版稿开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[李艳红]的文章
[任霖]的文章
[王素格]的文章
百度学术
百度学术中相似的文章
[李艳红]的文章
[任霖]的文章
[王素格]的文章
必应学术
必应学术中相似的文章
[李艳红]的文章
[任霖]的文章
[王素格]的文章
相关权益政策
暂无数据
收藏/分享
文件名: AAS-CN-2021-1246.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。