CASIA OpenIR  > 毕业生  > 硕士学位论文
人的数据库理解的研究
郭萌
学位类型工学硕士
导师王珏
1998-05-01
学位授予单位中国科学院自动化研究所
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
关键词数据库知识发现(Knowledge Discovery In Database Kdd) 自然语言生成 数据可视化 图文混和
摘要本文首先论述了数据挖掘(DataMining)与数据库知识发现(Knowledge Discovery in Database,KDD)技术的基本概念与任务以及所面临的问题,并强调了 “人的数据库理解(Database Understanding by Human Being)”任务的重要性与实 用性。并围绕着“人的数据库理解”这一任务展开了如下研究工作: 基于Rough Set(RS)理论的数据浓缩的研究:本研究将Pawlak提出的 Rough Set的约简方法应用于“数据浓缩”。为此,首先描述了一个基于差别矩 阵的有效约简策略,然后使用这个策略对来自UCI机器学习数据库的24个离 散数据库进行数据浓缩。 关于自然语言生成的研究:数据库经过RS约简后,会得到一个包含特征 属性和决策属性的规则表,我们希望得到更加清晰易懂的,自然语言描述的规则 表。本研究重点在于如何在机内表达句子的语义信息,以及如何把这种深层表达 转换为表层结构,从而生成句子。我们采用了“结构驱动”的自然语言生成方法, 实现了一个自然语言产生器,并将其用于几个实例中。 关于数据可视化的研究:用图形化表示来输出符号化信息,具有直观,生 动的特点,在KDD,智能数据库等领域有着举足轻重的作用。在本项研究中, 我们采用了计算几何学中的平行坐标系方法并加以适当的改进来表示多维数 据。 图文互补的可视化模型:我们看出,图形化表述和自然语言描述的优缺点 具有互补性。因此,我们认为,图文互补的表述可以在不丢失任何信息的情况下, 使人机接口更加易懂,易操作。本项研究的工作致力于对“图+文”的可视化 模型的实现,以及总结何时采用语言、何时采用图形的原则。另外,我们也试图 从图文互补的角度研究语言对图形的简化,以及图形对语言的简化作用。 本文最后对以后工作的进行了总结和展望.
馆藏号XWLW471
其他标识符471
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/7223
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
郭萌. 人的数据库理解的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1998.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[郭萌]的文章
百度学术
百度学术中相似的文章
[郭萌]的文章
必应学术
必应学术中相似的文章
[郭萌]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。