CASIA OpenIR  > 毕业生  > 硕士学位论文
人的数据库理解的研究
郭萌
Subtype工学硕士
Thesis Advisor王珏
1998-05-01
Degree Grantor中国科学院自动化研究所
Place of Conferral中国科学院自动化研究所
Degree Discipline模式识别与智能系统
Keyword数据库知识发现(Knowledge Discovery In Database Kdd) 自然语言生成 数据可视化 图文混和
Abstract本文首先论述了数据挖掘(DataMining)与数据库知识发现(Knowledge Discovery in Database,KDD)技术的基本概念与任务以及所面临的问题,并强调了 “人的数据库理解(Database Understanding by Human Being)”任务的重要性与实 用性。并围绕着“人的数据库理解”这一任务展开了如下研究工作: 基于Rough Set(RS)理论的数据浓缩的研究:本研究将Pawlak提出的 Rough Set的约简方法应用于“数据浓缩”。为此,首先描述了一个基于差别矩 阵的有效约简策略,然后使用这个策略对来自UCI机器学习数据库的24个离 散数据库进行数据浓缩。 关于自然语言生成的研究:数据库经过RS约简后,会得到一个包含特征 属性和决策属性的规则表,我们希望得到更加清晰易懂的,自然语言描述的规则 表。本研究重点在于如何在机内表达句子的语义信息,以及如何把这种深层表达 转换为表层结构,从而生成句子。我们采用了“结构驱动”的自然语言生成方法, 实现了一个自然语言产生器,并将其用于几个实例中。 关于数据可视化的研究:用图形化表示来输出符号化信息,具有直观,生 动的特点,在KDD,智能数据库等领域有着举足轻重的作用。在本项研究中, 我们采用了计算几何学中的平行坐标系方法并加以适当的改进来表示多维数 据。 图文互补的可视化模型:我们看出,图形化表述和自然语言描述的优缺点 具有互补性。因此,我们认为,图文互补的表述可以在不丢失任何信息的情况下, 使人机接口更加易懂,易操作。本项研究的工作致力于对“图+文”的可视化 模型的实现,以及总结何时采用语言、何时采用图形的原则。另外,我们也试图 从图文互补的角度研究语言对图形的简化,以及图形对语言的简化作用。 本文最后对以后工作的进行了总结和展望.
shelfnumXWLW471
Other Identifier471
Language中文
Document Type学位论文
Identifierhttp://ir.ia.ac.cn/handle/173211/7223
Collection毕业生_硕士学位论文
Recommended Citation
GB/T 7714
郭萌. 人的数据库理解的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1998.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[郭萌]'s Articles
Baidu academic
Similar articles in Baidu academic
[郭萌]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[郭萌]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.