CASIA OpenIR  > 毕业生  > 博士学位论文
网络环境下科技情报的获取、分析、分类和传播
其他题名A Study on Scientific Information:Acquisition,Analysis,Classification,and Dissemination
张楠
学位类型工学博士
导师王飞跃
2009-05-29
学位授予单位中国科学院研究生院
学位授予地点中国科学院自动化研究所
学位专业控制理论与控制工程
关键词科技情报 关键词提取 语义分类 复杂网络 Scientific Information Logistic Keywords Exatraction Semantic Classification Complex Network Logistic Model
摘要科技情报的及时发现与迅速传播对新理论和新技术的创新和应用起着极为关键的作用。根据科学交流理论,科技情报主要分为正式型( 即科技文献类情报)和非正式型( 网络环境下指在线的科学交流信息) 两种。 科技文献检索是正式型科技情报交流的主要方式。信息技术的飞速发展和互联网的广泛应用为文献检索带来了新的模式,如开放存取和在线检索。然而, 已有的研究表明,现有的文献检索系统并不能解决跨学科检索问题使得文献引用仍然停留在狭窄的领域之内, 限制了新想法和新技术的传播和应用。 在非正式科技情报交流中,Web2.0 技术的应用使科学家们能够方便的在互联网中公开的进行交流和探讨。但是,由于这些讨论是在自组织的方式下进行的,所产生的在线科技情报无序地分布在网络中, 很难对实际的科学研究形成真正的指导。 因此, 提高科学文献检索的效率和准确度, 及时从在线科学交流中获取高质量的情报,掌握在线科技情报的传播规律和发展趋势, 对科研本身起着巨大的推动作用。 针对以上问题, 通过对国内外科技情报研究工作进行仔细分析和总结,本文主要从以下三方面进行了深入的探索和研究,以提高科技情报为科学研究提供及时、有效、准确、全面的服务。 一是对科技情报的获取方面进行研究, 通过编写专门的网络 爬虫获取主流学术媒体中的科技文献以及开源科技情报,并从中 抽取相应的特征数据。设计了基于关键词的文献目录自动构建, 以克服传统的专家目录对经验的依赖,并能不断地自动更新、扩 充和完善。 二是在对科学关系网络进行复杂网络分析的基础上, 对科技 情报的分类和检索方法进行研究。本文在传统的Bayes 网络分类 算法基础上进行改进,提出一种基于语义的文本分类方法。同时, 提出了基于作者合作关系网络和文献引用关系网络的相似度计 算方法,体现了合作关系和引用关系在文献检索中的地位和作用。 最后基于这两种方法设计了支持跨学科检索的科技文献检索系 统, 并采用分级精确的方法对系统进行验证和评估。 三是对学术博客中开源科技情报的传播规律、发展趋势进行 研究。应用经典的Logistic 阻滞增长模型对学术博文的传播进行 量化分析,并根据实际传播条件对Logistic 模型进行修正, 进而 为开源科技情报的传播进行数学建模,探索学术博客的传播规律 和机制,预测学术博客的发展趋势,提高科学交流的水平和效率, 为对科学研究进行决策支持提供新的方法和思路。
其他摘要The timely detection and rapid spread of new ideas and technological innovations, which are all called scientific and technological intelligence, plays a crucial role for scientific research. According to the Theory of Scientific Communication, scientific and technical intelligence consists of two parts: the formal part (scientific and technical literature) and the informal part (online scientific communication under the network environment). For the formal part, the rapid development of information technology and the wide application of Internet bring the new modes for literature retrieval, such as Open Access and online retrieval. However, as it is shown by the research report, current literature retrieval systems cannot solve the problem of interdisciplinary retrieval, so that the references are still restrained within the original areas. As a result, the spread and adoption of creative ideas and technological improvements are delayed. For the informal part, Web2.0 makes online public communication and discussion among scientists possible. However, since the discussions are self-organized without any central control, the useful information distribute in the network disorderly. So it is hard for these online discussions to play a role of providing real guidance to practical scientific research Therefore, it is crucial for scientific research to improve the efficiency and accuracy of scientific literature retrieval, as well as to obtain useful scientific intelligence from online exchanges. Basing on the existing works in the area of information retrieval and social network, we try to answer these questions with three aspects: 1. We study on the acquisition of scientific information. We fetch the literature and online scientific discussions from the major scientific Medias using the specifically designed Web crawlers. The literature directory is automatically constructed basing on keywords extracted from the documents, which overcomes the traditional expert directory depending on experience and can constantly update and expand. 2. We do researches on the classification algorithms and retrieval techniques of scientific information basing on the analysis to scientific relationship network. We propose a semantic-based text classification method basing on a Bayes network classification and also a similarity calculation method basing on the author cooperation network and literature citation network to reflect the relevance of authors and papers. The roles ...
馆藏号XWLW1346
其他标识符200618014628007
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6186
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
张楠. 网络环境下科技情报的获取、分析、分类和传播[D]. 中国科学院自动化研究所. 中国科学院研究生院,2009.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20061801462800(7041KB) 暂不开放CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[张楠]的文章
百度学术
百度学术中相似的文章
[张楠]的文章
必应学术
必应学术中相似的文章
[张楠]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。