CASIA OpenIR  > 毕业生  > 博士学位论文
面向社会标注系统的信息服务关键技术研究
其他题名Research on the Key Technologies for Information Services in Social Tagging Systems
郑楠
2012-05-29
学位类型工学博士
中文摘要随着互联网进入Web2.0时代,以Flickr、CiteULike等为代表的社会标注系统已逐渐成为新兴的知识共享平台。用户可以使用任意标签对自身创建或他人创建的网络资源(如图片、文献等)进行标注,还可以通过参加群组来与有类似兴趣的用户更好地分享相关资源。标签一方面代表了用户对资源的理解,反映了资源的内容;另一方面,多个用户标签的集合,也形成了对群组的高层语义描述。因此,标签成为联系用户与资源、用户与群组、资源与群组的桥梁。利用几类实体之间的关联关系,研究用户行为模式、资源组织方式,从而改善信息服务质量,成为相关研究面临的主要挑战。 社会标注系统对群组的支持增强了标注的社会化特性,然而,群组数量的迅速增长,却为用户参与其中带来困难,利用标签的桥梁作用,挖掘用户与群组之间的潜在关联,为用户推荐其感兴趣的潜在群组,能够加强用户间的信息交流,提高资源的利用率;标签和群组等信息为资源提供了多角度的描述,同时,语义相关的标签和内容相似的群组从不同的方面增强了用户对资源的认知,综合考虑这些信息,为新上传的资源同时提供标签和群组推荐,有利于其他用户对资源的发现,促进知识的共享和传播;目前,群组主要提供按照资源分享时间排序浏览资源的方式,这种浏览方式导致大量高质量的资源随着时间 的流逝而被淹没,群组将标注聚合到一起,由此产生的标签共现关系为信息的组织和发现提供了基础,利用群组中大量用户对资源的标签挖掘资源的主题,并根据用户对资源的反馈信息排序主题内资源,提供面向主题的群组内资源浏览,能够帮助用户快速定位感兴趣主题高质量的资源;用户为资源添加标签的时间体现了用户在该时间点的兴趣,然而,用户的兴趣会随着时间的推移而发生变化,考虑用户的兴趣漂移,可以为用户提供符合其当前兴趣喜好的信息服务。本文的工作以图片标注系统Flickr和文献标注系统CiteULike为研究对象,针对上述几个问题,研究的主要内容如下: 1、提出了一种基于张量分解的群组推荐方法,用于集成以标签为桥梁的多维实体。该方法采用张量表征“用户-标签-群组”三者之间的交互关系,利用非负张量分解算法挖掘三类实体的共同主题空间,基于用户和群组在共同主题空间上的投影,计算它们的潜在关联,实现为用户推荐群组的服务。我们通过多组实验,对比当前流行的推荐方法,验证了模型的有效性,并深入分析了标签在群组推荐过程中的作用。 2、提出了一种基于实体间和实体内关联的标签和群组推荐方法,该方法通过抽取对资源进行标注的用户、描述资源内容的标签和资源所加入的群组之间的实体间关联,分析用户的好友、语义相关的标签、内容相似的群组的实体内关联,采用互增强学习挖掘各类实体与资源之间的潜在关联,实现为资源同时推荐标签和群组的功能,提高了用户参与标注的效率,有利于资源的发现和传播。 3、提出了一种两阶段面向主题的群组内资源浏览方法,方便用户定位和发现感兴趣主题高质量的资源。该方法第一阶段通过对标签共现关系的分析,使用标签作为描述资源的特征向量,构建“资源-标签”的矩阵空间表示,然后基于非负矩阵分解算...
英文摘要With the development of Web2.0, social tagging systems such as Flickr and CiteULike have gradually become a novel platform for knowledge sharing. Users are encouraged to annotate web resources (e.g., photos, papers, etc.) with freely chosen words, called tags, and they may also join groups to share relevant resources with users of common interests. Tags not only indicate users’ understanding of a resource, but also reflect the contents of the resource. The aggregation of tags constructs a high-level semantic description of a group. Therefore, tags perform as a bridge between users and resources, users and group, as well as resources and groups. Exploring relations among these entities (e.g. users, tags resources and groups) can improve information services in social tagging systems. The support of groups enhances the social aspect of tagging system. However, the huge volume of groups brings troubles for users to decide which group to choose. By mining the latent associations of users and groups through the bridge of tags, we can suggest potential groups to users. Tags and groups describe a resource from different angles, meanwhile, semantic tags and similar groups may help users’ better understand a resource. By integrating all such information, we can refine the joint tag and group recommendation, which is good for resource discovering and knowledge spreading. Nowadays, resources in a group always ordered by its sharing time; in this manner, a large number of high-quality resources will disappear from main page as time goes by. As groups aggregate tagging behaviors, the co-occurrence of tags provides a possible way for topic-oriented resource browsing. Users’ tagging behaviors are time sensitive and interest drifts exist in social tagging systems. Therefore, incorporating interest drifts to discover users’ current preferences may provide more accurate information services. Based on the photo tagging system Flickr and paper tagging system CiteULike, the main focuses of this thesis are summarized as follows: 1. We propose a tensor decomposition based group recommendation approach to combine tag related multi-mode entities. Firstly, a three-mode tensor is constructed from “user-tag-group”usage data. Then we discover the latent topics from the three-mode tensor based on non-negative tensor decomposition. Finally, according to the latent associations between users and unjoined groups through latent topics, groups will be suggested to users. Empirical...
关键词社会标注 个性化推荐 主题浏览 兴趣漂移 人机交互 Social Tagging Personalized Recommendation Topic-oriented Browsing Interest Drift Human Computer Interaction
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/6441
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
郑楠. 面向社会标注系统的信息服务关键技术研究[D]. 中国科学院自动化研究所. 中国科学院研究生院,2012.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CASIA_20091801462807(7155KB) 暂不开放CC BY-NC-SA
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[郑楠]的文章
百度学术
百度学术中相似的文章
[郑楠]的文章
必应学术
必应学术中相似的文章
[郑楠]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。