Chinese Short Text Classification Based on Domain Knowledge
Xiao Feng1; Yang Shen2; Chengyong Liu3; Wei Liang1; Shuwu Zhang1
2013-10
会议名称International Joint Conference on Natural Language Processing
会议录名称In Proceedings of the 6th International Joint Conference on Natural Language Processing(IJCNLP), pp. 859–863
会议日期2013-10-14
会议地点Nagoya, Japan
摘要
People  are  generating  more  and  more  short texts.  There  is  an  urgent  demand  to  classify short  texts  into  different  domains.  Due  to  the shortness  and  sparseness  of  short  texts,  con-ventional  methods  based  on  Vector  Space Model  (VSM)  have  limitations.  To  tackle  the data scarcity problem, we propose a new mod-
el to directly measure the correlation between a  short  text  instance  and  a  domain  instead  of representing short texts as vectors of weights. We  firstly  draw  domain  knowledge  for  each user-defined  domain  using  an  external  corpus 
of longer documents. Secondly, the correlation is  calculated  by  measuring  the  proportion  of the  overlapping  part  of  the  instance  and  the domain  knowledge.  Finally,  if  the  correlation is greater than a threshold, the instance will be classified  into  the  domain.  Experimental  results show that the classifier based on the proposed  model  outperforms  the  state-of-the-art baselines based on VSM. 
关键词Text Classification Short Text Domain Knowledge
收录类别其他
文献类型会议论文
条目标识符http://ir.ia.ac.cn/handle/173211/11229
专题数字内容技术与服务研究中心_新媒体服务与管理技术
作者单位1.Institute of Automation Chinese Academy of Science
2.State Administration for Industry & Commerce of the People's Republic of China
3.Information Center of General Administration of Press and Publication of PR China
推荐引用方式
GB/T 7714
Xiao Feng,Yang Shen,Chengyong Liu,et al. Chinese Short Text Classification Based on Domain Knowledge[C],2013.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
Xiao Feng IJCNLP2013(248KB)会议论文 开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[Xiao Feng]的文章
[Yang Shen]的文章
[Chengyong Liu]的文章
百度学术
百度学术中相似的文章
[Xiao Feng]的文章
[Yang Shen]的文章
[Chengyong Liu]的文章
必应学术
必应学术中相似的文章
[Xiao Feng]的文章
[Yang Shen]的文章
[Chengyong Liu]的文章
相关权益政策
暂无数据
收藏/分享
文件名: Xiao Feng IJCNLP2013.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。