薛征山
- 作品数:5 被引量:46H指数:3
- 供职机构:昆明理工大学信息工程与自动化学院更多>>
- 发文基金:国家自然科学基金云南省教育厅科学研究基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术历史地理更多>>
- 基于层叠条件随机场的旅游领域命名实体识别被引量:36
- 2009年
- 针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。
- 郭剑毅薛征山余正涛张志坤张宜浩姚贤明
- 关键词:计算机应用中文信息处理旅游领域命名实体识别层叠条件随机场
- 基于HMM的中文旅游景点的识别被引量:10
- 2009年
- 针对旅游领域,提出了一种基于隐马尔可夫模型(HMM)的旅游景点实体识别方法.该方法采用HMM学习算法,选取句子各态顺序遍历模型,结合词性特征和校正规则实现了旅游景点的自动识别.最后进行了旅游景点实体识别测试实验,结果表明所提方法取得了较好的效果.其中,开放测试识别准确率、召回率、F值分别达到了83.4%、95.7%、89.1%.
- 薛征山郭剑毅余正涛张志坤姚贤明
- 关键词:命名实体识别HMM旅游景点
- 旅游本体的构建研究被引量:3
- 2008年
- 本体是一种促使知识重用、知识共享和建模的模型。本文首先阐述了构建旅游领域本体知识库的必要性,然后利用OWLDL本体描述语言,通过定义本体类及其继承、类属性和关系、属性的约束以及本体实例的创建等步骤,完成了旅游领域本体的构建工作。
- 龚华明张元虹薛征山张艳梅
- 关键词:本体OWLDL
- 基于条件随机场的旅游领域命名实体识别方法
- 本发明涉及一种旅游领域命名实体识别方法,属人工智能领域。公开了人工进行了语料的收集、标注及文本预处理。在此基础上,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法,该方法包含两层,在低层条件随机场中以字为切分粒...
- 郭剑毅薛征山余正涛张志坤毛存礼万舟
- 文献传递
- 基于DF与LSA相结合的降维法的文本分类系统的研究被引量:1
- 2008年
- 介绍了中文文本分类系统的原理,在特征提取上采用了文档频率法(DF)与潜在语义分析法(LSA)相结合的方法,先采用DF法过滤掉DF值低的词条,降低文本矩阵的稀疏性,然后使用LSA法进行词语间的语义分析,消除同义词和多义词的影响,提高文本分类的速度与精确度。实验结果表明使用此种降维方法取得了良好的效果。
- 张元虹郭剑毅龚华明薛征山
- 关键词:文本分类潜在语义分析支持向量机