公共文化服务平台

2024年7月13日星期六

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

教育部留学回国人员科研启动基金([2007]1109): 作品数：4 被引量：67H指数：4; 相关作者：樊兴华王鹏吴渝宁亚辉王丹更多>>; 相关机构：重庆邮电大学更多>>; 发文基金：重庆市自然科学基金重庆市教育委员会科学技术研究项目教育部留学回国人员科研启动基金更多>>; 相关领域：自动化与计算机技术更多>>

相关作品
相关人物
相关机构
相关资助
相关领域

文献类型

4篇中文期刊文章

领域

4篇自动化与计算...

主题

3篇文本分类
2篇朴素贝叶斯
2篇文本
2篇贝叶斯
1篇隐马尔可夫模...
1篇语义
1篇知网
1篇拼音
1篇中文
1篇中文文本
1篇中文文本分类
1篇马尔可夫
1篇马尔可夫模型
1篇命名实体识别
1篇本体
1篇NB
1篇KNN
1篇K近邻
1篇词性

机构

4篇重庆邮电大学

作者

4篇樊兴华
2篇王鹏
1篇宁亚辉
1篇王丹
1篇吴渝
1篇陈集

传媒

1篇计算机应用
1篇大连海事大学...
1篇计算机辅助工...
1篇计算机科学

年份

2篇2009
2篇2008

共 4 条记录，以下是 1-4

全选清除导出

排序方式：

基于两步策略的中文短文本分类研究被引量：8: 2008年; 为更好地挖掘文本信息,研究了将两步策略用于中文短文本分类的3个关键问题,提出了基于组合朴素贝叶斯(NB)和K近邻(KNN)分类器的两步中文短文本分类方法:(1)直接利用NB和KNN的输出构造其对应的二维空间,根据该空间内错误文本的分布将测试文本集分为3部分:能被KNN可靠分类的文本集A,不能被KNN可靠分类但能被NB可靠分类的文本集B,其他文本集C.(2)用KNN、NB分别对文本集A和B进行分类,根据训练语料的类别分布,直接给属于文本集C的文本分配标签.与NB、KNN和支持向量机(SVM)的对比实验表明,该方法可获得较高的分类性能.; 樊兴华王鹏; 关键词：文本分类

面向短文本的命名实体识别被引量：17: 2009年; 针对短文本命名实体识别这项紧缺任务,提出了一种面向短文本的快速有效的命名实体识别方法。该方法主要分成三步:第一步,针对短文本表达不规范特性对命名实体识别的干扰,采取去干扰字符,化繁为简等规范化操作。第二步,针对短文本语意不完整特性,提出用HMM(隐马尔可夫模型)以词性做观察值进行初步命名实体识别。第三步,据初步识别结果,构建拼音同指关系库来识别潜在实体。在由8464篇短文本构成的测试集上运行的实验表明,该方法能较好地进行短文本命名实体识别。; 王丹樊兴华; 关键词：隐马尔可夫模型命名实体识别词性

基于领域词语本体的短文本分类被引量：40: 2009年; 短文本自身长度较短,描述概念能力弱,常用文本分类方法都不太适用于短文本分类。提出了基于领域词语本体的短文本分类方法。首先抽取领域高频词作为特征词,借助知网从语义方面将特征词扩展为概念和义元,通过计算不同概念所包含相同义元的信息量来衡量词的相似度,从而进行分类。对比实验表明,该方法在一定程度上弥补了短文本特征不足的缺点,且提高了准确率和召回率。; 宁亚辉樊兴华吴渝; 关键词：本体知网文本分类语义

中文文本分类的两步特征选择法被引量：4: 2008年; 针对从文集全局角度评价特征重要性的传统特征选择方法可能忽略某些重要分类特征的问题,提出两步特征选择方法.该方法首先过滤掉类别关联性不强的特征;然后根据词的统计信息将词归为各个类别的区分词,找出每个类的分类特征的最优子集;最后,将各个类别的最优子集组合起来形成最终分类特征.实验采用朴素贝叶斯作为分类器,使用IG,ECE,CC,MI和CHI等5种特征选择公式对该方法与传统方法进行比较,得到分类性能宏平均指标对比分别为91.075%对86.971%,91.122%对86.992%,91.160%对87.470%,90.253%对86.061%,90.881%对87.006%.该方法在考虑分类特征信息的同时,尽量保留传统特征选择方法中好的特征,能更好地捕获分类信息.; 陈集樊兴华王鹏; 关键词：中文文本分类朴素贝叶斯

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张