贾玉芳
- 作品数:2 被引量:7H指数:2
- 供职机构:晋中学院信息技术与工程学院更多>>
- 发文基金:山西省普通本科高等教育教学改革研究项目山西省教育科学“十一五”规划课题山东省教育科学“十一五”规划课题更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于朴素贝叶斯Web新闻内容的抽取方法被引量:4
- 2016年
- 针对网页信息自动抽取问题,提出一种将网页按标记分块并根据朴素贝叶斯理论从中识别新闻正文的方法。该方法将各分块的标记信息、文本相似度以及字长特征作为机器学习的特征属性。为提高标记属性的表征作用,减少相关标记之间的干扰,算法采用χ2检验法来检验标记属性之间以及标记属性与类别之间的相关性并实现属性约减。新闻正文抽取过程中同时考虑正文与非正文分块的后验概率,以提高抽取准确率。实验结果表明,选取适当的参数值,抽取新闻正文的准确率达到85%。
- 罗永莲赵昌垣贾玉芳芦彩林
- 关键词:朴素贝叶斯新闻网页网页分块正文抽取
- 项目反应理论在题库建设中的应用研究被引量:3
- 2015年
- 通常的题库管理系统都要根据经典测量理论,选择样本组进行测量,然后根据测量统计分析的结果,修改或选择合适的试题以完成题库建设。这种方法对测试组的能力有一定的依赖性,所得到的修正参数也存在偏差。针对经典测量理论存在的问题,提出以项目反应理论为基础,通过多次迭代,利用最大似然估计法估计被测试组的能力参数,在此基础上产生题目参数。用此题目参数对试题相应初始值进行修正,并根据这些参数指标组合成卷。实验结果表明,此方法估计出的题目参数相对稳定,不因测试组的不同而有明显变化,实践证明能显著提高试题的有效性。
- 罗永莲贾玉芳
- 关键词:项目反应理论最大似然估计