公共文化服务平台

2024年12月11日星期三

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

刘蔷: 作品数：4 被引量：23H指数：3; 供职机构：中国石油大学（北京）地球物理与信息工程学院更多>>; 发文基金：国家科技重大专项更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

朱丽萍中国石油大学北京地球物理与信息...
杨中国中国石油大学北京地球物理与信息...
李洪奇中国石油大学北京地球物理与信息...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

4篇中文期刊文章

领域

4篇自动化与计算...

主题

3篇信息抽取
3篇抽取
2篇抽取方法
1篇信息抽取方法
1篇信息熵
1篇引导词
1篇语料
1篇语义
1篇语义模式
1篇知识
1篇特征提取
1篇朴素贝叶斯
1篇朴素贝叶斯模...
1篇情感
1篇背景知识
1篇贝叶斯
1篇贝叶斯模型
1篇KNN
1篇KNN分类
1篇KNN分类算...

机构

4篇中国石油大学...
1篇中国石油大学
1篇中国石油

作者

4篇杨中国
4篇朱丽萍
4篇刘蔷
3篇李洪奇

传媒

2篇山东大学学报...
1篇计算机应用与...
1篇计算机工程与...

年份

2篇2016
2篇2015

共 4 条记录，以下是 1-4

全选清除导出

排序方式：

基于语义模式和引用分布的科技文献信息抽取被引量：3: 2015年; 科技文献中回顾前人研究成果、分析存在的问题、提出解决方法等语言片段是论文创新性信息的构成部分。分析论文写作过程中问题分析信息的逻辑思维以及在文章中呈现的篇章关系,综合利用引用分布特征、篇章关系特征、否定情感特征构建具有普适性的信息抽取语义模式。从论文原始文本中通过匹配定义好的语义模式抽取出问题分析信息。同时,利用引导词特征、语义相似度计算从论文文本中抽取出论文的主要工作信息。以数据挖掘领域科技文献为例,对比人工抽取结果对提出的方法进行评价,结果表明该方法能较准确抽取相应信息,为科技论文聚类、论文推荐提供基础数据来源。; 杨中国李洪奇朱丽萍刘蔷; 关键词：语义模式引导词

一种面向科技文献引言的信息抽取方法被引量：6: 2015年; 分析了引言部分写作模型,将文本按照句子级别划分为背景知识、问题分析、工作描述三个类别。统计每个部分句子的引导词、句型表达、线索词、所处位置的特征,并构建相应规则库。在分词和词性标注基础上,利用规则匹配每个句子得出所属的类别,从而抽取出三个部分的信息。以石油勘探开发类科技文献和数据挖掘类科技文献为例,进行人工判别和本文方法抽取试验,结果表明本文方法能准确获取相应信息。; 朱丽萍李洪奇杨中国刘蔷; 关键词：信息抽取背景知识

基于数据集特征的KNN最优K值预测方法被引量：13: 2016年; KNN算法中的参数K的选择一般采取多次交叉验证方法求取,数据规模较大时并不适用。同时,影响参数选择最根本的因素是数据集本身。因此,提出利用数据集本身的特征预测最优K值的方法。首先提取历史数据集的简单特征、统计特征、信息熵特征、简单算法精度特征、复杂度特征等构建特征向量,然后利用线性回归、神经网络等方法建立特征向量与最优K值之间的预测模型,并用该模型预测新数据集的最优K值。在UCI数据集上的实验表明,该方法能迅速预测最优K值,并确保一定的精度。; 李洪奇杨中国朱丽萍刘蔷; 关键词：KNN分类算法信息熵

科技文献的实验语料句抽取方法被引量：2: 2016年; 为方便研究自然语言处理的学者选择更有效的实验语料,进行自然语言处理类科技文献的实验语料抽取研究。实验语料是指自然语言处理类文献在实验过程中使用的文本类数据,如训练数据、测试数据等。将文本划分为实验语料句和非实验语料句两类,统计实验语料句的词汇特征和位置特征,构建相应的特征库,用朴素贝叶斯模型对特征进行训练。在词性标注和分词的基础上,结合机器学习生成的模型判定是否为实验语料句,进行抽取。以自然语言类科技文献作为数据来源,在该领域随机选取了200篇科技文献进行抽取实验,对比人工判别方法和所提方法的抽取结果,验证了所提方法能够较为准确地获取实验语料信息。; 朱丽萍刘蔷苏斐杨中国王显灿; 关键词：信息抽取特征提取朴素贝叶斯模型

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张