您的位置: 专家智库 > >

谷波

作品数:22 被引量:60H指数:4
供职机构:山西大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金山西省回国留学人员科研经费资助项目更多>>
相关领域:自动化与计算机技术自然科学总论语言文字文化科学更多>>

文献类型

  • 8篇专利
  • 6篇期刊文章
  • 6篇会议论文
  • 1篇学位论文
  • 1篇科技成果

领域

  • 12篇自动化与计算...
  • 1篇文化科学
  • 1篇语言文字
  • 1篇自然科学总论

主题

  • 7篇句法
  • 7篇句法分析
  • 5篇中文
  • 4篇语义
  • 4篇向量
  • 4篇框架语义
  • 3篇自然语言
  • 3篇最大熵
  • 3篇最大熵模型
  • 3篇文本分类
  • 3篇文本聚类
  • 3篇聚类
  • 3篇决策树
  • 3篇汉语
  • 2篇低维
  • 2篇递归
  • 2篇信息处理
  • 2篇信息过滤
  • 2篇循环神经网络
  • 2篇用户

机构

  • 22篇山西大学
  • 2篇上海师范大学
  • 2篇太原工业学院

作者

  • 22篇谷波
  • 8篇刘开瑛
  • 7篇李济洪
  • 6篇王瑞波
  • 4篇由丽萍
  • 4篇钱宇华
  • 3篇王钰
  • 3篇张惠春
  • 3篇李茹
  • 3篇牛倩
  • 3篇曹学飞
  • 2篇吕国英
  • 1篇刘建刚
  • 1篇张永奎
  • 1篇郭海旭
  • 1篇李黎
  • 1篇张娜
  • 1篇李禄
  • 1篇杨杏丽
  • 1篇孙占虎

传媒

  • 2篇中文信息学报
  • 2篇全国第八届计...
  • 2篇全国第八届计...
  • 1篇电脑开发与应...
  • 1篇计算机科学
  • 1篇中国科技成果
  • 1篇郑州大学学报...
  • 1篇2005第一...

年份

  • 1篇2023
  • 4篇2021
  • 2篇2020
  • 2篇2019
  • 2篇2018
  • 1篇2010
  • 1篇2009
  • 2篇2007
  • 5篇2005
  • 1篇2004
  • 1篇2003
22 条 记 录,以下是 1-10
排序方式:
一种基于GP的中医药专利命名实体自动识别方法
一种基于GP的中医药专利命名实体自动识别方法,其特征是通过模型的主动学习来实现中医药专利文献特征的自动抽取,然后根据所提取特征信息实现命名实体标注。本发明将遗传规划应用于中医药专利命名实体识别任务,使算法可以进行主动学习...
张亚宇谷波钱宇华马国帅
文献传递
基于粗集模型的聚类方法及其在文献过滤系统中的应用
信息过滤(Information Fitering)是一种个性化的、主动的信息服务机制,是对传统信息检索服务的有益的补充.信息过滤包括许多内容,如声音、图像和文本等等,在该文中,我们主要指对文献的过滤.聚类(Cluste...
谷波
关键词:信息过滤用户兴趣模型文本聚类向量空间模型
文献传递
有限汉语框架语义知识库构建技术研究
刘开瑛由丽萍李济洪李茹郝晓燕李禄贾君枝吕国英张惠春张双喜刘建刚姜忠市刘焘刘伟王振强谷波李黎董佳蓉赵玉娟张娜
技术说明有限汉语框架语义知识库构建技术研究是根据当前万维网技术的发展趋势和自然语言处理的现状自选的课题。该课题研制了一个以有限词语集合为描述对象的汉语框架语义知识库(Chinese FrameNet,简称CFN),并尝试...
关键词:
关键词:汉语框架语义自然语言处理
一种自然语言搜索的方法和装置
本发明公开了一种自然语言的搜索方法和装置,该方法为:构建汉语框架知识库CFN和专业领域知识本体库,然后利用汉语框架知识库对自然语言搜索输入的查询语句进行汉语框架语义角色自动标注,并根据所述标注从查询语句中提取具有语义信息...
李茹刘开瑛由丽萍王文晶高俊杰王瑞波吕国英谷波李双红钟立军彭洪宝陈雪艳郭海旭宋小香邢欣刘海静郭韦昱孙占虎
文献传递
文本数据建模中的机器学习重抽样理论与方法
2023年
在文本数据建模中,许多研究发现目前广泛使用的神经网络大模型,在常用的hold-outCV下,难以正确评估和优化模型,学习到的模型的预测性能稳定性也较差。为此,本课题研究和开发了一种统计机器学习新的重抽样方法,内容包括数据切分、模型的超参数调优、模型评估指标的统计分布、多个模型聚合、模型比较的假设检验和置信度计算等,称为组块正则化交叉验证(mX2BCV)建模方法,并从统计机器学习的模型评估和选择的基础理论上,论证了该方法的优良性,最后,在汉语句法语义自动分析器的建模中,验证了方法的可行性和优良性,开发完成了一个高性能的汉语句法语义分析器,为基于文本数据的稳健建模开辟了新途径。
李济洪王钰王瑞波杨杏丽曹学飞谷波牛倩薛彦
关键词:文本数据
文本聚类算法的分析与比较被引量:27
2003年
聚类是一种重要的数据挖掘形式。介绍了常用的文本聚类算法 ,从各种聚类算法的适用范围、初始参数的影响、终止条件以及对噪声的敏感性等方面对其进行了分析比较。
谷波张永奎
关键词:中文信息处理文本聚类算法信息过滤知识发现
面向标注数据稀缺专利文献的科技实体抽取被引量:2
2021年
专利中的科技实体是指专利文献中富含科技信息的词汇,抽取专利中的科技实体对科研工作者提高科研效率、企业布局专利体系都至关重要。提出一种基于半监督学习框架与命名实体识别模型相结合的科技实体抽取方法,半监督学习能够利用无标记数据的优势弥补标注数据稀缺的缺陷,利用大量的专利语料在通用领域的BERT模型基础上进行预训练,得到适用于专利领域的BERT模型BERT-Patent,有效提升模型对专利中科技实体的抽取性能。在专利数据集上的实验结果表明,提出的方法在准确率、召回率、F1值指标上分别提高了6.37%、2.99%、4.63%;在人民日报数据集上准确率、召回率、F1值分别提高了2.87%、1.24%、2.07%。
原之安彭甫镕谷波谷波
关键词:半监督学习
一种中医药专利文献命名实体自动识别的方法
一种中医药专利文献命名实体自动识别的方法,涉及自然语言处理领域,可用于中医药专利文献信息检索以及中医药知识图谱的构建。其特征是基于字n元组建立定界模块和分类模块,先对定界模块和分类模块进行训练,然后使用训练好的定界模块和...
谷波钱宇华张亚宇彭甫镕原之安
文献传递
一种基于频次分布校正的低维词表征学习方法
本发明公开了一种基于频次分布校正的低维词表征学习方法,对给定的语料,统计出设定窗口内词对的共现频次,通过对共现频次的对数值进行适当的幂次变换,根据语料自适应地优选幂次变换中的幂指数参数值,先将词对共现频次的分布校正为Zi...
曹学飞李济洪王瑞波王钰石隽峰谷波牛倩
文献传递
基于RNN的中文二分结构句法分析
为了构建一个简单易扩展的中文句法分析器,依据朱德熙和陆俭明先生的中文二分结构的层次分析句法理论,手工构建了一个三万甸的二分结构的中文句法树库,并使用哈夫曼编码方式来简化表示完全二叉树的层次结构.本文将中文句法分析转换为迭...
谷波王瑞波李济洪李国臣
关键词:循环神经网络
共3页<123>
聚类工具0