您的位置: 专家智库 > >

曹馨宇

作品数:8 被引量:7H指数:2
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家社会科学基金更多>>
相关领域:自动化与计算机技术经济管理更多>>

文献类型

  • 4篇期刊文章
  • 4篇专利

领域

  • 4篇自动化与计算...
  • 1篇经济管理

主题

  • 4篇分词
  • 2篇导航
  • 2篇信息检索
  • 2篇业务性
  • 2篇元数据
  • 2篇智能导航
  • 2篇特征词
  • 2篇中文
  • 2篇中文命名实体
  • 2篇自然语言
  • 2篇自然语言理解
  • 2篇文法
  • 2篇WEB
  • 2篇查询
  • 2篇查询语句
  • 2篇词项
  • 1篇信息抽取
  • 1篇语料
  • 1篇知识获取
  • 1篇图模型

机构

  • 8篇中国科学院
  • 2篇中国科学院大...
  • 1篇中国科学院研...
  • 1篇中国标准化研...

作者

  • 8篇曹馨宇
  • 7篇曹存根
  • 3篇王石
  • 3篇吴昱明
  • 2篇刘亮亮
  • 2篇林乐宇
  • 2篇王东升
  • 2篇曹亚男
  • 2篇臧良俊
  • 2篇岳小莉
  • 2篇卢汉
  • 1篇王海涛
  • 1篇符建辉
  • 1篇夏飞

传媒

  • 3篇中文信息学报
  • 1篇清华金融评论

年份

  • 1篇2019
  • 1篇2015
  • 1篇2013
  • 2篇2011
  • 1篇2010
  • 1篇2009
  • 1篇2008
8 条 记 录,以下是 1-8
排序方式:
基于并列结构的部分整体关系获取方法被引量:2
2015年
部分整体关系是一种基础而重要的语义关系,从文本中自动获取部分整体关系是知识工程的一项基础性研究课题。该文提出了一种基于图的从Web中获取部分整体关系的方法,首先利用部分整体关系模式从Google下载语料,然后用并列结构模式从中匹配出部分概念对,据此形成图,用层次聚类算法对该图进行自动聚类,使正确的部分概念聚集在一起。在层次聚类基础上,我们挖掘并列结构的特性、图的特点和汉语的语言特点,采用惩罚逗号边、去除低频边、奖励环路、加重相同后缀和前缀等5种方法调整图中边的权重,在不损失层次聚类的高准确率条件下,大幅提高了召回率。
夏飞曹馨宇符建辉王石曹存根
关键词:图模型层次聚类
从Web获取部分整体关系语料的方法被引量:4
2011年
部分整体关系获取是知识获取中的重要组成部分。Web逐步成为知识获取的重要资源之一。搜索引擎是从Web中获取部分整体关系知识的有效手段之一,我们将Web中包含部分整体关系的检索结果集合称为部分整体关系语料。由于目前主流搜索引擎尚不支持语义搜索,如何构造有效的查询以得到富含部分整体关系的语料,从而进一步获取部分整体关系,就成为一个重要的问题。该文提出了一种新的查询构造方法,目的在于从Web中获取部分整体关系语料。该方法能够构造基于语境词的查询,进而利用现有的搜索引擎从Web中获取部分整体关系语料。该方法在两个方面与人工构造查询方法和基于语料库查询构造查询方法所获取的语料进行对比,其一是语料中含有部分整体关系的语句数量;二是从语料中进一步获取部分整体关系的难易程度。实验结果表明,该方法远远优于后两者。
曹馨宇曹存根
面向金融风险防控的互联网文本数据关键信息抽取标准研究被引量:1
2019年
防范化解金融风险是实现高质量发展必须跨越的重大关口。合理有效地利用文本中未被利用的与金融相关的信息,可以为金融风险的科学防范提供支持。本文基于已有的成就技术,通过制定规范的技术流程,结合实际应用时的技术现状、技术人员情况,通过标准化的方式,提供一种互联网文本数据关键语义信息抽取的普适性方法。
曹馨宇刘涌王海涛
关键词:金融风险信息抽取文本数据互联网风险防控技术流
中文命名实体中特征词项的识别方法和系统
本发明提供一种中文命名实体中特征词项的识别方法,包括:对待识别的命名实体进行分词操作,得到候选命名实体;对候选命名实体进行初步处理,得到第一计算结果;根据候选命名实体和第一计算结果建立词典,根据第一计算结果建立词境词典;...
曹馨宇曹存根岳小莉
文献传递
从Web中获取部分整体关系被引量:3
2013年
随着互联网的迅速发展,Web逐步成为知识获取的重要资源。部分整体关系获取是知识获取中的重要组成部分。该文提出了一种利用搜索引擎从Web中获取部分整体关系的方法。首先构造一种基于部分整体关系分类的意图查询,利用意图查询可以有针对性地从Web中获取尽可能多的包含部分整体关系语料。然后根据网页中的HTML标记和意图查询的格式过滤语料,并从中抽取候选部分整体关系,最后基于部分整体关系在自然语言表述中的特点和汉语的构词规律,提出用于验证候选部分整体关系的度量标准。实验结果表明,该方法取得了较高的准确率和F值。在前20个结果中准确率为86%,最优F值为64%。
曹馨宇曹存根吴昱明
关键词:知识获取
一种服务智能导航方法和系统
本发明提供一种服务智能导航方法,包括:对用户所提出查询语句的分词结果进行基于元数据的文法匹配;根据分词结果找出相匹配的词模模式,得到所述相匹配的词模模式所在的服务分类;将分词结果与描述性信息或业务性信息进行匹配查找,得到...
王东升曹存根林乐宇刘亮亮曹亚男卢汉王石曹馨宇臧良俊吴昱明
文献传递
一种服务智能导航方法和系统
本发明提供一种服务智能导航方法,包括:对用户所提出查询语句的分词结果进行基于元数据的文法匹配;根据分词结果找出相匹配的词模模式,得到所述相匹配的词模模式所在的服务分类;将分词结果与描述性信息或业务性信息进行匹配查找,得到...
王东升曹存根林乐宇刘亮亮曹亚男卢汉王石曹馨宇臧良俊吴昱明
文献传递
中文命名实体中特征词项的识别方法和系统
本发明提供一种中文命名实体中特征词项的识别方法,包括:对待识别的命名实体进行分词操作,得到候选命名实体;对候选命名实体进行初步处理,得到第一计算结果;根据候选命名实体和第一计算结果建立词典,根据第一计算结果建立词境词典;...
曹馨宇曹存根岳小莉
文献传递
共1页<1>
聚类工具0