您的位置: 专家智库 > >

乐小虬

作品数:33 被引量:200H指数:9
供职机构:中国科学院文献情报中心更多>>
发文基金:国家科技支撑计划国家重点基础研究发展计划国家社会科学基金更多>>
相关领域:自动化与计算机技术文化科学天文地球电子电信更多>>

文献类型

  • 29篇期刊文章
  • 2篇会议论文
  • 1篇学位论文
  • 1篇专利

领域

  • 24篇自动化与计算...
  • 7篇文化科学
  • 2篇天文地球
  • 1篇电子电信
  • 1篇理学

主题

  • 5篇搜索
  • 4篇语义
  • 4篇主题
  • 3篇自然语言
  • 2篇地理信息
  • 2篇地理信息系统
  • 2篇电子政务
  • 2篇信息系统
  • 2篇隐形
  • 2篇语言
  • 2篇语言处理
  • 2篇语义角色
  • 2篇政务
  • 2篇时间序列
  • 2篇搜索技术
  • 2篇索引
  • 2篇嵌入式
  • 2篇嵌入式服务
  • 2篇桌面
  • 2篇自然语言处理

机构

  • 18篇中国科学院
  • 16篇中国科学院文...
  • 15篇中国科学院大...
  • 3篇中国医学科学...
  • 1篇中国科学技术...

作者

  • 33篇乐小虬
  • 10篇杨崇俊
  • 6篇刘冬林
  • 4篇何远标
  • 4篇于文洋
  • 3篇洪娜
  • 3篇张帆
  • 3篇张智雄
  • 3篇王子璇
  • 3篇张建兵
  • 2篇管仲
  • 2篇袁国华
  • 2篇付理
  • 2篇张荟娟
  • 2篇王刚
  • 2篇周强
  • 2篇田生军
  • 2篇杨洪志
  • 2篇张富庆
  • 2篇许丽媛

传媒

  • 12篇现代图书情报...
  • 6篇数据分析与知...
  • 2篇计算机工程
  • 2篇计算机工程与...
  • 1篇武汉大学学报...
  • 1篇物探化探计算...
  • 1篇高技术通讯
  • 1篇小型微型计算...
  • 1篇情报学报
  • 1篇计算机技术与...
  • 1篇科学观察
  • 1篇中国测绘学会...

年份

  • 2篇2022
  • 2篇2021
  • 2篇2019
  • 1篇2018
  • 1篇2017
  • 2篇2016
  • 3篇2015
  • 2篇2014
  • 2篇2013
  • 2篇2012
  • 1篇2010
  • 1篇2009
  • 1篇2008
  • 8篇2006
  • 3篇2005
33 条 记 录,以下是 1-10
排序方式:
电子政务与隐形搜索技术-词虎
本文对全新的WEBGIS隐形搜索技术以及相关软件“词虎”作了全面介绍,并对“词虎”在电子政务中作用进行了分析。
杨崇俊刘冬林张富庆王刚付理杨洪志田生军李彬张荟娟王芙蓉李津平乐小虬张建兵宋子辉
关键词:电子政务
文献传递
嵌入式桌面信息服务及其系统实现被引量:7
2008年
在用户操作现场感知用户需求,采用情景驱动,将科技文献服务即时嵌入到用户的工作流程之中。介绍这种嵌入式桌面信息服务的基本思想及系统设计、实现方法。
乐小虬李宇张晓林张智雄李春旺
关键词:嵌入式服务桌面工具信息检索
科技论文中数值指标实际取值识别被引量:4
2018年
【目的】科技论文中数值指标的大小有多种描述形式,本文旨在从不同形式的描述句中准确识别数值指标的实际取值。【方法】分析数值指标句中指标实体与数字实体间最小句法树路径,采用远程监督学习数值指标句的句法特征及描述特征,从领域候选句中识别数值指标句;利用少量语义标注数据学习"大于"、"小于"、"等于"、"倍数"4类取值关系模板,通过模板识别数值指标句的取值关系类别,依据不同取值关系模板对应的数值指标实际取值换算关系计算指标实际数值的大小。【结果】在气候变化领域和天文学领域开展实验,F值分别达到82.35%和77.55%,识别效果达到同类研究平均水平之上。【局限】以单句为数据单元开展识别研究,对于跨句间的指标取值问题未做考虑。【结论】本方法能够有效识别单句中数值指标的实际取值,识别过程不需要大量人工标注语料,迁移到其他领域时不做额外处理,系统性能不会明显下降,具有一定的实用性。
郭少卿乐小虬
面向社会文本流数据探测爆发主题方法浅析
2012年
社会文本流数据富含上下文环境信息、语言不规范且参与用户数量庞大。针对这类数据开展爆发主题探测需要寻找新的思路。本文对社会文本流数据的概念、特点以及爆发主题表达形式进行系统性梳理,从文本内容、时间、社会三个维度阐述探测爆发主题的主要研究思路和基本流程,分析利用社会特征(如用户参与、上下文环境、社团结构)进行爆发主题探测的主要技术方法。
乐小虬洪娜
关键词:社会网络
一对多实体关系少样本持续学习方法研究
2021年
【目的】在少量样本情况下识别句中一对多实体关系(如包含关系、并列关系等)实例,在新增类别后保持识别效果,实现持续学习。【方法】以LaserTagger模型为基础,利用文本生成的方法识别句子中包含、并列关系实体,并通过位置特征编码、加权Loss计算的方式增强模型在少样本情况下的特征学习能力,通过模型的压缩、扩展实现多个类别的持续学习。【结果】在少量训练样本的情况下,本文方法在5个类别上的SARI值均比基线模型提高1%以上;多类别依次学习的情况下,通过模型的压缩、扩展能够较好地保留模型已学习到的知识,SARI值最高能提升16.92%。【局限】仅选取包含关系、并列关系中的5种句式类别进行实验,数据类别较少,句式结构比较简单,暂未考虑模型在更多类别、更复杂句式情况下的性能。【结论】所提方法在一定程度上能满足少样本、多类别依次学习的应用场景,具有一定优越性。
江雅仁乐小虬
基于能量演化线索的潜在爆发词探测方法被引量:16
2010年
从跟踪词能量演化线索的角度分析潜在爆发词探测的可行性,提出一种基于词的能量和能量增长趋势的潜在爆发词探测方法。首先对词的生命周期及其演化现象进行阐述,在方法分析和词的能量积累与衰减、能量趋势变化分析的基础上,提出建模依据,设计EneTr模型,并分别针对EneTr模型中的关键问题提出相应的解决方案,实现具体的算法,最后分别针对网络新闻和科学文献两种类型的文档流进行分析和实验,验证本方法的效果。
洪娜张智雄乐小虬
关键词:时间序列
学术论文大纲中关键术语抽取方法研究被引量:7
2014年
【目的】针对学术论文大纲内容精炼、层次性的特点,研究从中抽取重要且具有实质意义术语的方法。【方法】结合语言学规则和术语词典从大纲各级标题中识别出候选术语集,然后根据术语间的句法依存关系计算tf-idf,并利用大纲结构量化术语层级特征,最后结合tf-idf与层级特征对候选术语进行排名,选择出关键术语。【结果】实验证明,该方法的候选术语识别F值达到89.57%,术语选择F值达到36.89%。【局限】采用的术语抽取规则不完备,且tf-idf计算过程中的权值设置仅使用经验值,导致未能达到最优效果。【结论】该方法能有效抽取大纲中的关键术语,适用于层级结构中的关键术语抽取。
何远标乐小虬张帆
DPaper:一种面向语义出版的结构化论文写作工具设计与实现被引量:7
2016年
【目的】面向语义出版构建论文写作工具,在论文写作阶段实现内容结构化、对象化,使得一篇论文即是一个系统,论文可运行、可交互、可体验。【方法】采用数字对象和数字模板技术将论文内容(元数据、章节、数据、富媒体等)分解成不同类型数字对象,数字对象间采用模板进行组织,通过事件触发机制实现交互,采用HTML5网页形式进行编辑和呈现并存储为XML结构化文档包。【结果】DPaper结构化论文写作工具已上线,提供从素材收集(云笔记)、数字对象制作、自动标引参考文献、按期刊版式呈现到Word文档格式转换等一系列功能,论文内容实现对象化和部分语义化。【局限】与常规论文编辑器相比,数字对象编辑器功能还不完善,还不能创建公式、图形等对象,排版的灵活性不足。【结论】利用DPaper写作工具可以在写作阶段由作者构建出满足语义出版应用需求的结构化论文。
乐小虬王子璇张晓林何远标付常雷许丽媛
关键词:写作工具
面向单篇文献引文网络的主题来源与走向追踪被引量:2
2015年
【目的】从单篇文献入手,在其引文网络中追踪研究主题的来源与走向。【方法】首先,利用领域本体识别单篇文献中的主题;其次,筛选与主题相关的二级参考文献、参考文献、引证文献、二级引证文献,构建面向单篇文献的引文网络;然后,对引文网络进行增量聚类处理,形成主题的来源与走向演化图。【结果】充分揭示文献主题来源或走向中继承、分化、合并的结构变化及各阶段的内容变化。【局限】引文网络构建时文献的筛选条件有待深入研究;主题识别未考虑领域本体中词汇收录不完备问题。【结论】本研究对单篇文献主题的来源与走向进行有效的追踪,能够较好地揭示文献主题的来龙去脉。
秦晓慧乐小虬
关键词:引文网络单篇文献
基于空间语义角色的自然语言空间概念提取被引量:31
2005年
根据空间信息的特点,从定义的空间语义角色入手,通过语义角色标注、短语识别以及概念模式匹配等手段,具体分析了自然语言中的空间实体、实体间空间关系以及空间过程的表达与提取方法。
乐小虬杨崇俊于文洋
共4页<1234>
聚类工具0