滕青青
- 作品数:5 被引量:26H指数:3
- 供职机构:华东理工大学更多>>
- 相关领域:自动化与计算机技术文化科学经济管理更多>>
- 基于文献的中文命名实体识别算法适用性分析研究被引量:11
- 2010年
- 命名实体识别(Named Entity Recognition)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。首先对我国关于命名实体识别研究的文献进行了总结,给出命名实体识别的主要方法及模型。并针对文献中对这些命名实体识别方法的效果进行统计分析,探讨各种识别对象、识别模型的效果及适用性。经过对现有研究文献的统计,结论为:在不考虑运行效率的情况下,对于机构名,识别效果最好的是层叠CRF模型;对于地名,测试效果最好的是CRF方法与专家知识相结合;人名识别方法中表现不错的则是边界模版和局部统计相结合的模型。
- 滕青青吉久明郑荣廷李楠
- 关键词:中文命名实体识别隐马尔可夫模型最大熵模型支持向量机条件随机场
- 基于启发式规则的中文化学物质命名识别研究被引量:12
- 2010年
- 针对现有的命名实体识别方法不能很好地处理专业领域特定命名抽取的问题,提出一种基于启发式规则的专业命名识别方法。以中文文本中化学物质命名为研究对象,分析其领域特征及统计语言特征,建立适用于化学领域文献命名识别的启发式规则,为专业领域的命名实体识别提供新的解决方案。对比实验证明本文的方法能有效提升专业命名识别的效率。
- 李楠郑荣廷吉久明滕青青
- 关键词:启发式规则IUPAC
- 我国信息市场研究综述
- 2010年
- 信息作为一种特殊的商品,既是经济社会发展的资源,也是经济社会发展的强大推动力。作为信息交换平台的信息市场因此成为学术界的研究热点。众多专家学者从不同角度,对信息市场进行深入研究。文章通过对我国信息市场的三个研究阶段进行综合分析,提出我国信息市场研究的不足和未来研究方向,以期促进我国信息市场研究的进一步发展。
- 郑荣廷任福兵吉久明孙济庆滕青青
- 关键词:信息市场
- 中文化学物质名称识别研究被引量:4
- 2010年
- 在CRF模型下,进行单字标注和单元词标注的识别效果和识别效率的比较;实验结果表明,单字标注在付出更长运行时间的代价下,较单元词标注识别效果更佳;此外,还研究特征数量对实验效果的影响。
- 郑荣廷李楠吉久明滕青青
- 关键词:条件随机场
- 本体整合策略及其自适应机制研究
- 本体最初起源于哲学领域,被定义为“存在”的科学。20世纪90-年代,本体被逐渐引用到知识工程,人工智能(AI)及图书情报领域。<br> 随着信息技术的发展,产生了信息爆炸现象,随之产生了语义检索等需求。...
- 滕青青
- 关键词:自适应机制语义检索信息检索