张文静
- 作品数:4 被引量:38H指数:3
- 供职机构:东北林业大学信息与计算机工程学院更多>>
- 发文基金:黑龙江省博士后基金哈尔滨市青年科学研究基金苏州市职业大学校级科研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于混合策略的高精度长术语自动抽取被引量:18
- 2009年
- 在目前的术语自动抽取中,双字词的精度已经达到了90.36%,但是三字以上的词的抽取精度只有66.63%,多字词的抽取成为了术语自动抽取的一个难点。该文提出了NC-value参数和互信息相结合的混合策略来识别三字以上的长术语的方法。该方法充分发挥了NC-value参数在利用词语上下文信息和互信息参数在词语结合强度两方面的优势,两者相互约束和配合,更有利于找到准确的长术语边界。采用生物信息领域Yapex语料进行实验,结果表明,三字以上长术语抽取正确率和召回率分别达到88.5%和76.6%,F测量值达到82.2%,稍高于其他方法的结果。
- 梁颖红张文静周德富
- 关键词:计算机应用中文信息处理术语抽取互信息
- 粗糙集和遗传算法集成的故障诊断知识获取被引量:1
- 2009年
- 在分析智能故障诊断方法的基础上,提出了粗糙集和遗传算法集成的策略,进而给出了该方法的知识获取模型.该模型首先将粗糙集理论引入到故障诊断特征提取中,用于解决实际故障诊断数据样本分类边界不确定问题,接下来采用优化能力较好的遗传算法进行故障规则获取.通过实例验证表明:在有效保持故障诊断分类结果的情况下,该方法可以提取出最能反映故障的特征.
- 梁颖红张有承张文静
- 关键词:遗传算法粗糙集故障诊断
- 术语抽取技术研究被引量:12
- 2008年
- 术语抽取技术是信息处理领域的一项基础性课题,在很多领域也都有很重要的作用。总结了术语抽取技术的一些代表性的方法,并对各种方法进行了比较和对照,归纳了各种方法的优缺点,最后指出了目前术语抽取技术的发展趋势。
- 张文静梁颖红
- 关键词:术语抽取
- C值和互信息相结合的术语抽取被引量:8
- 2010年
- 在目前的生物信息领域开放语料的术语抽取实验中,前2000多个双字词的精度已经达到了90.36%,但是三字以上的词的抽取精度只有66.63%,多字词的抽取成为了名词术语自动抽取的一个难点问题。针对该难点,提出综合C-value参数在长术语抽取方面的优势,并与术语抽取中的互信息参数相结合的策略来识别术语。实验结果表明,长术语抽取正确率为75.7%,召回率为68.4%,F测量值为71.9%,高于相同语料下的其他方法。
- 梁颖红张文静张有承
- 关键词:术语抽取C值互信息