国家自然科学基金(60503070)
- 作品数:2 被引量:22H指数:2
- 相关作者:黄萱菁周雅倩邬桐吴立德谢永康更多>>
- 相关机构:复旦大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 英文口语中非流利区域的检测
- 本文介绍了我们在非流利部分检测以及对非流利句子进行句法分析上的工作。我们的主要贡献是扩大了非流利部分检测的特征集合,最佳特征选择,并且比较了三种不同的分类器(AdaBoost,Maximum Entropy,and Co...
- 张奇翁富良黄萱菁吴立德
- 关键词:条件随机场BOOSTING
- 文献传递
- 一种基于谱聚类的共指消解方法被引量:6
- 2009年
- 该文针对中文共指消解的具体任务,提出采用谱聚类的方法进行共指消解。首先,在待消解项对上抽取特征,使用最大熵模型判断两个待消解项存在共指关系的概率;然后,以此概率值作为相似度进行谱聚类;最后,得到若干实体,实现共指消解。该方法能从全局的角度进行实体划分,有效地提高准确率。在ACE 2007标准数据集上的Diagnostic实验结果表明该方法的ACE Value比baseline方法有了2.5%的提高,Unweighted Precision值有5.4%的提高。
- 谢永康周雅倩黄萱菁
- 关键词:计算机应用中文信息处理共指消解谱聚类最大熵模型
- 自动构建时间基元规则库的中文时间表达式识别被引量:16
- 2010年
- 该文提出一种基于正则文法的时间表达式识别算法:它基于"时间基元"①进行规则构建,提高了时间表达式识别的召回率;同时使用基于错误驱动思想的规则剪枝算法,削减了从训练语料带来的噪声,提高了识别的正确率,两者搭配有效提高了系统整体性能。在ACE07中文语料上的实验结果显著超过了现有水平,F-score达到89.9%。该文提出的算法具有很好的通用性和扩展性,加以改进将可以有更广泛的应用。
- 邬桐周雅倩黄萱菁吴立德
- 关键词:计算机应用中文信息处理错误驱动正则表达式