李生 作品数:5 被引量:7 H指数:1 供职机构: 苏州大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 江苏省高等学校大学生实践创新训练计划项目 更多>> 相关领域: 自动化与计算机技术 更多>>
基于PDTB的自动显式篇章分析器 被引量:1 2016年 自动篇章处理是自然语言处理中非常有挑战的一个任务,对自然语言处理的其他任务,如问答系统,自动文摘以及篇章生成都有重要的作用。近年来,大规模篇章语料PDTB的出现为篇章研究提供了一个公共的平台。该文在PDTB语料之上提出了一个完整的基于条件随机场模型的显式篇章分析平台,该平台包含连接词识别、篇章关系分类和关系论元提取三个子任务。给出了在PDTB上各模块的实验结果,并针对错误传播问题,给出了完整平台的性能及详细分析。 李生 孔芳 周国栋关键词:条件随机场 基于PDTB体系的隐式篇章关系识别 被引量:4 2016年 识别隐式篇章关系是篇章分析领域中非常有挑战的一个任务。该文基于PDTB语料提出一个隐式篇章分析识别方法,使用传统的特征如动词,极性和句法推导规则等,系统分析了它们对隐式篇章分析的影响。我们利用全部标注数据构建多个分类器并使用加法规则融合分类结果,此外还通过前向特征选择算法确定各分类任务最优的特征集。实验结果表明该方法能显著提升隐式篇章分析的性能。 李生 孔芳 周国栋汉语显式篇章关系分析 被引量:1 2014年 篇章关系分为显式和隐式两种。显式关系的显著特征是篇章的基本单元之间存在显式连接词。针对汉语显式篇章关系,构建了包括汉语连接词识别和篇章关系分类的显式篇章关系分析平台。该文选取汉语宾州树库(Chinese Penn Treebank,CTB)中的500篇文本进行了汉语显式篇章关系标注;结合连接词的中心词,采用最大熵分类器构建了汉语连接词识别模块,其性能F1值达到了66.79%;基于连接词及其词性等上下文特征,构建了篇章关系分类器,其在最顶层4大类语义关系上的分类性能的F1值为91.92%。 丁彬 孔芳 李生 周国栋关键词:最大熵分类器 一种基于JADE的数字图像盲水印算法 被引量:1 2011年 为了提高数字水印的鲁棒性,并实现水印的盲提取,提出一种基于离散余弦变换(DCT),离散小波变换(DWT)和独立成分分析(ICA)数字水印算法。在水印嵌入时,将原始图像做一次DWT变换以提取低频子带,对该低频子带进行DCT变换并按水印大小分块,最后依据人类视觉敏感度自适应嵌入。在水印提取时,读取可能遭受攻击的水印图像,调JADE算法提取多个水印副本,选择其中相似度最接近的两个水印副本进行PcA融合,最终得到融合后的水印图像。实验结果证明了该方法对于JPEG压缩、噪声、旋转等具有很好的鲁棒性。 李生 朱苏阳 赵煜 马小虎关键词:数字水印 主成分分析