王荀
- 作品数:2 被引量:1H指数:1
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 服务于内容侧面发现的框架识别
- 2012年
- 文本内容通常包含多个侧面,全面地识别这些内容侧面对自然语言处理有重要地意义。传统的统计方法使用简单特征难以识别出所有的内容侧面。以自动摘要为例,传统的抽取式方法多以词频为主要特征,一些重要的句子常因重复度不高被舍弃。要想全面地覆盖原始文本的重要信息,就要识别出文本描述的内容侧面。该文以框架语义学为指导,使用FrameNet语料库作为知识库,综合多种特征来标注文本描述的框架,在此基础上识别文本所包含的内容侧面。该方法在新闻语料上取得了较好地结果,达到了61%的正确率。
- 王荀李素建宋涛姜伯平
- 内容标签和关系标签相结合的汉语篇章标注规范被引量:1
- 2015年
- 篇章标注是自然语言处理中的重要任务,很多其他任务,如自动摘要、机器问答等都可以通过篇章标注得到对文本内容和语义的认识,从而获得更好的结果。与此同时,篇章理解的理论如篇章修辞结构(RST),向心理论(CT)等与实际问题的结合并不紧密,难以实用。该文中我们参考现有的语言学理论和一些语篇标注库(如RSTDT,PDTB),并结合自然语言处理任务特点,提出了一套用于篇章标注的汉语标注体系。这个体系能够比较准确和全面地描述出篇章的内容和逻辑关系,并很好地服务于实际任务的需要。
- 王荀李素建王宇昕
- 关键词:修辞结构理论