曲维光
- 作品数:102 被引量:390H指数:13
- 供职机构:南京师范大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金江苏省社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 基于转发图的微博事件主题摘要方法被引量:2
- 2014年
- 自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化.
- 赵斌吉根林曲维光顾彦慧
- 关键词:可视化
- CLUCENE在语料库建设中的应用
- 2008年
- 深入分析了现有语料库的构建模式和语料库应具备的功能模块,提出基于文件系统和Clucene全文检索引擎工具包的语料库建设方案.实验证明,Clucene具有丰富的接口设计和良好的扩展性,为语料库建设提供了一种较好的技术实现方式.
- 贺胜曲维光卢亚军
- 关键词:CLUCENE语料库语料库建设
- 基于机器学习与语义知识的动词隐喻识别被引量:2
- 2011年
- 在自然语言中,动词的用法主要包含3种:字面、转喻和隐喻.动词的隐喻用法在隐喻的研究中占有重要的地位.动词的隐喻计算包含两个子任务:隐喻识别和隐喻理解.本文采用条件随机场、最大熵模型来识别动词的隐喻搭配,并在此基础上,加入了两种语义信:息《同义词词林》的同义词信息和《知网》的语义信息来识别动词的隐喻表达,实验识别正确率可达94.47%.
- 赵红艳曲维光张芬周俊生
- 关键词:知网同义词词林
- 词向量和语义知识相结合的汉语未登录词语义预测研究被引量:2
- 2020年
- 【目的】将词向量和语义知识相结合,提高未登录词语义预测的准确性。【方法】抓取含有未登录词网页的语料,利用Word2Vec等模型得到词语的分布式表示信息,再结合构词语义知识对候选词进行中心词和词性过滤,实现未登录词的语义预测。【结果】在人民日报语料未登录词测试集上的实验结果表明,模型预测正确率可达87.5%,高于只使用词语内部知识的模型和只使用外部分布信息的词向量模型。【局限】无法预测语义不透明的未登录词。【结论】将携带词语外部信息的词向量与词语内部特征相结合,显著提高了未登录词语义预测的正确率,说明词语内、外部信息对于语义的组成有重要作用。
- 魏庭新柏文雷曲维光
- 关键词:未登录词语义知识
- 一种基于神经网络的三维催化材料催化特性筛选系统
- 本发明公开了一种基于神经网络的三维催化材料催化特性筛选系统,包括催化剂材料浅层特性采样模块、催化剂材料结构信息嵌入模块、催化材料性质学习模块、催化材料隐层信息表示模块和催化材料多任务筛选模块,所述催化剂材料浅层特性采样模...
- 顾彦慧李亚飞顾敏卢新宇曲维光王金兰周俊生张先锋
- 文献传递
- 《论语》与其注疏文献对齐语料库的构建被引量:8
- 2012年
- 文章讲述构建《论语》与其注疏文献对齐语料库的必要性、设计思路和基本方法,并说明采用这种新途径研究《论语》的初步成果,以及该项研究在《论语》的教学和训诂学研究中所起到的巨大作用。
- 马创新陈小荷曲维光陆鹏飞
- 关键词:《论语》语料库教学
- 带标记信号量机制的拓广被引量:3
- 2001年
- 本文通过对现有普通信号量及带标记信号量机制的研究 ,提出带标记数组型信号量和泛化带标记数组型信号量机制 ,可以很好地解决原有信号量难以解决的问题 。
- 曲维光
- 关键词:信号量计算机网络操作系统
- 基于认知属性库的原型范畴研究被引量:3
- 2016年
- 原型范畴是认知科学研究中的重要理论,使用属性来区分范畴中心成员及边缘成员有着较强的解释力,但该理论一直缺乏基于频率信息的属性数据支撑。该文借助认知属性库的23万条数据,对原型理论研究中经常讨论的"鸟"、"水果"、"交通工具"等范畴的典型成员和非典型成员进行分析验证。认知属性库的数据显示,在汉语中,"鸟"的典型成员是"麻雀"、"燕子"等,和"鸟"具有较多的共同属性;而"企鹅"、"鸵鸟"则只共享了"鸟"很少的属性,且缺少关键的属性"飞"。大体上验证了原型理论的观点。同时,我们也发现"小鸟"的属性特别丰富,具有典型成员的特性。在进一步观察了"水果"和"交通工具"两个范畴后,我们探讨了范畴的跨类现象,进而从数学模型上区分了树结构的层次分类体系和图结构的范畴化体系。
- 李斌宋丽银思琪曲维光王萌
- 关键词:语义分类语义计算
- 基于统计学习模型的句法分析方法综述被引量:22
- 2013年
- 句法分析是自然语言处理领域中重要的基础研究问题之一。近年来,基于统计学习模型的句法分析方法研究受到了广泛关注,多种模型与算法先后被提出。从采用的学习模型和算法类型着手,该文系统地对各种主流和前沿方法进行了归纳与分类,着重对各类模型和算法的思想进行了分析和对比,并对中文句法分析的研究现状进行了综述;最后,对句法分析下一步的研究方向与趋势进行了展望。
- 吴伟成周俊生曲维光
- 关键词:句法分析
- 基于多分类器集成的古代汉语词义消歧
- 本文首先分析了古代汉语词义义项特点,考察了词义消歧的难点,确定出面向汉语信息处理的词语义项区分遵循的原则和方法。然后在现有的词义消歧理论基础上,采用机器学习的方法,选择合适的特征,使用高效率的NaiveBayes、RFR...
- 于丽丽丁德鑫曲维光陈小荷石民
- 关键词:中文信息处理古代汉语词义消歧分类器集成
- 文献传递