李学钰
- 作品数:10 被引量:25H指数:3
- 供职机构:安阳师范学院更多>>
- 发文基金:国家教育部博士点基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 最大熵模型的事件分类被引量:7
- 2010年
- 提出了一种基于最大熵模型的事件分类方法,该方法能够综合事件表述语句中的触发词信息及各类上下文特征对事件进行分类。对其中的两个关键问题:参数估计、特征模板与特征选择进行了详细论述,采用IIS算法学习模型参数,使用增量选择方法选择特征。应用该方法对人民日报语料中的职务变动、会见、恐怖袭击、法庭宣判、自然灾害五类事件进行了分类实验,结果表明,该方法的分类效果明显优于传统的分类方法。
- 于江德李学钰樊孝忠庞文博
- 关键词:事件信息抽取最大熵模型
- 一种利用中文人名判定性别的方法
- 本发明公开一种利用中文人名判定性别的方法,包括:(1)统计分析中文人名语料中男女不同性别的用字特征;(2)提取中文人名中用字信息并设计中文人名的表征;(3)采用交叉验证法,选择合适的特征向量构建训练样本;(4)计算训练语...
- 于江德赵红丹王希杰谷川李学钰郑勃举黄勇杰王继鹏吕靖李晓
- 文献传递
- 一种汉语选词填空方法
- 本发明公开了一种汉语选词填空方法,包括以下步骤:S1、从一给定的训练语料中获得词语特征及其出现的频次;S2、切分要进行汉语填空的汉语句子:将待填空的汉语句子切分为词语序列;S3、计算比较待填空的汉语句子所对应的词语序列条...
- 于江德李学钰王希杰武宇浩武肖菡张春雨常银辉
- Internet的普及对高校图书馆信息资源建设的影响及其对策被引量:1
- 2003年
- 本文探讨了Internet的普及对高校图书馆信息资源建设的影响,提出了网络环境下高校图书馆信息资源建设的策略和方法。
- 李学钰
- 关键词:信息资源建设
- 一种基于多层感知机的中文人名判定性别的方法
- 本发明属于人工智能技术领域,具体公开了一种基于多层感知机的中文人名判定性别的方法,具体步骤为:在字词向量训练语料上采用word2vec得到中文人名用字的初始字向量和词向量;将中文人名语料按一定比例划分为训练语料和测试语料...
- 于江德李学钰王继鹏李娜翁晓茹白香凝
- 文献传递
- 高校图书馆和大学生信息素质教育被引量:3
- 2003年
- 信息素质教育的内涵;当代大学生进行信息素质教育的必要性;高校图书馆在大学生信息素质教育中的作用和途径。
- 李学钰
- 关键词:高校图书馆信息素质教育大学生
- 信息抽取中领域本体的设计和实现被引量:14
- 2008年
- 领域本体在信息抽取系统有着重要作用。该文介绍了本体、领域本体的基本概念,并探讨了领域本体与信息抽取的关系。提出了信息抽取系统中领域本体的设计准则和实施步骤,实施步骤包括领域本体需求分析、收集本体信息、构建领域本体框架、形式化编码、确认和评价等。在信息抽取原型系统中实现了显示器领域本体,并将该领域本体应用到信息抽取中的命名实体识别、抽取模式获取和主题概念提取等任务中,应用结果表明该方法、步骤是可行的。
- 于江德李学钰樊孝忠
- 关键词:本体构建信息抽取领域本体
- 一种汉语选词填空方法
- 本发明公开了一种汉语选词填空方法,包括以下步骤:S1、从一给定的训练语料中获得词语特征及其出现的频次;S2、切分要进行汉语填空的汉语句子:将待填空的汉语句子切分为词语序列;S3、计算比较待填空的汉语句子所对应的词语序列条...
- 于江德李学钰王希杰武宇浩武肖菡张春雨常银辉
- 文献传递
- 一种汉语由字组词方法及装置
- 本发明公开了一种汉语由字组词方法及装置,包括以下步骤:S1、融合多个语料库获得最终的词语频次统计结果;S2、确定组词汉字;S3、由确定的汉字生成候选词语;S4、从最终的词语频次统计结果中根据候选词语的词语频次由高到低依次...
- 于江德李学钰赵红丹张津铭张悦杨英
- 文献传递
- 基于两个层次Bi-LSTM的汉语句子排序方法
- 本发明属于自然语言处理技术领域,公开了基于两个层次Bi‑LSTM的汉语句子排序方法,在词向量训练语料上采用word2vec得到训练语料中词语的词向量;对选取的汉语句子排序语料进行预处理;采用第一层次的Bi‑LSTM模型实...
- 于江德李学钰宋俊昌武宇浩杨佩于
- 文献传递