黄永文
- 作品数:12 被引量:87H指数:6
- 供职机构:重庆大学计算机学院更多>>
- 发文基金:重庆市自然科学基金国家自然科学基金重庆市高等教育教学改革研究项目更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于依存关系分析的网络评论极性分类研究被引量:9
- 2010年
- 介绍一种利用句法依存关系对网络评论的极性进行自动分类的方法。通过从评论中提取出依存关系和词性,构成依存关系词性对,并利用自定义的极性词典进行分类,有效地减少计算的复杂度和提高分类的精度。实验表明,该方法相比其他方法取得了较好的分类效果,是一种可行且有效的对评论极性分类的方法。
- 李培何中市黄永文
- 关键词:网络评论
- 产品评论挖掘研究综述被引量:32
- 2008年
- 产品评论挖掘是以Web上用户发表的产品评论为挖掘对象,采用自然语言处理技术,从大量的文本数据中发现关于产品的功能和性能的评价信息的过程。产品评论挖掘是一个新兴的研究领域,是对自然语言描述的无结构数据进行数据挖掘的典型代表。产品评论中挖掘得到的信息不仅可以帮助生产厂商改进产品,还可以帮助用户合理的购买产品。对产品评论挖掘进行了全面深入地讨论,介绍了产品评论挖掘系统的通用框架,然后对产品特征提取、主观句定位、用户态度提取、态度极性判定、挖掘结果显示这5个子任务进行了详细地阐述,最后介绍了产品评论挖掘的最新方向。
- 伍星何中市黄永文
- 关键词:主观特征
- 基于互信息的统计语言模型平滑技术
- 自然语言处理是计算机科学中一个引人入胜、富有挑战性的课题。它的任务是建立一种能够模拟人类语言认知过程的计算模型。但是当前计算机的智能水平还远远不能与人类相提并论,困扰其发展的原因有很多,统计语言模型中数据稀疏的处理则是自...
- 黄永文
- 关键词:自然语言处理统计语言模型数据稀疏数据平滑互信息
- 文献传递
- 基于全局折扣的统计语言模型平滑技术被引量:4
- 2005年
- 数据平滑是用来解决统计语言模型在实际应用中遇到的数据稀疏问题.现有平滑技术利用不同的折扣和补偿策略来处理数据稀疏问题,在计算复杂性与合理性方面各有其优缺点.针对二元模型,笔者提出了一种基于全局折扣GD(GlobalDiscount)的平滑技术,其基本思想是对模型中每个二元对的频率值都进行不同程度的折扣,并用低阶模型对零概率事件进行补偿,通过极小化困惑度原则体现了模型的合理性.实验结果表明该平滑技术优于目前常用的Katz平滑技术.
- 黄永文何中市
- 关键词:统计语言模型
- 中文产品评论挖掘关键技术研究
- 随着网络的蓬勃发展,以用户为中心反映了用户使用体验、包含了用户对产品的特征、功能和性能等看法的产品评论越来越多。通过参考产品使用者所发表的产品评论,用户可以挑选最适合自己的产品,厂家也可据此对产品进行改进,从而增强企业竞...
- 黄永文
- 关键词:半监督学习支持向量机
- 文献传递
- 基于时间序列分析的动态分布平滑方法
- 2008年
- 统计语言模型在实际应用中显示出了不俗的效果,但由于语言的灵活性,模型的数据稀疏问题始终不能避免,现有的平滑方法只考虑了模型中元素出现的频数,没有考虑到语言的使用是随着时间变化的.本文分析了模型中词语随着时间的变化而出现的频数变化情况,利用时间序列模型分析中的预测方法获得下一个阶段的数据来估计模型的参数,提出了一种对在时间线上频数增加的词语增加概率值,对频数减少的则降低概率值的动态分布平滑方法.实验数据显示,本平滑方法具有一定的优越性.
- 黄永文何中市王海燕
- 关键词:自然语言处理统计语言模型数据稀疏时间序列分析
- 基于弱监督学习的产品特征抽取被引量:12
- 2009年
- 产品评论挖掘是从自然语言描述的用户评论中获取信息的过程,产品特征抽取是产品评论挖掘的第1个阶段,产品特征的好坏决定了产品评论挖掘中后续阶段的质量。采用弱监督的学习方法,只需要提供少量的产品特征作为种子,从这些种子出现的语句中抽取文本模式,利用文本模式来发现新的产品特征。实验结果表明,从英文文本中自动抽取产品特征的实验系统,取得了较好的效果。
- 伍星何中市黄永文
- 基于HLA/MAS的野营保障仿真建模研究被引量:1
- 2009年
- 在分析研究HLA与MAS结构与功能的基础上,提出了一种HLA与MAS的联合仿真建模策略,即以HLA/RTI为主体架构,将仿真模型分为底层Agent对象、中间层MA联邦成员、上层MAS联邦,利用MAS/Agent技术进行对象层智能建模。并将该策略应用于野营保障仿真模型的构建,分析了模型结构与组成,设计了主要仿真流程及Agent通信控制策略,给出了类定义的实例,探讨了原型系统的实现。
- 曹琦何中市黄永文卜淮原
- 关键词:仿真建模高层体系结构野营保障
- 基于互信息的统计语言模型平滑技术被引量:12
- 2005年
- 数据平滑主要是用来解决统计语言模型在实际应用中数据稀疏问题。现有平滑技术虽然已有效地对数据稀疏问题进行了处理,但对已出现事件频率分布的合理性并没有作出有效的分析。本文则针对二元模型,提出了一种基于互信息的平滑技术,其基本思想是根据模型中每个二元对的互信息的高低对其概率进行折扣或补偿,并用极小化困惑度原则体现了模型的合理性。实验结果表明该技术优于目前常用的Katz平滑技术。
- 黄永文何中市
- 关键词:计算机应用中文信息处理统计语言模型互信息
- 用户评论的分类获取被引量:6
- 2009年
- 对网上获取的用户评论进行标注,并提取出与用户评论内容相关的特征,使用χ2统计提取不同类型评论进行特征选择,使用支持向量机分类方法进行学习,获得分类器,以此对网上时时更新的用户评论进行分类,挖掘出优秀的评论。实验结果显示该方法具有很高的召回率和准确率。
- 黄永文何中市伍星
- 关键词:支持向量机