您的位置: 专家智库 > >

何晓丰

作品数:9 被引量:13H指数:2
供职机构:华东师范大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 5篇期刊文章
  • 3篇专利
  • 1篇会议论文

领域

  • 6篇自动化与计算...
  • 1篇文化科学

主题

  • 3篇抽取
  • 2篇点击率
  • 2篇用户
  • 2篇用户组
  • 2篇优化算法
  • 2篇曝光量
  • 2篇网络
  • 1篇点击量
  • 1篇多样性
  • 1篇多语
  • 1篇多语言
  • 1篇信息抽取
  • 1篇信息定位
  • 1篇序列聚类
  • 1篇学生知识
  • 1篇英文
  • 1篇用户管理
  • 1篇语言
  • 1篇语言特性
  • 1篇语义

机构

  • 9篇华东师范大学
  • 1篇复旦大学

作者

  • 9篇何晓丰
  • 4篇张蓉
  • 4篇宫学庆
  • 3篇周傲英
  • 2篇郭心语
  • 1篇伍顺敏
  • 1篇王立
  • 1篇余文喆
  • 1篇沙朝锋
  • 1篇王晓玲
  • 1篇李金洋
  • 1篇纪文迪
  • 1篇樊艳
  • 1篇王燕华

传媒

  • 2篇计算机研究与...
  • 1篇华东师范大学...
  • 1篇计算机学报
  • 1篇计算机应用
  • 1篇第30届中国...

年份

  • 1篇2024
  • 1篇2023
  • 1篇2020
  • 1篇2016
  • 1篇2015
  • 4篇2013
9 条 记 录,以下是 1-9
排序方式:
中文分类体系的构建与查询系统
2016年
针对中文语言环境中缺少分类体系,无法明确实体类别并建立语义关系的问题,基于维基百科,提出一种混合架构,构建了大规模中文分类体系及其展示查询系统(CTCS2)。CTCS2包括两个模块:离线模块和在线模块。离线模块又分为SVM底层关系抽取子模块、顶层分类树构建子模块两部分。首先,采用SVM分类模型抽取语义关系,明确实体类别;然后,通过启发式规则、关联规则挖掘的方式挖掘上层抽象概念关系;其次,使用自底向上的算法从独立的关系中生成完整的中分分类体系,以分类树的形式展现;最后,在线模块分析展示了生成的分类树,并提供语义查询。实验表明,生成的语义关系的准确率高达95%;为评估分类体系包含中文知识的独特性,使用映射的方法生成YAGO的中文版本,YAGO-C,与之相比,CTCS2中仅有47.15%的实体被英文版本覆盖,说明了CTCS2的中文独特性。CTCS2为实体明确了类别类型、在类别类型间建立了语义关系,为构建中文知识图谱提供了基础的语义支持。
李金洋王燕华樊艳汪诚愚张蓉何晓丰
关键词:知识图谱支持向量机启发式规则维基百科
一种基于曝光量和点击率的用户组优化策略
2013年
行为定向技术在网络广告投放过程中起着非常重要的作用,其中最关键的就是对用户进行分组.好的用户分组策略能够产生高质量的用户组,对用户组内的用户投放广告能够有效提高点击量(曝光量×点击率).传统的用户分组策略评估方法重点考虑点击率(click-through rate,CTR)提高程度,忽略了曝光量(impression)的重要性.曝光量受到用户数量的影响,当用户组中的用户数量达不到一定值时,看到广告的用户数量很少,导致曝光量非常少,即使广告的CTR很高,点击量和广告转换量也会非常少,针对这样的用户组投放广告不会为广告主带来特别大的收益.针对曝光量小的用户组,提出一种用户组优化算法,可保证最终分组结果同时具备高的CTR提高程度和曝光量.在真实数据集上进行实验,结果表明经过优化之后的用户组在保证CTR的同时大幅度提高了曝光量和点击量.
郭心语何晓丰宫学庆张蓉周傲英
关键词:优化算法曝光量点击率点击量
基于用户分组的广告定位(英文)被引量:2
2013年
在线广告在当今的电子商务时代中扮演者愈加重要的角色.在线广告依靠其灵活的内容推荐和个性化推荐,与报纸、电视等传统媒体相比具有更高的精确性.广告定位的应用可以精确地将广告推送给对其感兴趣的用户.本文讨论研究领域和工业领域中所使用的广告定位技术,并阐述基于用户分组来进行广告推送可以大幅度的提高广告的点击率(CTR).
宫学庆王立何晓丰
关键词:广告定位
一种基于学生知识状态和学习能力的知识追踪预测方法
本发明公开了一种基于学生知识状态和学习能力的知识追踪预测方法,具体包括:1)根据历史做题记录,提取出学生在对应知识点上的学习能力;2)结合学生能力信息,通过序列神经网络和自注意力网络对学生在各个时间步上的知识状态进行编码...
张钰波何晓丰
一种基于无监督伪语义数据增强的零样本多语言理解算法
本发明公开了一种基于无监督伪语义数据增强的零样本多语言理解算法,利用一种无监督伪语义数据增强机制,在无需人工干预的情况下对训练数据进行增强。本发明为获得多语言相似语义token设计了一个从单语言过渡到多语言的序列聚类器。...
李东阳张涛林汪诚愚何晓丰
一种基于曝光量和点击率的用户组优化策略
定向技术在网络广告投放过程中起着非常重要的作用,其中最关键的就是对用户进行分组.好的用户分组策略能够产生高质量的用户组,对用户组内的用户投放广告能够有效提高点击量(曝光量×点击率).针对曝光量小的用户组,提出一...
郭心语何晓丰宫学庆张蓉周傲英
关键词:计算机网络用户管理优化算法曝光量点击率
面向上下位关系预测的词嵌入投影模型被引量:8
2020年
上下位关系是自然语言处理领域中的重要概念,用于描述概念之间的从属关系.上下位关系的精准预测,有助于挖掘概念之间的内在层次结构,是构建大规模语义网络、知识本体、知识图谱等知识密集型系统的重要基石.传统上下位关系的预测算法大多依赖较为固定的语言模式,因而具有低覆盖度、高人工干预等缺陷.此外,语言模式与语言本身的特性高度相关,在中文等表述灵活的语言中预测精度较低.随着深度学习技术在自然语言处理领域迅猛发展,词嵌入技术被广泛应用于建模词之间的语义关系.特别地,词嵌入投影模型学习如何将下位词的词向量投影到上位词的词向量,显式地建模了上下位关系的关系表示.基于已有经典研究以及最新成果,本文详细论述了词嵌入投影模型的发展过程和最新研究进展,包括基于迭代学习、转导学习、对抗学习等深度学习技术在词嵌入投影模型上的改进.在实验中,我们对多个词嵌入投影模型在中文和英文的公开数据集上进行充分详细的评测,探讨了不同的词嵌入投影模型在不同学习场景下的优缺点.最后,在面向特定领域和长尾上下位关系抽取等问题上探讨了未来的研究展望.
汪诚愚何晓丰宫学庆周傲英
关键词:上下位关系关系抽取
考虑观点多样性的评论选择问题被引量:3
2015年
在线用户评论向消费者提供了丰富的商品信息,帮助他们挑选从日常用品到娱乐活动相关的商品.然而,评论的数量之大让用户难以对商品有一个清晰的认识.现有解决电子商务网站中评论信息过载问题的方法包括评估评论质量以及总结评论观点等.但是,基于评论质量排序的方法可能信息冗余,而评论总结方法忽视上下文导致易读性较差.因此,需要实现有效的评论选择方法.设计了基于字典和规则以及基于主题模型LDA的观点获取算法来形式化地表示每条评论;提出一种基于贪心算法的评论选择方法,实现从商品评论集中选择一组高质量的评论,并最大化评论集的商品属性覆盖度和评论观点多样性.最后在真实数据集上对算法进行实验来验证该算法,实验结果表明了该算法的有效性.
余文喆沙朝锋何晓丰张蓉
一种基于点击日志的新广告点击率预测方法及系统
本发明公开了一种基于点击日志的新广告点击率预测方法及系统,该方法包括以下步骤:特征抽取步骤,通过对点击日志进行自动分析,抽取出有意义的特征后对其生成待用数据文件,通过所述数据文件将点击日志转化为可用于训练的结构化文档;模...
伍顺敏纪文迪王晓玲何晓丰周傲英
文献传递
共1页<1>
聚类工具0