您的位置: 专家智库 > >

吴博

作品数:3 被引量:0H指数:0
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家242信息安全计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇专利
  • 1篇期刊文章

领域

  • 1篇自动化与计算...

主题

  • 2篇信息抽取
  • 2篇屏蔽
  • 2篇网页
  • 2篇网页分类
  • 2篇网页模板
  • 2篇网页信息
  • 2篇网页信息抽取
  • 2篇包装器
  • 2篇抽取
  • 1篇信息处理
  • 1篇约束聚类
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇模式匹配算法
  • 1篇聚类
  • 1篇计算机
  • 1篇计算机应用

机构

  • 3篇中国科学院
  • 1篇中国科学院研...

作者

  • 3篇吴博
  • 3篇王宇
  • 2篇张刚
  • 2篇程学旗
  • 2篇丁国栋
  • 1篇郭岩
  • 1篇宋林海
  • 1篇方滨兴

传媒

  • 1篇中文信息学报

年份

  • 1篇2011
  • 1篇2010
  • 1篇2009
3 条 记 录,以下是 1-3
排序方式:
结合属性分布特征的模式匹配算法
2010年
该文提出了一种结合属性分布特征的Web模式匹配算法,属性分布特征包括属性对互斥特征和属性对共现特征。属性对互斥特征由属性对的互斥性和出现次数计算得出,这个特征隐含了属性对的语义相似程度。为了充分利用传统的属性名、属性值相似性特征,该文通过机器学习方法结合属性对互斥特征与相似性特征进行属性匹配。并以潜在的匹配属性对为基础,引入有约束的属性聚类方法进行Web模式匹配,聚类方法的约束条件来自属性对共现特征。实验结果表明,相对于仅使用相似性特征的方法,在不同的实验设置下,结合属性分布特征的Web模式匹配算法将F值提高了0.13到0.55。
王宇方滨兴吴博宋林海郭岩
关键词:计算机应用中文信息处理约束聚类
一种网页信息抽取的系统及方法
本发明涉及网页信息抽取的系统和方法,系统包括:模板生成模块,用于从网页集合中选取待自动标注网页,根据用户标注的训练网页将待自动标注网页分类,生成分类的类别的网页模板;网页同质化模块,用于依据网页模板屏蔽待自动标注网页同其...
吴博王宇张刚丁国栋程学旗
文献传递
一种网页信息抽取的系统及方法
本发明涉及网页信息抽取的系统和方法,系统包括:模板生成模块,用于从网页集合中选取待自动标注网页,根据用户标注的训练网页将待自动标注网页分类,生成分类的类别的网页模板;网页同质化模块,用于依据网页模板屏蔽待自动标注网页同其...
吴博王宇张刚丁国栋程学旗
文献传递
共1页<1>
聚类工具0