您的位置: 专家智库 > >

何正华

作品数:5 被引量:2H指数:1
供职机构:华东师范大学更多>>
发文基金:上海市国际科技合作基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇专利
  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 4篇抽取
  • 3篇自动抽取
  • 2篇新闻
  • 2篇新闻网
  • 2篇新闻网页
  • 2篇信息抽取
  • 2篇元数据
  • 2篇视觉特征
  • 2篇外部存储设备
  • 2篇网页
  • 2篇互联网新闻
  • 2篇安全检测
  • 2篇存储设备
  • 1篇引擎
  • 1篇用户
  • 1篇视觉
  • 1篇数据挖掘
  • 1篇文档
  • 1篇聚类
  • 1篇基本点

机构

  • 5篇华东师范大学

作者

  • 5篇何正华
  • 4篇杨静
  • 4篇顾君忠
  • 3篇费静婷
  • 3篇闫宇
  • 3篇刘海学
  • 3篇秦鹏
  • 3篇吴芳
  • 3篇王海棠
  • 3篇刘峰
  • 3篇孟玲玲
  • 1篇任涵

传媒

  • 1篇计算机应用

年份

  • 1篇2012
  • 2篇2009
  • 2篇2008
5 条 记 录,以下是 1-5
排序方式:
一种新闻网页元数据自动抽取方法
本发明涉及一种在互联网新闻网页上进行元数据自动抽取的方法,元数据抽取系统向新闻网站服务器发送网页请求,服务器在通过一定的安全检测后将所要求的页面发往元数据抽取模块主机。元数据抽取系统在得到了一定数量的网页集合后,通过DO...
顾君忠杨静刘海学孟玲玲何正华费静婷王海棠刘峰闫宇秦鹏吴芳
文献传递
基于视觉特征的BBS用户发言信息抽取被引量:2
2009年
针对传统从BBS主题网页中自动抽取用户发言信息的问题,提出独立于网页脚本语言的自动抽取方法,可根据网页提供的视觉信息进行有效抽取。通过归纳BBS主题网页内部用户发言信息的视觉特征,并以此为依据指导整个抽取过程。实验结果表明,基于视觉的抽取方法可以得到较高的抽取质量。
何正华顾君忠杨静
关键词:视觉特征信息抽取聚类
一种XML文档的存储和检索方法
本发明涉及一种对于XML文档进行处理后存储和检索的方法,结合关系模式的查询效率和原生模式的能反映XML元素层次路径的查询机制,提出了基于XOM和ORM的XML文件存储检索方法。本方法抓住了XML文件的两个基本点,层次结构...
顾君忠杨静刘海学孟玲玲刘峰任涵何正华费静婷王海棠闫宇秦鹏吴芳
文献传递
基于视觉特征的BBS用户发言信息抽取技术研究
本文研究从BBS主题网页中自动抽取用户发言信息的问题。该类问题的传统解决方法主要基于对HTML网页的DOM树和标签结构的分析,密切依赖于HTML标准。这使网页规范性对抽取正确率的影响较大,而且随着编写网页的脚本语言版本演...
何正华
关键词:自动抽取视觉特征数据挖掘
文献传递
一种新闻网页元数据自动抽取方法
本发明涉及一种在互联网新闻网页上进行元数据自动抽取的方法,元数据抽取系统向新闻网站服务器发送网页请求,服务器在通过一定的安全检测后将所要求的页面发往元数据抽取模块主机。元数据抽取系统在得到了一定数量的网页集合后,通过DO...
顾君忠杨静刘海学孟玲玲何正华费静婷王海棠刘峰闫宇秦鹏吴芳
文献传递
共1页<1>
聚类工具0