张瑞
- 作品数:2 被引量:6H指数:1
- 供职机构:新汶矿业集团职工大学更多>>
- 发文基金:湖北省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于粗糙近似的Web事务聚类改进算法被引量:1
- 2008年
- 针对现有Web使用记录挖掘方法发现的知识和规则存在不精确或不完全的问题,提出了一种改进的基于粗糙近似的Web事务聚类算法.该算法首先对原有算法得到的每个类,用关系矩阵找出在这个类中不满足传递性的对象,然后在该对象的集合(类)上用关系矩阵找出在这个类中不满足传递性的对象,再对每个类进行分割,使其满足关系R的传递性,克服了现有算法不满足关系的传递性和在某些情况下得到的结果不准确的缺点.
- 李石君张瑞卢哲延金索哲
- 关键词:WEB使用记录挖掘粗糙集聚类
- 网上表格数据到XML的自动转换被引量:5
- 2007年
- 互联网上有大量信息采用HTML表格表示,由于HTML不描述数据的内容,机器不能理解和查询。论文利用HTML表格属性,在表格中插入冗余单元,使HTML表格规范化;对没有标志表头的HTML表格,采用格式化的信息的量化值识别网上表格的表头。在此基础上,提出了通过获取表格属性与值对应的语义层次,自动转换HTML表格数据为XML文挡的新方法。
- 张瑞李石君
- 关键词:HTML表格信息提取WEBXML