国家高技术研究发展计划(2002AA117010-07)
- 作品数:5 被引量:47H指数:3
- 相关作者:钟义信王枞刘建毅李卫张剑更多>>
- 相关机构:北京邮电大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于主题的智能Web信息采集系统的研究与实现被引量:25
- 2006年
- 研究并实现了一个基于主题的智能信息采集系统IFWC,该系统以全信息理论为支撑,吸收传统向量空间模型的思想,采用基于概念的向量空间模型,从词的语义层次对文本进行主题相关性分析;使用扩展元数据的语义相关性判定算法,对页面内的URL进行主题相关性预测。实验证明,该系统采集速度快,采集下来的页面精度高。
- 李卫刘建毅何华灿王枞
- 关键词:全信息概念向量空间模型
- 快速聚类算法在个性化服务中的应用被引量:2
- 2004年
- 许多实际应用已经证明,k-means算法能够有效地得到好的聚类结果。但是,k-means直接算法的时间复杂度和模式复杂度对数据量的大小非常敏感,无法满足一些高性能的应用场合,如个性化服务中对用户数据进行的群组分析。对此,笔者提出了一种新颖的基于k-d树的聚类算法。这种算法采用空间数据结构—k-d树组织所有的样本数据,可以高效地搜索到离某个给定的聚类中心最近的全部模式。实验结果表明,该方案可以显著提高k-means直接算法的运算速度,在距离运算量和总的运算时间上,可把性能提高1~2个数量级。
- 张剑李卫钟义信郭燕慧
- 关键词:个性化服务
- 中文Web文本挖掘系统WebTextMiner开发被引量:3
- 2006年
- W eb文本挖掘系统的开发对W eb文本挖掘的研究有着很大的推进作用。因此在对基于SVM的中文网页分类器性能研究的基础上,根据研究和实用的需要,实现了一个性能较好的中文W eb文本挖掘系统。
- 魏松钟义信王翔英
- 关键词:WEB文本挖掘支持向量机K-最近邻
- 基于特征项的群组信息推荐算法被引量:9
- 2004年
- 个性化推荐系统采用知识发现技术给用户提供准确、合理的信息从而赢得客户。基于用户群组特征的推荐方式是当前在研究和实用两方面都取得一定成功的一种模式,但是这种算法的复杂度随着用户数量的增加而急剧增长,因此在实际的应用中,面对着数以万计的用户,服务系统要承担大负荷的计算量,从而导致推荐效率的下降。该文提出了一种基于特征项的推荐算法来解决基于用户的推荐算法所面临的可扩展性差的问题。实验表明,使用基于特征项的推荐算法能够在提高推荐效率的同时,达到或者超越基于用户的推荐算法的推荐性能。
- 张剑郭燕慧钟义信
- 关键词:基于用户相似度计算信息推送
- 口语对话管理综述被引量:8
- 2005年
- 主要介绍了口语对话系统中对话管理的作用、基本问题和设计方法。对话管理在整个对话系统中处于核心地位,控制整个对话的进行,负责对用户输入的理解以及根据领域内容决定系统对用户的反应。对话管理的设计主要有基于状态图的结构(有限状态机)、填充槽结构和基于任务的结构三种方法,提出了一种基于逻辑表达式的结构,并设计了状态图/逻辑表达式双层结构。
- 王菁华钟义信王枞刘建毅
- 关键词:口语对话系统对话管理