国家自然科学基金(60573077) 作品数:11 被引量:45 H指数:4 相关作者: 陈恩红 施德明 耿焕同 周进华 刘贵全 更多>> 相关机构: 中国科学技术大学 南京信息工程大学 香港城市大学 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 教育部“新世纪优秀人才支持计划” 更多>> 相关领域: 自动化与计算机技术 更多>>
一种对象级搜索中的多查询合并算法 2008年 对传统搜索引擎使用的排序算法进行分析,将概率意义引入对象级搜索,提出一种在对象级搜索中合并多个查询结果的算法.通过归一化以及考虑概率意义与查询规模间的关系,该算法独立于生成结果列表使用的排序算法.实验结果证明该算法提高了查询结果的质量. 陈恩红 李梁关键词:搜索引擎 范例推理在网络自动答疑系统中应用 被引量:9 2008年 针对教育快速发展与教师资源相对紧缺间的突出矛盾,利用计算机网络技术,提出了一种基于范例推理的网络自动答疑专家系统。该系统能综合多位优秀教师的知识,克服了传统面对面答疑方式受时空限制的缺陷。实验表明,基于范例推理技术的自动答疑系统是非常有效地、较好地满足答疑准确性的要求,而且具有很强的学习性。 耿焕同 毕硕本关键词:计算机网络 文本处理 自动答疑 一种集成NER的文本分类特征选择方法 被引量:2 2007年 文本分类是将自由文本自动划分到若干预先定义类别的方法,在信息检索等领域有很重要的作用。其中,如何选择有效的文本特征是影响文本分类器分类性能的一个重要步骤。很多应用中需要处理的文本信息包含了很多的命名实体,如某个行业的名人,往往能够在很大程度上影响着文本所属的类别。然而,现阶段的文本特征方法都只利用关键词的统计意义,而没有考虑关键词作为命名实体所含有的分类特征。针对这一问题,本文提出了一种将命名实体识别方法NER集成到文本分类特征选择中的方法,在保留关键词统计特征之外,还保留了单词作为命名实体的分类特征。实验结果表明,相对于其他特征选择方法而言,本文提出的方法在一定程度上提高了文本分类的分类准确率。 施德明 林洋港 陈恩红关键词:命名实体识别 文本分类 隐马尔可夫模型 一种基于语义相似度的信息检索方法 被引量:16 2006年 随着网络信息的日益丰富以及语义网络的出现,语义信息检索技术成为当前研究的热点。本文研究一种基于语义相似度的信息检索方法,利用本体在语义刻画上的优势,以概念相似度和属性相似度作为语义检索的衡量依据,对语义检索过程的分析和结果的统计表明,文档语义特征向量的概念及属性数的增加有利于改善检索效果。 王进 陈恩红 施德明 张振亚关键词:本体 语义 信息检索 一种基于视觉分块的Web信息抽取方法研究 被引量:7 2009年 随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。 耿焕同 宋庆席 何宏强关键词:网络 信息抽取 Passage Retrieval for Web-based Question Answering We investigate the effectiveness of lexical,topic and structural similarities on the semantic relevance betwee... Xin Li~(1,2,3) Liu Wenyin~(2,3,+) Enhong Chen~(1,3) Dawei Hu~(1,2,3) ~1Department of Computer Science and Technology,University of Science & Technology of China,Hefei,China ~2 Department of Computer Science,City University of Hong Kong,Hong Kong,China ~3Joint Research Lab of Excellence,CityU-USTC Advanced Research Institute,Suzhou,China文献传递 即时交互式问答系统的设计与实现 被引量:4 2009年 提出一种即时的、基于用户交互的问答系统设计方案.该系统依照客户服务器(C/S)结构进行搭建,通过互助模式解答人们提出的问题,利用问题推荐机制将松散的用户群组织成为高效的协作网.推荐问题时,通过用户建模技术准确评估用户对各个知识领域的信誉度、权威性以及工作能力以保证将问题推荐至合适用户;采用调度技术依照重要性依次推荐问题,并在保证拥有较高回答率的前提下,将所有问题均匀的推荐至不同用户处进行回答.实验展示了依照该方案所实现的原型系统的服务器端和客户端的运行情况并展现了推荐的精确度. 呼大为 陈恩红 刘文印关键词:用户建模 基于概率主题的文本层次分类(英文) 被引量:2 2009年 概率主题模型是一种统计生成模型,它从文档集合中抽取一系列主题,并将这些文档表示为不同主题依照一定概率混合而成.通过这种模型发现的主题,能揭示文档的语义信息,在很多领域都有着广泛的应用.为此基于概率主题模型,提出了一种新的层次文本分类方法.该方法首先利用Gibbs抽样提取一系列主题,然后计算测试文档和每个类的基于主题的相似度.在20 News Groups数据集上的实验结果表明,该方法的分类性能明显超越支持向量机分类方法. 权小军 林洋港 罗奇鸣 陈恩红关键词:GIBBS抽样 对象级搜索中基于图的对象排序模型(英文) 2009年 提出了一种对象级搜索中领域无关的对象排序模型.给定对象集合以及对象间的关系,根据用户输入的对象查询,该模型按照对象与查询的相关度输出一个对象的排序表.采用一个多平面的图表示对象级搜索的空间,并基于该图分别提出了对象流行度评估算法、根据查询计算相关度的算法,以及合并多个对象查询的算法.针对ACM数据集上的实验结果表明该算法是有效的,在论文推荐与合并多对象查询方面,均取得了比PaperRank更好的结果. 李梁 罗奇鸣 陈恩红关键词:WEB对象 链接分析 基于权值加密的隐私安全分布式约束满足问题求解 被引量:1 2007年 隐私安全的分布式约束满足问题(distributed constraint satisfaction problem,DisCSP)求解算法可以很好地满足信息敏感的分布式组合求解问题的需要,为了获得更好的求解效率,提出了一种基于权值加密的隐私安全DisCSP的求解算法,对DisCSP问题中的约束基于不同的隐私权值进行加密求解;不需要增加额外的agent进行隐私约束的一致性检查,实现分布式的安全求解策略;对于可能出现的推理信息,用随机选择策略来避免信息泄漏.试验表明,该算法可以减少信息的传递量和计算的复杂性,因而具有更好的求解效率. 王秦辉 陈恩红 王煦法关键词:分布式约束满足 隐私安全 加密