胡博磊
- 作品数:6 被引量:9H指数:1
- 供职机构:湖南大学电气与信息工程学院更多>>
- 发文基金:天津市科技支撑计划重点项目国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于条件随机域的中文长地名结构标注
- 中文长地名结构标注是将自然文本形式的长地名按语义不同分割成不同部分并添加标签。在信息检索、自动问答及信息抽取等领域有着重要的应用。中文地名存在格式和结构不规则的问题,在实际应用中,给数据存储的粒度以及查询的准确率带来严重...
- 孙宏王文俊贺瑞芳胡博磊孙越恒
- 关键词:条件随机域中文分词
- 文献传递
- 面向位置服务的数据处理平台的研究与设计
- 在基于位置服务数据的数据挖掘研究中,数据处理能力已经成为了分析的瓶颈。虽然基于MapReduce计算模型人们可以通过多机并行相对快速地完成计算,但是由于MR模型对数据结构及任务功能有着严格的规定,在获取大数据后,还需要进...
- 胡博磊
- 关键词:建模方法
- 基于条件随机域的中文事件类型识别被引量:8
- 2012年
- 传统的分步骤事件抽取方法中,事件元素识别的结果无法指导事件类型识别,而事件类型识别的效果在很大程度上决定了事件抽取系统的整体性能.文中为解决事件类型识别对元素识别的后向依赖问题,将事件抽取看作序列标注,构建一个改进的条件随机域联合标注模型,将事件类型和事件元素在图模型中同时进行标注.同时,通过触发词嵌入试图解决事件抽取中的数据不平衡问题.ACE2005中文语料上的实验表明,基于该模型的方法提高了事件类型识别的性能,最终F值达到63.53%.
- 胡博磊贺瑞芳孙宏王文俊
- 关键词:事件抽取条件随机域
- 基于累积平均密度的聚类算法研究
- 随着计算机技术的发展和数据库技术的成熟,数据挖掘开始走进人们的视野。兴起于上个世纪90年代,经过20多年的不断研究与完善,数据挖掘技术已经形成了一套系统的理论,并开发了一些比较成熟的数据挖掘工具,积累了大量成功的行业案例...
- 胡博磊
- 关键词:数据挖掘聚类算法网页信息提取
- 文献传递
- 基于条件随机域的中文事件类型识别
- 事件抽取是从文本中抽取出事件信息,确定事件类型、子类型及相关实体(如时间、地点、参与者等)角色的工作,在多文档文摘,自动问答及信息检索等领域有着重要的应用前景。通常事件抽取分为事件类型识别和事件元素识别两步,事件元素识别...
- 胡博磊贺瑞芳孙宏王文俊孙越恒
- 关键词:事件抽取条件随机域信息检索
- 基于累积平均密度的聚类方法被引量:1
- 2013年
- 针对DBSCAN算法存在的参数敏感性和不能区分相连的不同密度的簇等缺陷,提出了一种基于DBSCAN算法的改进算法。算法提出了累积平均密度的概念,用来作为簇合并的依据,弱化了密度阈值Minpts的作用;选取密度最大的对象作为初始聚类中心,按照密度由高到低的顺序进行聚类,具有一定的层次性,因此支持变密度数据集聚类。最后,用数据集对算法进行了聚类实验。实验结果表明,改进算法具有一定的参数鲁棒性,对于相连的不同密度的簇,能够达到理想的聚类效果。
- 胡博磊谭建豪
- 关键词:聚类算法