教育部留学回国人员科研启动基金(4131522)
- 作品数:8 被引量:69H指数:3
- 相关作者:梁循陈华杨健曾月卿更多>>
- 相关机构:北京大学更多>>
- 发文基金:教育部留学回国人员科研启动基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 数据挖掘:建模、算法、应用和系统被引量:49
- 2006年
- 数据挖掘是20世纪末逐渐形成的一个多学科交叉领域,目前已经广泛成功地应用在金融、零售、医药、通讯、电子工程、航空、旅馆等有大量数据和深度分析需求的领域。文中对数据挖掘的建模、算法、应用和软件工具进行了综述,给出了数据挖掘的定义、范畴和特点,以及数据挖掘的数据集的各种实际情况;总结了数据挖掘在实际应用时的基本步骤和过程;对数据挖掘在各种应用问题上的任务和建模进行了讨论;列举了目前数据挖掘领域中主要流行的算法,并对算法设计需要考虑的问题进行了简要的分析;综述了目前数据挖掘算法在一些领域的应用;较全面地叙述了目前数据挖掘软件工具性能及其开发商情况;最后,对数据挖掘的发展前景和方向进行了展望。
- 梁循
- 关键词:数据挖掘软件系统
- 基于互联网股市信息量和神经网络的股价波动率预测被引量:3
- 2006年
- 影响股市价格波动的因素有很多,本文从互联网信息量角度进行讨论.在一般情况下,当有较少的股市信息时,股市相对平静,股价变动也常常较小;当有较多的股市信息时,股市相对波动,股价变动常常也较大.互联网股市信息量的较大变化常常是该公司有特殊事件发生的反映,而股价波动必然是一种连带反应.本文首先从互联网获取金融信息,然后对互联网信息量进行了预处理,接着借助神经网络的学习功能,完成了对殷市信息量和股市价格波动的关联学习,最后将神经网络预测的结果以图形的方式显示给投资者,帮助投资者决策.
- 梁循陈华杨健曾月卿
- 关键词:互联网股价波动率
- 通讯行业客户行为的关联挖掘被引量:1
- 2006年
- 提出了一种基于关联规则挖掘的聚类方法。首先,通讯行业客户行为的原始数据经过数据预处理转变为地区间的“距离”数据。其次,由于地区是“漂浮”的,不再是“刚体”,而是一种抽象的“柔性”距离,使用关联规则进行挖掘成为一种好的选择。文中对通讯行业客户行为进行了基于关联规则的建模,较好地嵌入了关联规则的框架。在数据实验后,提炼出了知识,发现东南亚客户聚成一类,以此为模式,得出了“在南美发展业务是错误的”的结论,该结论在挖掘之前是没有意料到的。实践上,该结论阻止了相应公司的南美发展计划,为公司度过后来的硅谷经济萧条时期省下了上百万美元的“战略储备”资金。
- 梁循
- 关键词:聚类客户行为
- 基于互联网股市信息量和神经网络的股价波动率预测
- 影响股市价格波动的因素有很多,本文从互联网信息量角度进行讨论。在一般情况下,当有较少的股市信息时,股市相对平静,股价变动也常常较小;当有较多的股市信息时,股市相对波动,股价变动常常也较大。互联网股市信息量的较大变化常常是...
- 梁循陈华杨健曾月卿
- 关键词:互联网股价波动率
- 文献传递
- 互联网金融信息搜索
- 传统的搜索引擎对于金融等领域的专业信息的搜索效果不尽如人意,不适合金融专业人士对于专业信息高效准确收集的需求。本文在传统搜索引擎技术的基础上,使用Java 技术,提出并完成了适合于金融专业信息收集的基于自然语言的金融信息...
- 梁循杨健陈华曾月卿
- 关键词:搜索引擎金融信息爬虫自然语言处理排队论
- 文献传递
- 使用Java实现学术会议论文管理系统被引量:9
- 2007年
- 现有学术会议需要征集大量的学术论文,传统的做法是采用邮寄的方式。在互联网产生之后,改为email方式投递论文。对会议组织者来说,两种方式都不太方便。文中借助电子商务的框架,采用当前比较流行的Java技术,给出并实现了一个在线提交论文的系统。该系统可以使论文作者在互联网上提交论文,组织者在网上管理论文,对两者都省时又省力,缩减了组织会议的过程,提高了效率。
- 陈华梁循
- 关键词:JAVA数据库互联网学术论文
- 互联网股票新闻归类和板块分析的方法被引量:2
- 2006年
- 从互联网角度研究和分析了股市新闻。针对互联网股市新闻的特点,提出了对它们进行分类分析的方法,通过对股市新闻的分析,期望能够找到股市运行的一些规律。在按照个股特征对网络上的股市新闻条目分类的同时,利用自然语言处理的功能,深入分析股市新闻内容,得到该股市新闻涉及的其他个股以及板块信息,并总结其影响力。
- 陈华梁循
- 关键词:股市互联网新闻个股
- 面向专题的智能化中文搜索引擎被引量:3
- 2007年
- 讨论了智能专题搜索引擎的相关设计和实现,通过信息搜索技术、自然语言理解技术、语义网络技术以及数据挖掘技术的引入,改进了传统搜索引擎的搜索结构,进而采用这些技术实现了一个专题搜索的实例。
- 陈华梁循杨健
- 关键词:搜索引擎神经网络自然语言处理互联网
- 在中文学术论文集eBook中生成作者单位索引的方法
- 2006年
- 在中文会议论文集现有的目录、作者索引、主题词索引基础上,建议对作者单位进行索引。给出了一种根据作者单位、城市及邮编的文字,对进行作者单位进行自动提取和生成索引的方法,并给予了实现。
- 梁循陈华
- 关键词:索引EBOOK
- 基于互联网股市信息量变化的股价波动率预测系统
- 影响股市价格波动的因素有很多,本文从互联网信息量角度进行讨论。在一般情况下,当有较少的股市信息时,股市相对平静,股价变动也常常较小;当有较多的股市信息时,股市相对波动,股价变动常常也较大。互联网股市信息量的较大变化常常是...
- 梁循杨健陈华
- 关键词:货币银行学互联网股价波动率
- 文献传递