蒋锐权
- 作品数:4 被引量:22H指数:2
- 供职机构:上海证券交易所更多>>
- 发文基金:国家科技支撑计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种将数据导入数据库的装置
- 本发明提供一种将数据导入数据库的装置,包括:配置模块,在其中配置迁移数据的配置项,配置项至少包括数据源,目的数据库,数据库交互指令生成规则,控制模块,读取配置模块并解析出所述配置项,并根据配置项控制其它模块的操作,数据源...
- 郑凌云武剑锋王泊蒋锐权吴继春黄寅飞林丽丽白硕
- 文献传递
- 基于SVM结合依存句法的金融领域舆情分析被引量:13
- 2015年
- 用户的情感倾向与市场波动之间的联系,对金融市场的监控和股价异常处理有着重要作用,因此针对金融领域用户生成的文本进行情感分析很有意义。然而,由于金融领域文本的术语比较多,句子比较长,以及缺乏现成的情感语料库,所以针对该领域的情感分析研究目前还比较少。根据金融领域文本的特点,充分考虑到金融领域情感词的特征、单个句子中词语的位置权重以及情感词相互间的修饰关系,提出SVM分类结合Stanford句法依存分析方法,计算文档的情感值。利用重要财经网站上抽取的金融领域数据进行实验,综合值F达到了82.1%,比文献中其他方法更为精准。
- 黄进阮彤蒋锐权
- 关键词:金融领域情感分析依存分析
- 面向大规模数据的在线新事件检测被引量:1
- 2014年
- 通过分析基于新闻要素的在线新事件检测算法的时间消耗,提出一种面向大规模数据环境的在线新事件检测算法。该算法利用基于倒排索引的高效相似报道搜索机制,有效减少单路径聚类算法中的相似度比较次数。通过对报道预处理、报道与事件比较以及索引搜索这3个过程的并行化,提高算法在多机环境下的运行效率和可伸缩性。实验结果表明,该算法在不影响漏检率和误检率的基础上,提高了新事件检测的速度,并且在千万到亿级别的报道规模下,其吞吐量达到150条/s^200条/s。
- 蔡偃武高大启阮彤蒋锐权
- 关键词:新事件检测大规模数据并行计算倒排索引
- 朴素贝叶斯算法的MapReduce并行化分析与实现被引量:8
- 2013年
- 朴素贝叶斯方法是一种高效的分类算法,但在处理海量数据时由于内存和I/O等资源的局限,该算法的效率受到极大影响。文中针对朴素贝叶斯分类算法特点,给出了基于MapReduce编程模型的实现朴素贝叶斯分类算法的方法。训练集内文件被分割进行处理,核心处理过程由MapReduce完成,Map函数完成对训练文件的解析,Reduce函数完成类别属性和特征属性知识库的构建。实验主要比较了传统算法和改进并行算法的性能,结果表明:在大数据量的情况下使用Ma-pReduce并行化的朴素贝叶斯算法具有良好的执行效率与较高的扩展性。
- 张依杨向阳蒋锐权张波张君瑛
- 关键词:朴素贝叶斯分类算法并行计算MAPREDUCE