您的位置: 专家智库 > >

国家自然科学基金(61073170)

作品数:5 被引量:86H指数:3
相关作者:曾剑平吴承荣段江娇刘红忠李少卿更多>>
相关机构:复旦大学上海理工大学更多>>
发文基金:国家自然科学基金教育部人文社会科学研究基金上海市自然科学基金更多>>
相关领域:自动化与计算机技术经济管理更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 4篇自动化与计算...
  • 1篇经济管理

主题

  • 1篇引擎
  • 1篇隐私
  • 1篇隐私保护
  • 1篇用户
  • 1篇用户行为
  • 1篇中国股票
  • 1篇社交
  • 1篇社交媒体
  • 1篇收益率
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇索引库
  • 1篇投资者
  • 1篇投资者情绪
  • 1篇情感模型
  • 1篇字符
  • 1篇字符串
  • 1篇字符串相似度
  • 1篇网络论坛

机构

  • 5篇复旦大学
  • 2篇上海理工大学

作者

  • 4篇曾剑平
  • 3篇吴承荣
  • 2篇段江娇
  • 1篇刘红忠
  • 1篇钟亦平
  • 1篇龚凌晖
  • 1篇李少卿
  • 1篇张硕
  • 1篇张泽文

传媒

  • 1篇计算机工程
  • 1篇计算机应用与...
  • 1篇计算机工程与...
  • 1篇金融研究
  • 1篇山东大学学报...

年份

  • 2篇2017
  • 2篇2015
  • 1篇2011
5 条 记 录,以下是 1-5
排序方式:
社交媒体用户行为的时间模式隐私攻击方法
2017年
网络社交媒体用户个人隐私信息的保护具有极其重要的意义。现有的有关隐私保护的研究集中于一般关系型数据、位置和轨迹信息、社交网络关系等数据类型的隐私保护,而社交媒体数据结构的复杂性使得隐私泄露的情况变得更加隐蔽,现有针对其他类型数据的隐私泄露的判定方式和隐私保护方法难于直接用于社交媒体用户行为的时间模式分析。为了发现社交媒体复杂时间数据中存在的潜在隐私泄露问题,给出针对网络论坛用户的行为时间模式的隐私泄露挖掘方法,设计并实现了多方法、多选择的聚类攻击者模型,实验通过攻击社交媒体用户的行为模式数据集,发现了用户行为时间模式的特异性和网络论坛中广泛存在着的用户隐私泄露的问题,应当引起充分重视。
张泽文张硕曾剑平
关键词:用户行为聚类社交媒体隐私保护
面向分布式搜索引擎的索引库动态维护算法被引量:1
2011年
分布式搜索引擎在实际运行中存在大量的用户,同时索引更新频繁,而索引更新过程的复杂度使得用户的检索请求响应出现较大的延迟。本文提出一种基于内存映射表的索引库动态维护算法,按照一定时间粒度组织索引库,在内存中维护一个当前可用的子索引库列表,实现索引的透明更新。实验表明,该算法能够保证及时地对新数据建立索引,同时有效降低用户检索请求的响应时间。
曾剑平吴承荣龚凌晖
关键词:分布式搜索引擎
中国股票网络论坛的信息含量分析被引量:76
2017年
本文选取东方财富网股吧论坛的个股帖子,使用计算机文本处理技术提取帖子情绪,结合证券分析师对个股的"中性"评级数据,实证研究了我国股票网络论坛的信息含量问题。研究发现:股票当日收益率受当日论坛情绪影响,为显著正相关;股票未来两日收益率与帖子数显著负相关;股票当日的帖子数显著正向影响当日股价波动,而且能影响未来两日的股价波动;当日情绪分歧度越大,未来两日的交易量越大。本研究不仅有助于理解我国股票网络论坛对股票市场的影响机制,而且也为监管层对市场调控和监管提供了一定的决策依据。
段江娇刘红忠曾剑平
关键词:投资者情绪股票收益率股价波动性股票交易量
基于情感模型的文本意见分类方法被引量:4
2015年
基于向量空间模型、潜在语义分析等传统文本意见分类模型将文本映射到词汇或语义空间中,侧重于词汇的辨别能力,无法对映像空间给出明确的语义说明,导致其扩展性、准确率等方面的性能受到限制。为此,在人类情感分类理论的基础上,假设文本中的意见表达与人们的情感存在较强的关联,结合词汇语义扩展、特征选择等方法构造3种情感表示模型,把表达人类情感倾向的文本转换到情感空间中,利用情感模型对国外股票论坛信息提取情感特征,构建情感模型,并设计文本意见分类方法。针对实际股票论坛的数据进行实验,结果表明,该分类方法能获得较高的分类准确率。
罗邦慧曾剑平段江娇吴承荣
关键词:情感模型
不良文本变体关键词识别的词汇串相似度计算被引量:5
2015年
随着网络技术的发展,网络空间出现了各种各样的文本交流类网络应用,如聊天室、BBS等。为维护网络环境的文明,这些网络应用中会将用户发表的"脏话"词汇进行过滤。有些恶意用户为了避免所发信息被系统过滤,经常会将"脏话"词汇进行变形处理,如何识别这些变形后的"脏话"词汇,是一个重要的问题。通过计算变异敏感词汇相似度,来对变形词汇进行识别。该方法具有如下特点:(1)计算结果接近于人脑识别的结果;(2)计算所用的时间复杂度较低;(3)对变体识别率较高。根据计算的相似度值,来决定是否对该疑似敏感词进行过滤。实验数据表明,所提出的相似度计算方法好于现有的算法。
李少卿吴承荣曾剑平钟亦平
关键词:字符串相似度
共1页<1>
聚类工具0