您的位置: 专家智库 > >

程葳

作品数:24 被引量:89H指数:6
供职机构:北京城市学院更多>>
发文基金:国家高技术研究发展计划北京市教育委员会科技发展计划面上项目国家242信息安全计划更多>>
相关领域:自动化与计算机技术文化科学语言文字经济管理更多>>

文献类型

  • 14篇期刊文章
  • 9篇会议论文
  • 1篇学位论文

领域

  • 17篇自动化与计算...
  • 3篇文化科学
  • 2篇经济管理
  • 2篇语言文字
  • 1篇一般工业技术
  • 1篇社会学

主题

  • 5篇数据挖掘
  • 5篇聚类
  • 5篇口语
  • 5篇口语翻译
  • 5篇翻译
  • 4篇网络论坛
  • 4篇文本聚类
  • 3篇语块
  • 3篇语料库
  • 3篇网络
  • 3篇互联
  • 3篇互联网
  • 3篇机器翻译
  • 2篇语料
  • 2篇统计机器
  • 2篇统计机器翻译
  • 2篇自相
  • 2篇自相似
  • 2篇自相似性
  • 2篇网络传播

机构

  • 20篇北京城市学院
  • 5篇中国科学院自...
  • 1篇北京中医药大...
  • 1篇北京理工大学
  • 1篇中国传媒大学

作者

  • 24篇程葳
  • 7篇龙志祎
  • 5篇邱立坤
  • 4篇孙娇华
  • 3篇徐波
  • 2篇刘非凡
  • 2篇孟红
  • 2篇邵秀凤
  • 2篇赵军
  • 2篇钟华
  • 1篇沈俊辉
  • 1篇陶然
  • 1篇易红梅
  • 1篇李丹丹
  • 1篇刘承水
  • 1篇宋慧曼
  • 1篇孙承意
  • 1篇王辉
  • 1篇王强

传媒

  • 4篇北京城市学院...
  • 2篇中文信息学报
  • 1篇系统工程学报
  • 1篇计算机学报
  • 1篇武汉理工大学...
  • 1篇计算机工程
  • 1篇广西师范大学...
  • 1篇计算机工程与...
  • 1篇现代计算机(...
  • 1篇教育信息化论...
  • 1篇第二届全国信...
  • 1篇第十一届中国...
  • 1篇全国第八届计...
  • 1篇第二届城市科...
  • 1篇全国第八届计...
  • 1篇全国网络与信...

年份

  • 1篇2023
  • 1篇2022
  • 1篇2021
  • 1篇2014
  • 1篇2012
  • 1篇2011
  • 3篇2009
  • 3篇2007
  • 3篇2006
  • 5篇2005
  • 1篇2004
  • 2篇2003
  • 1篇2002
24 条 记 录,以下是 1-10
排序方式:
网络论坛中发帖行为复杂性研究被引量:12
2009年
网络论坛是我国互联网舆论形成的重要力量之一,正引起社会各方的广泛关注.通过对大量实际数据的统计分析,发现网络论坛发帖量满足:幂次定律、自相似性、1/f噪声和捷夫定律.说明网络论坛是一个复杂的自组织临界态系统.应用自组织临界理论可以分析网络突发事件和舆论形成中的诸多现象.最后提出一种评价网络论坛舆论的定量指标.实验表明,该指标能有效发现网络论坛突发事件.
程葳钟华孙娇华
关键词:自相似性网络论坛
限定领域内汉英口语的统计翻译方法研究
机器翻译是自然语言处理的重要应用领域.口语翻译作为机器翻译的一个新兴分支,具有重要的理论意义和实用价值,正受到越来越多的关注.该文以基于统计的翻译方法为研究主线,提出和建立了一整套限定领域内汉英口语的统计翻译框架,并就其...
程葳
关键词:口语翻译统计机器翻译语块
文献传递
网络论坛虚拟社会的无尺度特性初探
本文从无尺度网络特性出发,在真实网络论坛数据库下,对互联网虚拟社会的行为进行定量分析,实验发现网络虚拟社会也是一种无尺度网络,具有幂率分布、偏好连接和鲁棒性与脆弱性兼备等特点.
程葳孙娇华孙承意
关键词:虚拟社会无尺度网络数据库
文献传递
面向BBS的话题挖掘初探
本文提出一种在BBS环境下进行热门话题挖掘的算法.BBS以讨论为主的文体决定了同一话题的文章在词语向量上并不一定相似,单纯采用基于向量空间模型的聚类算法难以有效地完成话题挖掘的任务.因此,本文的话题挖掘在一般文本聚类算法...
邱立坤程葳龙志祎孙娇华
关键词:BBS文本聚类数据挖掘
文献传递网络资源链接
面向互联网新闻的在线话题检测算法被引量:9
2009年
针对互联网新闻报道冗余多、议题发散、易漂移等特点,提出一种面向互联网的在线话题检测算法。该算法针对冗余问题提出子话题概念,针对议题发散问题建立双层检测结构,针对话题漂移问题提出基于滑动窗口的跟踪策略。应用该算法建立网上话题检测系统,通过来源于互联网的真实数据进行测试。结果表明,算法性能优于传统的单路径聚类算法,其最小错误代价率低于0.14。
程葳龙志祎
关键词:话题检测与跟踪文本聚类
面向互联网的话题发现技术研究
话题发现与跟踪(Topic Detection and Tracking,TDT)是一项由国际公开评测驱动的研究,旨在依据事件对语音和文本信息进行分析和组织。自1996年启动以来,该研究受到普遍关注,取得巨大进步, 也遇...
邱立坤陶然龙志祎程葳
关键词:文本聚类
文献传递
社区微博互动水平的影响因素研究——以北京市为例
2014年
社会管理创新离不开虚拟社会管理创新。本文对新浪微博网站中的北京地区社区微博进行动态跟踪,总结提取了提升社区微博受互动水平的关键影响因素,并根据数据挖掘结果对如何加强社区微博互动能力提出了建议。
程葳易红梅王强刘承水
关键词:数据挖掘
一种面向口语的译文质量自动评价方法被引量:6
2002年
译文质量的自动评价对机器翻译研究具有十分重要的意义。但现有方法主要是针对书面语翻译 ,没有考虑到口语翻译的特征。因此 ,本文提出了一种面向口语的新型的自动评价方法 ,通过定义信息段、标注权重和设计多种匹配策略等方法 ,使自动评价结果与人工打分更为接近 ,同时也提高了评价过程对不同输出译文的适应能力。各项实验表明 ,该算法对译文质量变化具有较高的敏感度 。
程葳徐波
关键词:机器翻译评测口语翻译译文质量信息段
TDT中新发现话题的分类研究与实现被引量:3
2009年
根据数据源为新闻网站的TDT(topic detection and tracking)系统的话题特点,首先提出了话题分类思想,然后将KNN(k-nearest neighbor)算法与网站频道信息相融合对话题进行分类。实验表明,话题分类的正确率达到98%,具有较高的实用性。
龙志祎程葳沈俊辉
关键词:TDTKNN
利用Hurst指数预测网络话题热度被引量:1
2012年
面向大规模真实数据,应用聚合方差法、周期图和重标极差法对互联网信息发布数据进行研究,发现网民发布信息具有自相似和长相关特性。通过对各序列的Hurst指数估计,揭示了网络论坛日发帖量未来变化与历史的变化趋势一致;网民发帖量低发帖量网民与高发帖量网民的变化趋势一致;以及每日网民发帖量后发帖网民与先发帖网民的变化趋势一致等特性。这些性质对深入认识网络论坛规律、预测网络突发事件等具有一定参考价值。提出一种评价网络论坛舆论的定量指标。实验表明,该指标能有效发现网络突发事件。
程葳
关键词:分形HURST指数长相关性自相似性
共3页<123>
聚类工具0