您的位置: 专家智库 > >

马旭

作品数:1 被引量:4H指数:1
供职机构:北京大学医学部更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息处理
  • 1篇语料
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇计算机
  • 1篇计算机应用
  • 1篇SMS
  • 1篇标注语料库

机构

  • 1篇北京邮电大学
  • 1篇北京大学

作者

  • 1篇郭军
  • 1篇徐蔚然
  • 1篇马旭

传媒

  • 1篇中文信息学报

年份

  • 1篇2009
1 条 记 录,以下是 1-1
排序方式:
SMS-2008标注中文短信息库被引量:4
2009年
随着短信息应用的普及,用户、运营商及政府管理部门均迫切需要智能短信处理工具。语料库是研究算法,开发系统,测试性能等必不可少的基础资源。但受到技术、版权保护、隐私权利等种种原因,目前还没有公开的标准短信息语料库。SMS-2008标注短信息库是本项目组在国内外率先建立的多用途中文短信息语料库,它包括原始语料库、预处理语料库、隐私标注语料库、内容标注语料库、错误标注语料库等。该语料库可用于短信语言现象研究、短信分类过滤算法研究、隐私保护算法研究、自动纠错算法研究等。
马旭徐蔚然郭军胡日勒
关键词:计算机应用中文信息处理标注语料库
共1页<1>
聚类工具0