您的位置: 专家智库 > >

熊丹

作品数:3 被引量:5H指数:1
供职机构:香港理工大学更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 2篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...
  • 1篇语言文字

主题

  • 2篇语料
  • 2篇语料库
  • 1篇电脑
  • 1篇语料库构建
  • 1篇人名
  • 1篇字符
  • 1篇字符集
  • 1篇字形
  • 1篇小说
  • 1篇明清
  • 1篇明清小说
  • 1篇命名实体识别
  • 1篇基于语料
  • 1篇基于语料库
  • 1篇官爵
  • 1篇汉语
  • 1篇汉字
  • 1篇汉字编码
  • 1篇ISO/IE...
  • 1篇称谓

机构

  • 3篇香港理工大学
  • 2篇元智大学

作者

  • 3篇熊丹
  • 2篇陆勤
  • 1篇石定栩
  • 1篇赵天成

传媒

  • 2篇中文信息学报

年份

  • 1篇2019
  • 1篇2015
  • 1篇2014
3 条 记 录,以下是 1-3
排序方式:
基于语料库的明清小说人名与称谓研究被引量:4
2015年
在自然语言处理及其应用领域,人名和称谓作为重要的命名实体,是信息处理的关键部分之一。该文从命名实体识别和资讯提取的角度出发,在对4部明清古典小说的语料库进行标注的前提下,建构了姓名、字号和称谓作为命名实体的分类及标注系统。人名和称谓总体上分为单一型和复合型,根据复合型的内部组成元素和组合方式,将其进一步分为固定式、同位式、附属嵌套式、灵活嵌套式。结合语料库的完整数据统计,该文对各类型人名和称谓进行了比较分析,并分别展示了4部名著在人名、称谓使用上的特点。
熊丹陆勤罗凤珠石定栩赵天成
关键词:语料库构建
汉语历时语料库中官爵名的识别与提取
官爵名以不同的形式出现在历代各种体裁的文字记录中,并富含历史内涵和现实意义。本研究将官爵名视作一种重要的命名实体,使用人工完成命名实体标注的四部明清小说作为训练语料,通过机器学习算法自动识别明清之前和之后不同时代、不同体...
熊丹徐建陸勤羅鳯珠
关键词:命名实体识别
文献传递
ISO/IEC 10646国际编码标准下的香港电脑汉字编码及字形原则被引量:1
2019年
在ISO/IEC 10646国际编码标准中,香港使用的汉字载于H列。该文介绍了如何在ISO/IEC 10646国际编码标准下进一步完善香港电脑汉字的扩展机制及H列字符字源资料的编码方案。由于目前H列的很多字形并未完全反映香港的实际习惯写法,因此香港制定了一套适用于香港常用写法的电脑汉字参考字形,该文介绍了此套字形的原则。
熊丹陆勤
关键词:字形字符集
共1页<1>
聚类工具0