2024年11月24日
星期日
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
肖云
作品数:
2
被引量:44
H指数:1
供职机构:
清华大学
更多>>
发文基金:
国家重点基础研究发展计划
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
孙茂松
清华大学信息科学技术学院智能技...
邹嘉彦
香港城市大学
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
领域
2篇
自动化与计算...
主题
2篇
语言处理
2篇
中文
2篇
自动分词
2篇
自然语言
2篇
自然语言处理
2篇
汉语自动分词
2篇
分词
1篇
信息处理
1篇
上下文
1篇
上下文信息
1篇
歧义
1篇
歧义消解
1篇
中文分词
1篇
中文分词系统
1篇
中文信息
1篇
中文信息处理
1篇
组合型歧义
1篇
分词系统
机构
2篇
清华大学
1篇
香港城市大学
作者
2篇
肖云
1篇
邹嘉彦
1篇
孙茂松
传媒
1篇
计算机工程与...
年份
2篇
2001
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
利用上下文信息解决汉语自动分词中的组合型歧义
被引量:43
2001年
组合型歧义切分字段一直是汉语自动分词研究中的一个难点。该文将之视为与WordSenseDisambiguation(WSD)相等价的问题。文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论。提出了根据它们的分布“分而治之”的策略,继而根据实验确定了与特征矩阵相关联的上下文窗口大小、窗口位置区分、权值估计等要素,并且针对数据稀疏问题,利用词的语义代码信息对特征矩阵进行了降维处理,取得了较好的效果。笔者相信,这个模型对组合型歧义切分字段的排歧具有一般性。
肖云
孙茂松
邹嘉彦
关键词:
自然语言处理
汉语自动分词
中文信息处理
汉语自动分词中组合型歧义消解策略初探
该文首先在大规模语料库中统计出所有呈现两种切分形式的歧义字段,然后根据一定的挑选出247个歧义字段作为处理对象.为了深入了解组合歧义排歧过程中可能遇到的各种问题,我们选择了20个常用的歧义字段来进行详细研究.考虑到这些字...
肖云
关键词:
中文分词系统
自然语言处理
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张