李晶
- 作品数:4 被引量:29H指数:1
- 供职机构:华中师范大学计算机学院计算机科学系更多>>
- 发文基金:教育部科学技术研究重点项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 当代大学生道德修养的培养
- 2007年
- 社会公德、职业道德、家庭美德涵盖了中国传统道德很多优秀的成分。对当代大学生进行道德教育的时候要关注中国传统道德,关注中国文化;对于西方文化中一些合理成分,要选择对我们有益的东西。
- 李晶麻旎
- 关键词:社会公德道德修养道德教育
- 对中文博客用语的一些调查研究
- 2010年
- 对日渐兴盛蓬勃的中文博客进行用语调查,在汉语言的发展、演变及趋势研究中具有重大意义。本文采用自动化手段,从几个中文最流行的博客网站上爬取结构化汉语语料,并从博客用字、博客用词、博客中男女用词的异同等方面对这些语料进行统计、分析。统计数据真实的反映了汉语言在博客上的使用状况,并为汉语言的网络发展研究提供了一定的依据。
- 赵君喆李晶
- 关键词:爬虫媒体语料
- 基于种子自扩展的命名实体关系抽取方法被引量:29
- 2006年
- 命名实体间关系的抽取是信息抽取中的一个重要研究问题,该文提出了一种从大量的文本集合中自动抽取命名实体间关系的方法,找出了所有出现在同一句子内、词语之间的距离在一定范围之内的命名实体对,把它们的上下文转化成向量。手工选取少量具有抽取关系的命名实体对,把它们作为初始关系的种子集合,通过自学习,关系种子集合不断扩展。通过计算命名实体对和关系种子之间的上下文相似度来得到所要抽取的命名实体对。通过扩展关系种子集合的方法,抽取的召回率和准确率都得到了提高。该方法在对《人民日报》语料库的测试中,取得了加权平均值F-Score为0.813的效果。
- 何婷婷徐超李晶赵君喆
- 关键词:关系抽取自学习
- 一种无指导命名实体关系抽取研究
- 2009年
- 提出了一种网络数据挖掘的方法从大规模文集中抽取命名实体之间的关系.其核心思想是,将文集中的命名实体对以及它们的上下文表示成网络结构并从该网络结构中发现网络社区,则每个社区表示一种关系,而处于相同社区中的命名实体对具有相同的关系;最后我们用适当的词语来标记这些关系.我们使用《人民日报语料库》进行实验,其结果表明我们不但可以得到较高的准确率,而且可以自动的标注命名实体的关系.
- 赵君喆何婷婷李晶
- 关键词:介数