您的位置: 专家智库 > >

李红莲

作品数:47 被引量:269H指数:7
供职机构:北京信息科技大学更多>>
发文基金:国家自然科学基金国家社会科学基金北京市教委科技发展计划更多>>
相关领域:自动化与计算机技术电子电信文化科学动力工程及工程热物理更多>>

文献类型

  • 36篇期刊文章
  • 7篇会议论文
  • 4篇专利

领域

  • 32篇自动化与计算...
  • 8篇电子电信
  • 4篇文化科学
  • 2篇动力工程及工...

主题

  • 7篇语音
  • 6篇语音识别
  • 6篇向量
  • 5篇支持向量
  • 5篇支持向量机
  • 5篇图像
  • 5篇中文
  • 5篇文本分类
  • 5篇向量机
  • 4篇评测
  • 4篇网络
  • 4篇相似度
  • 4篇教学
  • 3篇知识
  • 3篇特征提取
  • 3篇人大
  • 3篇口语对话系统
  • 3篇查询
  • 2篇信号
  • 2篇信号处理

机构

  • 34篇北京信息科技...
  • 8篇北方交通大学
  • 4篇北京信息工程...
  • 3篇首都师范大学
  • 2篇河北建设集团...
  • 1篇北京大学
  • 1篇北京交通大学
  • 1篇中国人民解放...

作者

  • 47篇李红莲
  • 17篇吕学强
  • 9篇袁保宗
  • 6篇何伟
  • 6篇范京
  • 4篇沈扬
  • 3篇夏红科
  • 3篇焦瑞莉
  • 3篇姚彦鑫
  • 3篇杜思奇
  • 2篇厉夫兵
  • 2篇文江川
  • 2篇缪旻
  • 2篇潘建军
  • 2篇王甜甜
  • 1篇朱希安
  • 1篇林碧琴
  • 1篇吴云芳
  • 1篇周建设
  • 1篇宋占岭

传媒

  • 5篇中国科教创新...
  • 5篇北京信息科技...
  • 3篇现代图书情报...
  • 3篇中文信息学报
  • 2篇计算机学报
  • 2篇计算机工程与...
  • 2篇无线互联科技
  • 2篇数据分析与知...
  • 1篇电脑开发与应...
  • 1篇电子学报
  • 1篇湘潭大学自然...
  • 1篇电脑与信息技...
  • 1篇计算机应用与...
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇情报理论与实...
  • 1篇计算机工程与...
  • 1篇北京机械工业...
  • 1篇现代防御技术
  • 1篇电脑知识与技...

年份

  • 1篇2024
  • 1篇2023
  • 2篇2022
  • 2篇2021
  • 1篇2020
  • 1篇2019
  • 2篇2018
  • 2篇2017
  • 3篇2016
  • 3篇2015
  • 4篇2014
  • 6篇2013
  • 2篇2012
  • 2篇2010
  • 1篇2009
  • 1篇2008
  • 2篇2007
  • 2篇2006
  • 1篇2004
  • 7篇2003
47 条 记 录,以下是 1-10
排序方式:
一种融合义原的中文摘要生成方法
2022年
文本摘要旨在对冗长的文本进行简短精确的总结,同时保留文本的原始语义。该文提出一种融合义原的中文摘要生成方法(Add Sememe-Pointer Model,ASPM),以词为单位在LCSTS数据集上进行实验。算法利用基于Seq2Seq的指针网络模型以解决由于词汇表规模导致的未登录词问题。考虑到中文一词多义现象较多,只通过指针网络模型难以很好地理解文本语义,导致生成的摘要可读性不高。方法引入了义原知识库,训练多义词的词向量表示,准确地捕捉一个词在上下文的具体含义,并对LCSTS中的一些多义词进行义原标注,以使算法能更好地获取数据集中词语的语义信息。实验结果表明,该文提出的融合义原的中文摘要生成方法可以得到更高的ROUGE分数,使生成的摘要更加具有可读性。
崔卓李红莲张乐吕学强
关键词:文本摘要文本语义
本体上下位关系在招生问答机器人中的应用研究被引量:1
2015年
【目的】提高问答系统准确率,提升目前问答系统的满意度。【应用背景】在自然语言处理领域,问答系统已成为一个重要研究热点,但现阶段问答系统的准确率较低。【方法】对智能聊天机器人ALICE源码进行分析研究,并对其进行二次开发,加入中文分词,在其内部推理分析的基础上,提出一种利用本体上下位关系对用户查询问题的推荐方法。【结果】将领域本体库融入到ALICE机器人中,对用户问题进行分析,并从中提取关键词,从本体库中查询所提取的相关关键词,得出与用户提问相匹配的答案并推荐给用户。【结论】实验结果证明,加入本体的推荐结果后,用户满意度有较大提升。
余昕聪李红莲吕学强
关键词:问答系统ALICE中文分词上下位关系
一种改进的Attention-Based LSTM特征选择模型被引量:13
2018年
为了对高校学术活动进行信息提取和文本分类,基于结合注意力机制的长短期记忆网络(Attention-Based Long Short-Term Memory)特征选择模型,构建了高校学术活动分类系统。通过大量分析高校学术活动语料的特点,准确抽取学术活动的相关内容,改善了文本数据质量;提出了一种改进的Attention-Based LSTM特征选择模型,降低了数据维度,有效地突出了重点信息。实验结果表明,该方法提高了分类的准确率,其分类效果明显优于普通LSTM(Long Short-Term Memory)模型和传统模型的处理结果。
朱星嘉李红莲吕学强周建设夏红科
关键词:信息提取文本分类
人大报告内容的文本分类被引量:2
2021年
针对区级人大报告特定的几方面内容进行文本分类,可以让人大工作人员对不同工作内容进行快速分辨,是构建人大报告辅助生成系统的必要内容。为对不同内容分类,基于TF-IDF(词频-逆文档频率)与知识增强语义表示模型ERNIE(enhanced representation from knowledge integration)结合构建分类模型。ERNIE直接对语义知识单元进行建模,在此基础上加入TF-IDF提升模型性能。实验结果表明,该方法在分类的准确率和召回率上表现不错,使ERNIE模型收敛速度加快,通过该模型可以较好地对人大报告的文本进行分类。
喻航李红莲吕学强
关键词:文本分类
网络用户搜索行为特征分析被引量:1
2014年
【目的】对网络用户行为的有关数据进行统计、分析,为进一步提高搜索引擎的性能提供依据。【方法】分析用户搜索词特点;对搜索引擎返回用户搜索结果进行分析;借用熵的概念,对用户的点击情况进行量化分析。【结果】在所有用户记录中,无空格搜索占93.66%,其中83.59%的用户使用较长搜索词串;用户确定性点击达到64.26%;71.26%的用户查看了前三个返回结果。【局限】搜索用户的规模在一定程度上影响分析结果。【结论】实验结果表明,用户点击的可靠性与确定性密切相关,搜索引擎对较长搜索词的关键词定位存在一定缺陷。
陈勇李红莲吕学强
关键词:用户行为日志分析搜索引擎信息熵
口语对话系统的评测
近几年来,人机口语对话系统的研究取得了飞速的发展,实现人机交互,自然语言的交互平台逐渐成为了现实.现在阻碍人机口语对话系统研究和发展的一个关键问题是如何对现有的口语交互平台进行客观的比较和评价,目前为止尚缺少一个用于口语...
沈扬袁保宗李红莲何伟
文献传递
基于支持向量机的文本分类技术
2014年
在文本分类过程中,影响分类准确率的两个重要因素是特征权重的计算方法,以及机器学习算法的准确率。针对传统基于支持向量机的文本分类准确率不高的问题,本文提出修正权重计算公式和采用调整支持向量机核函数参数的方法,使文本的分类准确率提高了近3个百分点。实验结果表明这两种方法的结合,确实可以提高文本分类的准确率。
于飞李红莲吕学强
关键词:文本分类支持向量机
灰体球内表面的辐射传递系数被引量:3
2017年
针对内表面为灰体的球形目标,分析了发射微元的辐射能量在球腔内的多次反射过程,利用角系数公式计算了各次能量交换过程中每个微元吸收、反射的能量,推导了灰体球内表面微元间的辐射传递系数理论计算公式.同时,利用蒙特卡洛方法计算了不同发射率条件下,发射微元对各球面微元间的辐射传递系数.理论推导结果表明,当灰体球内表面各微元的发射率相同时,微元间的辐射传递系数等于微元间的辐射角系数,与表面发射率无关.蒙特卡洛方法在不同发射率条件下的数值计算结果验证了理论公式的正确性.
厉夫兵李红莲
关键词:辐射换热灰体
一种融合关键词的生成式摘要方法
2021年
针对生成式文本摘要中模型对文本语义了解不够充分以及生成摘要缺乏关键信息的问题,提出一种融合关键词的中文摘要生成模型KBPM(Key-BERT-Pen model)。首先使用TextRank方法将文本中关键词抽取出来,然后将抽取出的关键词与原文一起经过BERT预训练模型得到更加精确的上下文表示,最终将得到的词向量输入到带有双重注意力机制的指针模型中,指针模型从词汇表或原文中取出词汇来生成最终的摘要。实验结果表明,KBPM模型能够生成可读性更好、ROUGE分数更高的文本摘要。通过对比分析也验证了KBPM模型有效解决了生成摘要中缺乏关键信息的问题。
李伯涵李红莲
关键词:文本摘要
特征融合的中文专利文本分类方法研究被引量:7
2022年
【目的】为解决现有专利分类方法未考虑专利文本中的未登录词而导致召回率低的问题,提出一种特征融合的专利文本分类方法。【方法】基于特征融合的中文专利文本分类方法,利用不断更新的专有名词词表,将经过BERT预训练的句子向量与专有名词向量进行融合,并将专有名词的TF-IDF值作为权重对向量进行赋值。【结果】在自建专利文本语料库上的实验结果显示,所提方法达到84.43%的准确率、82.01%的召回率和81.23%的F;值,其中F_(1)值相较其他方法提升约5.7个百分点。【局限】实验数据主要来源于新能源汽车领域,在其他领域中的效果有待验证。【结论】改善了数据分布不均衡以及专利文本存在大量未登录词的问题。此外,通过消融实验,评估了方法中添加专有名词与TF-IDF特征的有效性。
肖悦珺李红莲张乐吕学强游新冬
关键词:文本分类TF-IDF
共5页<12345>
聚类工具0