罗平
- 作品数:27 被引量:554H指数:4
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学更多>>
- 为上下文显式独立建模的中文实体识别方法
- 2024年
- 现有中文命名实体识别(NER)模型在公开数据集上的表现相对成熟,但有研究指出,模型过度依赖实体文本的字面特征,而上下文对实体识别的影响却未得到重视。现有的模型在简单的泛化测试中表现较差,因此本文提出显式地为上下文独立建模,令模型对上下文和实体的字面信息进行区分。为此,也提出了相应的数据增强方法用于训练模型中的上下文模块、实体字面模块和综合模块。实验结果表明,本文提出的方法在不损失测试集识别效果的情况下,明显改善了模型在不变性测试中的表现,较基准模型其失败率降低了2.3%。
- 陈点曹逸轩罗平
- 关键词:自然语言处理
- 语言处理方法、装置、设备及存储介质
- 本发明是关于一种语言处理方法、装置、设备及存储介质,属于数据处理技术领域。所述方法包括:将源语句进行预处理,生成第一向量;从第一参考向量集中,获取与第一向量间相似度大于第一阈值的第一参考向量;利用第一神经网络,对第一向量...
- 周干斌罗平曹荣禹林芬何清
- 分布式数据挖掘算法与信息理论的研究
- 目前,数据挖掘的理论和技术蓬勃发展,以缓解由数据库技术的普及带来的'数据过剩而知识匮乏'的问题.数据挖掘不仅已成为生物信息、计算化学、地理信息等科学领域的重要研究手段,并已渗透到医疗保健、疾病控制、计算金融等与国民生产休...
- 罗平
- 关键词:数据挖掘对等网络异构计算环境
- 文献传递
- 一种基于并行自动编码机的特征学习方法及系统
- 本发明提供一种基于并行自动编码机的特征学习方法,包括:1)管理机执行Map操作,为各个工作机规划任务并将任务分发给每个工作机;其中,各个工作机的任务一致,均是基于所输入的数据对自动编码机的权值矩阵进行训练;所述权值矩阵包...
- 庄福振钱明达申恩兆敖翔罗平何清
- 文献传递
- 金融文档语义理解——提升行业智能化的关键AI技术被引量:1
- 2018年
- 近年来,随着人工智能技术的发展,金融行业智能化发展趋势已在业内达成共识。总体来说,人工智能在金融行业的最大应用在于及时获取海量信息,并将之转化为知识,帮助从业人员、监管机构以及客户做出更好的决策。正如普华永道近期发布的《2018年中国金融科技调查报告》中提到:科技的快速发展,对于中国的传统金融机构而言,不仅改变了营销和获客等前端业务,也在驱动中后台的变革。金融中后台业务充斥着大量的文档工作,而金融文档语义理解正是将金融中后台业务乃至整个行业智能化水平提升的关键前沿技术。
- 罗平
- 关键词:后台业务文档工作招股说明书海量信息文档结构
- 描述型多维度事件序列的并行频繁情节挖掘方法与系统
- 本发明提出描述型多维度事件序列的并行频繁情节挖掘方法与系统,涉及互联网技术领域,该方法包括按照事件属性将所述事件序列分为多个事件子序列,对每个事件子序列进行挖掘,并将挖掘结果进行存储,将相同的事件子序列进行计数累加,将计...
- 敖翔左罗罗平庄福振何清
- 文献传递
- 一种分布式的趋同行为挖掘方法与系统
- 本发明涉及一种分布式的趋同行为挖掘方法和系统,包括:获取由四元组数据组成的数据集合,四元组数据包括对象、事件、时间点和权重,将数据集合按照事件类型划分为多个事件集合;为事件集合构建索引树,根据事件集合中的时间点确定索引树...
- 李宏伟罗平敖翔庄福振何清
- 非关系型表格理解前沿进展
- 2024年
- 表格理解是指通过计算机对广泛存在于互联网、垂直领域的表格进行自动识别、解析和应用的过程。表格可大致分为关系型表格和非关系型表格。前者类似关系数据库表格,具有结构固定、机器易解析等特点,其研究历史由来已久。后者通常布局多变,语法灵活,具有更明显的语言特性,这也导致计算机在解析和应用非关系型表格时面临着极大挑战。非关系型表格理解是自然语言和计算机视觉多模态交叉的重要新兴领域之一。随着近年来深度学习技术的普及应用,非关系型表格在表格识别、语义分析、创新应用几个方向得到了长足发展。该文介绍了非关系型表格的结构特点,阐述了其在研究过程中面临的独特挑战,然后从表格识别、语义分析、创新应用三个研究方向简要介绍了近年来此领域的发展,归纳了相关数据集,最后总结了目前非关系型表格理解领域亟需解决的问题,展望了未来研究方向。
- 罗平杨清平曹逸轩曹荣禹何清
- 描述型多维度事件序列的并行频繁情节挖掘方法与系统
- 本发明提出描述型多维度事件序列的并行频繁情节挖掘方法与系统,涉及互联网技术领域,该方法包括按照事件属性将所述事件序列分为多个事件子序列,对每个事件子序列进行挖掘,并将挖掘结果进行存储,将相同的事件子序列进行计数累加,将计...
- 敖翔左罗罗平庄福振何清
- 语言处理方法、装置、设备及存储介质
- 本发明是关于一种语言处理方法、装置、设备及存储介质,属于数据处理技术领域。所述方法包括:将源语句进行预处理,生成第一向量;从第一参考向量集中,获取与第一向量间相似度大于第一阈值的第一参考向量;利用第一神经网络,对第一向量...
- 周干斌罗平曹荣禹林芬何清
- 文献传递