李萌 作品数:8 被引量:33 H指数:3 供职机构: 教育部 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 更多>>
OKQA:一个基于本体的软件开发知识QA工具 2013年 近年来,软件开发模式逐渐从经验驱动的手工构造模式到知识驱动的自动生成模式进行转换,而在知识驱动的软件开发过程中,QA工具可以帮助开发人员更好地理解项目源代码。一般的,开发人员往往需要阅读大量文档、并对软件项目代码进行静态分析,利用某种形式化的查询方法才能获取软件项目的相关信息,这增加了软件开发的时间成本和学习成本。基于该问题,实现了一个基于本体的软件开发知识QA工具OKQA,OKQA可以支持开发人员的自然语言查询输入,帮助开发人员找到理解软件代码的相关答案,从而有效地指导开发人员理解及复用软件代码。 宋怀达 李萌 赵俊峰 金靖 谢冰关键词:知识驱动 本体 软件开发 一种基于LDA和静态分析的代码功能识别方法 被引量:3 2013年 近年来,随着代码复用技术不断成熟和Internet上开源项目不断丰富,软件开发人员的开发行为也逐渐发生了变化。如今,软件开发人员在编程过程中越来越多地依赖于开源软件项目提供的功能。然而,在软件复用活动中,由于开源项目文档的不全面以及代码结构的复杂性,软件开发人员往往只能片面地了解项目的某些功能点,使得复用效率不高。针对开源项目代码丰富而文档较少这一现状,提出了一种基于LDA(Latent Dirichlet Allocation)和静态分析的代码功能识别方法,对传统LDA方法进行了扩展,帮助软件开发人员更全面地了解项目的功能点,从而更好地支持代码复用活动。 金靖 李萌 华哲邦 宋怀达 赵俊峰 谢冰关键词:软件复用 代码 一种基于Internet的JAR包使用信息收集方法 2011年 随着软件复用技术的发展,Internet上出现了大量可以被利用的软件资源,如Web Services,JAR包等。但是,这些软件资源常常缺乏必要的描述信息和使用说明。为此,提出了一种基于Internet的JAR包使用信息收集方法,以帮助用户检索并整理Internet上已经存在的JAR包描述信息和用户使用评论,辅助软件复用的成功进行。基于该方法,设计并实现了北京大学软件资源库JAR包使用信息收集子系统。该系统目前已经为6000余个JAR包资源收集、整理了相关的描述和评论信息。 邹艳珍 刘昌盛 李萌 谢冰关键词:软件资源 使用信息 基于主题建模和静态分析技术的软件代码功能性主题获取方法 被引量:5 2014年 近年来,基于主题建模技术的代码理解方法成为研究热点之一.该类方法期望利用主题建模技术从软件代码中挖掘功能性主题,进而利用功能性主题帮助开发人员理解软件功能及其代码实现.然而,从代码挖掘出的主题中,功能性主题与其他类型主题(如横切性主题)混杂在一起,需要人工识别功能性主题;由于现有工作大多仅提供主题关联的词等基本信息,导致识别及应用功能性主题的过程费时费力.针对以上问题,本文提出了一种基于主题建模和静态分析技术的软件代码功能性主题获取方法.该方法在利用一组启发式过滤规则对代码进行预处理的基础上,基于主题建模技术从代码中挖掘原始主题;进而,基于代码静态分析获得的代码间结构关系,提出了一种名为主题内聚度的技术从原始主题中自动识别功能性主题;最后,定位主题关联的代码片段,并利用代码及其注释为主题生成自然语言描述文本,进一步帮助开发人员理解主题所体现的软件功能及其代码实现细节.本文基于一组开源软件代码进行了方法评估,评估结果表明本文方法能够有效获取功能性主题及其关联信息,进而帮助开发人员更好地理解软件功能及其代码实现. 李萌 赵俊峰 谢冰关键词:主题模型 信息检索 一种基于Internet的JAR包使用信息收集方法 随着Internet和软件复用技术的发展,在Internet上出现了越来越多可以被利用的软件资源,如Web Services、JAR包等。收集、整理这些软件资源将极大地丰富软件资源库中资源的数量和种类,从而有力地推动软件... 刘昌盛 李萌 邹艳珍 谢冰关键词:软件资源 使用信息 文献传递 基于时间序列分析的Web Service QoS预测方法 被引量:21 2013年 通过网络提供服务的Web Service的服务质量会随着网络环境、服务器负载等因素的变化而变化,如何更好地帮助用户选择在未来一段时间内符合服务质量需求的Web Service,是目前服务计算领域中需要解决的关键问题之一。针对上述问题,提出了一种基于时间序列分析的Web Service QoS预测方法,并实现了相应的Web Service QoS自动预测工具。该工具能够根据Web Service的历史QoS数据,有效地预测未来短期内的QoS信息。以17832个Web Service的历史数据为基础,设计了相关实验,并验证了方法的有效性。 华哲邦 李萌 赵俊峰 谢冰关键词:WEB SERVICE 时间序列 一种基于主题建模的代码功能挖掘工具 2014年 代码复用是重要的软件复用方式之一,复用者需要理解软件代码实现的功能方能有效实施软件复用。基于主题建模技术的程序理解方法逐渐受到研究人员的重视,它能够帮助软件开发者和使用者更好地理解软件的功能。目前,基于主题建模技术的程序理解方法一般欠缺对挖掘出的Topic的语义分析,为此提出的基于代码静态分析和LDA技术的代码功能挖掘(Code Function Mining,CFM)方法可作为对这类方法的补充。CFM是一套以代码为研究对象的挖掘、筛选、组织和描述主题(Topic)的方法,该方法能够生成带描述的功能型Topic的层次结构,以供使用者更清晰和方便地浏览、学习软件的功能。功能型Topic的描述能够帮助复用者理解代码功能,其层次结构能够让复用者从不同抽象层次理解代码功能。CFM方法包括4个部分:挖掘Topic、筛选Topic、组织Topic、描述Topic。以CFM方法为基础,设计并实现了一个CFM工具。CFM工具能够分析用户提交的代码,通过Web页面向用户展示带描述的功能型Topic的层次结构。最后,对CFM方法中的几个关键算法进行实验分析,验证了CFM方法的有效性。 华哲邦 李萌 赵俊峰 邹艳珍 谢冰 李扬关键词:软件代码 LDA 基于网络信息搜索的Web Service文本描述信息扩充方法 被引量:4 2012年 随着Web服务技术的不断成熟和发展,互联网上出现了大量的公共Web服务.在使用Web服务开发软件系统的过程中,其文本描述信息(例如简介和使用说明等)可以帮助服务消费者直观有效地识别和理解Web服务并加以利用.已有的研究工作大多关注于从Web服务的WSDL文件中获取此类信息进行Web服务的发现或检索,调研发现,互联网上大部分Web服务的WSDL文件中普遍缺少甚至没有此类信息.为此,提出一种基于网络信息搜索的从WSDL文件之外的信息源为Web服务扩充文本描述信息的方法.从互联网上收集包含目标Web服务特征标识的相关网页,基于从网页中抽取出的信息片段,利用信息检索技术计算信息片段与目标Web服务的相关度,并选取相关度较高的文本片段为Web服务扩充文本描述信息.基于互联网上的真实数据进行的实验,其结果表明,可为约51%的互联网上的Web服务获取到相关网页,并为这些Web服务中约88%扩充文本描述信息.收集到的Web服务及其文本描述信息数据均已公开发布. 王立杰 李萌 蔡斯博 李戈 谢冰 杨芙清关键词:WEB服务