国家自然科学基金(20673119)
- 作品数:3 被引量:15H指数:2
- 相关作者:郭力李晓霞袁小龙刘增才夏诏杰更多>>
- 相关机构:中国科学院过程工程研究所中国科学院研究生院北京大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 化学主题网络爬虫的研究
- 网络爬虫(Web Crawler)是指通过Web页面之间的链接关系从Web上自动的获取页面信息,并且沿着链接执行不断扩展的程序。随着网络的迅速发展,Web成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战...
- 夏诏杰郭力李晓霞
- 关键词:主题网络爬虫文本分类网页分块
- 文献传递
- 利用ChemDB Portal检索化学深层网
- <正>Internet的普及为专业人员获取数据信息、利用计算工具提供了统一的平台,检索网络化学信息资源的工具也从化学浅层网向化学深层网发展。中国科学院过程工程研究所高性能计算与
- 李晓霞袁小龙夏诏杰井银铃聂峰光唐武成郭力
- 关键词:化学数据库搜索引擎化学信息学
- 文献传递
- 基于XML的化学深层网数据提取模板生成工具
- 分布在 Internet 上的化学数据库是宝贵的化学信息资源,化学深层网是这类数据库的集合,化学深层网检索的目标是利用一个查询,实现多个化学数据库数据的同时检索和数据集成。基于 XML 的化学深层网数据提取方法是通过构造...
- 卓流艺李晓霞袁小龙郭力
- 关键词:XML化学数据库
- 文献传递
- 基于XML的半结构化化学信息提取系统的重构与优化
- ChemDB Portal 系统是基于 XML 技术面向多个远程化学数据库的半结构化数据采集引擎。该系统通过单一检索入口同对多个远程化学数据库发送针对不同数据库构造的查询请求,并将返回的包含半结构化数据的页面分别转化为结...
- 袁小龙刘增才李晓霞郭力
- 文献传递
- 基于SSH+ExtJS架构的化学数据知识框架管理
- <正>本文针对化学深层网数据提取中的数据知识框架描述具有一对多、多对多关系的特点,利用开源的对象关系影射框架Hibernate,实现数据持久化、关联查询、事务处理等服务器端的操作;利用
- 刘增才李晓霞袁小龙郭力
- 关键词:STRUTS2HIBERNATEEXTJS
- 文献传递
- Internet推动的化学信息学重要进展被引量:4
- 2008年
- Internet的普及为专业人员获取数据信息、利用计算工具提供了统一的平台,由此为化学信息学的发展带来了新的空间,推动了化学信息学以网络为基础,以化学相关的数据、信息及计算资源共享为目标的快速发展。本文将从不同侧面回顾近10年来化学信息学的重要进展,包括:(1)网络化学信息检索:索引对象从化学浅层网向化学深层网发展;检索工具从web化学信息资源导航向化学专业搜索引擎(包括文本信息和化合物标识信息)、及化学深层网检索引擎(化合物物性数据提取)发展;索引粒度从web站点向页面、乃至页面中的特定内容发展,一般页面特定内容的数据提取(即非结构化数据提取)是未来发展的方向。(2)可共享的化学数据库:从可免费访问和使用的化学数据库向数据库内容通过集成多来源数据(包括数据库拥有者主动收集、多来源数据主动提交达到共享的方式,repository)实现数据库内容免费下载和共享,以及不同数据库之间的相关内容实现无缝连接的方向发展(如NIH建成的药物小分子共享数据库PubChem)。(3)开源(open source)化学软件工具包:从化学结构基本处理模块如CDKJ、OELib向集成开发环境如化学信息学与生物信息学集成环境Bioclipse发展。(4)与化合物及其数据共享相关的推荐标准:包括用于共享数据交换的化学标记语言CMLI、UPAC推荐的学术论文相关热力学实验数据提交标准ThermoML及化合物结构唯一描述码InChI。(5)计算化学资源共享及基于网格的应用:从可执行程序的下载向在线计算、基于网格的应用发展。(6)eChemistry和虚拟研究环境:网络也成为化学相关日常的科学活动中不可缺少的平台。构建以网络为平台、支持开展科研活动的数字化基础设施和服务的eChemistry探索开始出现,根据需要自主集成多来源数据和计算资源,形成不同层次的支持协同工作的虚拟研�
- 李晓霞郭力袁小龙夏诏杰聂峰光
- 关键词:化学信息学REPOSITORY虚拟研究环境
- 一种面向化学深层网的移动可变数据窗提取技术
- 网络上的免费化学数据库资源网站一般属于化学深层网范畴,其数据页面隐藏于以表单为特征的网站检索入口之后为动态生成或独立存在的网页。这些化学数据页面无法通过超链接分析被通用搜索引擎索引和检索,具有形式统一、数据规范的特点。为...
- 袁小龙李晓霞郭力
- 关键词:数据提取XML
- 化学计算软件网格化方法研究被引量:2
- 2008年
- 本文以分子力学计算为例,提出了一个化学计算软件网格化的思路。目前已有的化学计算软件多为单机版本,以高级编程语言如FORTRAN、C/C++等编制而成,本文采用JNI技术与Globus Toolkit 4软件相结合的方法对分子力学C++计算程序进行封装,基于Java语言和Web Service实现了它的网格化,对计算程序的内部核心未做改动。本文的技术路线可用于其他化学计算软件向网格环境方便、有效地移植。
- 郭力李晓霞袁小龙杨小震乔学斌徐筱杰
- 关键词:分子力学JAVAWEBSERVICE
- 开源软件在化学数据库分子结构检索中的应用
- <正>分子结构检索是化学数据库必备的检索手段,利用开源化学软件是实现分子结构检索的有效途径。不同于商业软件的解决方案,开源本身就体现了经济性和可重复开发的特点。本文利用著名的
- 袁小龙李晓霞刘增才郭力
- 关键词:开源子结构预处理
- 文献传递
- Internet推动的化学信息学重要进展
- <正>Internet的普及为专业人员获取数据信息、利用计算工具提供了统一的平台,由此为化学信息学的发展带来了新的空间,推动了化学信息学以网络为基础,以化学相关的数据、信息及计算资源共
- 李晓霞郭力袁小龙聂峰光
- 关键词:化学信息学数据提取REPOSITORY化学数据库化学软件虚拟研究环境
- 文献传递