您的位置: 专家智库 > >

中国科学院知识创新工程(KGCX2-SW-504)

作品数:7 被引量:40H指数:3
相关作者:吴健贾彦民孙玉芳芮建武李文波更多>>
相关机构:中国科学院软件研究所内蒙古蒙科立软件有限责任公司中国科学院研究生院更多>>
发文基金:中国科学院知识创新工程国家高技术研究发展计划国家电子信息产业发展基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇中文期刊文章

领域

  • 7篇自动化与计算...

主题

  • 4篇信息处理
  • 4篇中文
  • 4篇中文信息
  • 4篇中文信息处理
  • 4篇计算机
  • 4篇计算机应用
  • 2篇字处理
  • 2篇字符
  • 2篇文字处理
  • 2篇OPENOF...
  • 2篇藏文
  • 1篇音素
  • 1篇语义
  • 1篇套件
  • 1篇排版
  • 1篇人工智能
  • 1篇字典序
  • 1篇字符集
  • 1篇浏览
  • 1篇浏览器

机构

  • 7篇中国科学院软...
  • 1篇中国科学院研...
  • 1篇内蒙古蒙科立...

作者

  • 7篇吴健
  • 4篇贾彦民
  • 2篇孙玉芳
  • 2篇芮建武
  • 1篇孟凡强
  • 1篇谢谦
  • 1篇介孟恩
  • 1篇曹晖
  • 1篇程伟
  • 1篇林河水
  • 1篇吕元华
  • 1篇李文波
  • 1篇杨成甫

传媒

  • 5篇中文信息学报
  • 1篇计算机研究与...
  • 1篇计算机工程与...

年份

  • 4篇2007
  • 2篇2006
  • 1篇2004
7 条 记 录,以下是 1-7
排序方式:
蒙古文显示在OpenOffice.org办公套件中的实现被引量:3
2007年
蒙古文是一种复杂文字,目前操作系统和办公套件都还不支持蒙古文的显示。OpenOffice.org是可以运行在Linux和Windows上跨平台的办公套件,它分别使用ICU LayoutEngine和Uniscribe进行复杂文字处理。本文以支持蒙古文处理的Linux版本OpenOiffice.org为基础,详细分析了OpenOffice.org在Linux和Windows系统上的复杂文本处理过程,采用Uniscribe与ICU相结合的方案,实现了OpenOffice.org在Windows平台上对蒙古文的显示。
孟凡强吴健贾彦民
关键词:计算机应用中文信息处理ICU
编码字符集标准及分类研究被引量:8
2006年
编码字符集标准是计算机处理文字信息的基础,本文提出了编码字符集三元组抽象,对现有编码字符集标准进行了简单回顾和总结,深入剖析了影响巨大的ISO 2022标准及其派生标准,对ISO 2022编码机制应用于多语言环境的局限性进行了探讨,阐明了使用通用编码字符集UCS的必要性,并对其进行了分析。探讨了现有编码分类方法存在的问题,引入了一种对编码字符集以及实现方法进行分类的新方法,使用该方法对现有标准进行了归类;最后对汉字字符集相关的国家标准进行了分析评介。
谢谦芮建武吴健
关键词:计算机应用中文信息处理编码字符集
一种符合ISO14651语义的藏文排序实现方法被引量:22
2004年
本文介绍了一种实现藏文字典序排序的方法 ,它针对藏文“大字丁字符集”编码方案。通过引入有(无 )前加基字符的概念 ,它把待排序的藏字预处理为有 (无 )前加基字符、前加字符、基字 (基字符或者字丁 )、后加字符、再后加字符串后 ,再行比较 ,从而避免拆分字丁。本实现方法符合ISO/IEC14 6 5
林河水程伟曹晖李文波吴健孙玉芳
关键词:计算机应用中文信息处理藏文字典序
OpenOffice.org对非BMP平面字符支持的实现
2007年
Unicode标准中的非BMP平面字符多用于古籍研究或者少数民族语言文字,由于这些字符的使用面特别窄,多数软件系统包括办公软件都不支持对这些字符的处理。本文以开源办公套件OpenOffice.org为基础,分析了它对非BMP平面支持的现状,然后着重探讨了实现对非BMP平面字符的全面支持所需要解决的一系列问题,并分别给出了合理的改进方案,最后以CJK和藏文为例展示了改进后的效果。
介孟恩吴健贾彦民吕元华
关键词:人工智能模式识别OPENOFFICE.ORGPAIR
一种基于谓词规则的复杂文字处理模型被引量:1
2007年
复杂文字在显示输出的过程中,表现出极为复杂的语言特征.为此提出了一种基于谓词规则的复杂文字处理模型,模型以谓词规则的方法给出了复杂文字字形布局特征的形式化描述,按照复杂文字处理的过程,设计了实现该模型的软件体系结构,将复杂文字的语言特征从程序控制逻辑中隔离出来,提高了系统的灵活性,便于增加新的复杂文字的支持.在研制蒙古文、藏文、维吾尔文办公套件的应用中表明,该模型是实用有效的.
贾彦民吴健呼斯勒
关键词:文字处理UNICODE
国际化文字处理综述被引量:7
2006年
计算机与不同用户的交互通常必须实现通过多种文字信息的输入/输出以实现,因此操作系统对多种文字的支持程度是其功能性的一个衡量标准。各种文字特征的巨大差异导致现代操作系统的文字处理实现非常复杂。本文总结了操作系统文字处理的范围与内容,包括文本输入与存储,文本处理以及用户交互处理;归纳了通用的文字处理模型和可能采取的技术途径及其优缺点;分析了常用操作系统的文字处理实现;最后展望了文字处理仍面临的挑战。
芮建武吴健孙玉芳
关键词:计算机应用中文信息处理文字处理
Web服务器端藏文字符串长度的近似算法
2007年
藏文属于拼音文字,她的书写规则与英语书写规则一样是从左向右,从上到下,但每个单词之间没有空格,只用音节符把每个单词给分隔开。根据藏文文法,藏文的换行只能发生在音节符、单垂符,双垂符与空格的后面。目前主流浏览器(如Firefox,Netscape等)都不能处理藏文的这一断行特性,所以这些浏览器无法正常显示藏文文本,如Firefox将整个一段没有空格文本当作一个单词,造成在屏幕的右边无法换行。结果是用户必须拖动鼠标来浏览整篇文章,给用户带来了很大的麻烦。又由于藏文中大部分的拼音字母的宽度是不同的,在编写HTML文档时候也无法根据藏文字符串的多少来决定字符串的长度。该算法将采用了一个粗略的方法得到一个字符串长度的近似值,再根据行宽的限制在字符串的适当的位置找到一个可断行点进行断行。虽然得到的是近似值,但是基本上解决了主流浏览器无法处理藏文排版的问题。
杨成甫贾彦民吴健
关键词:藏文排版网页设计浏览器WEB服务器
共1页<1>
聚类工具0