何海斌
- 作品数:8 被引量:18H指数:2
- 供职机构:河北大学更多>>
- 发文基金:河北省自然科学基金国家自然科学基金河北省教育厅科研基金更多>>
- 相关领域:自动化与计算机技术理学文化科学建筑科学更多>>
- 大规模文本分类中特征提取方法的比较研究
- 2009年
- 文本分类中特征向量空间是高维和稀疏的,降维处理是分类的关键步骤。针对传统特征提取方法的不足,提出采用基于迭代的CCIPCA和ICA特征提取方法处理大规模文本分类问题,实验结果表明降维提高了分类效果。在CCIPCA、ICA及ICA与IG组合降维的方法中,基于ICA降维的分类效果是最好的。
- 何海斌司建辉
- 关键词:特征提取
- 基于GIS的地下管网可视化管理信息系统研究
- 卢素魁杨文柱刘云山王思乐张明郗亚辉戴晓东司建辉何海斌
- 研究制定了统一规范的“基于保定高新技术开发区”的地下管线的技术信息内容和标准。给出了地下管线的勘测技术方案和施工方案,确定所需采集的数据。对地下管网的空间信息和属性数据进行完整的、科学的规划,设计了合理的数据结构。根据各...
- 关键词:
- 关键词:地下管线地理信息系统
- 文本分类中特征降维技术的研究
- 随着网络和信息技术的快速发展,大规模的文本处理得到持续研究和关注。大规模文本分类面对的是巨大的文本和类别数量,高维的特征空间对分类算法带来极高的计算复杂度和空间复杂度,且影响算法的可扩展性。对特征空间有效的降维不仅可以提...
- 何海斌
- 关键词:特征降维特征提取
- 基于概念的中文信息自动获取研究
- 李新福田学东何海斌杨芳王凤湘司建辉史青宣苗秀芬张充杨刚
- 该项研究针对大规模文本分类的降维问题,提出了采用迭代的CCIPCA和ICA算法,该算法在分词和词性标注的基础上,分析概念语义特征,并依次输入文本向量,增量计算其主元,通过迭代的方法逐步收敛得到文本的特征向量。提出了基于搭...
- 关键词:
- 关键词:中文文本自动标注方法
- 使用Logistic回归模型进行中文文本分类被引量:12
- 2009年
- 使用Logistic回归模型进行中文文本分类,通过实验,比较和分析了不同的中文文本特征、不同的特征数目、不同文档集合的情况下,基于Logistic回归模型的分类器的性能。并将其与线性SVM文本分类器进行了比较,结果显示它的分类性能与线性SVM方法相当,表明这种方法应用于文本分类的有效性。
- 李新福赵蕾蕾何海斌李芳
- 关键词:LOGISTIC回归模型支持向量机文本分类
- 基于CCIPCA和ICA降维的文本分类研究被引量:4
- 2008年
- 文本分类中采用向量空间模型来表达文本特征,维数巨大,关键是对高维的特征集进行降维处理,而一般的分解算法无法处理大规模的高维问题。采用CCIPCA与ICA相结合的特征提取方法可以有效地实现文本特征降维。实验结果表明降维提高了分类器的效率和效果。
- 何海斌李新福赵蕾蕾
- 关键词:文本分类特征降维支持向量机
- 非线性映射变分包含问题的研究
- 刘英陈俊敏李杰佟慧何海斌
- 该项目属于非线性泛函分析方面的前沿课题,探讨了包含各类非线性映射的变分包含问题的可解性和迭代算法。将度量投影算子、广义投影算子、广义f-投影算子、sunny非扩张收缩核、预解式算子与单调杂交投影算法、粘滞迭代算法、广义迭...
- 关键词:
- 关键词:非线性泛函分析迭代算法
- 印刷体数学公式自动输入技术
- 田学东李新福史青宣杨芳何海斌苗秀芬张充司建辉张国春田冰洁
- “印刷体数学公式自动输入技术”是一种将印刷文献中的数学公式高速、自动地输入计算机的软件技术。该技术具有高速、自动的特点,可以将用户从繁琐、复杂、枯燥的数学公式手工输入中解放出来。随着科学技术的发展和社会的进步,人们对数学...
- 关键词: