秦杰
- 作品数:4 被引量:9H指数:2
- 供职机构:解放军理工大学更多>>
- 发文基金:江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 一种面向军事文本的领域特征词向量描述方法被引量:4
- 2016年
- 针对军事文本信息中命名实体多、特征词领域性强的特性,提出一种领域特征词向量描述方法。从优化分词和领域特征词筛选方面压缩向量空间,完善时间、地名、部队名称和武器装备4类重要命名实体的提取规则,扩充分词词典库。改进领域相关度和领域一致度相结合的领域特征词筛选算法,突出领域特征词与常用词汇之间的差别,进一步过滤领域特征词。实验结果表明,优化分词后,该方法能够提取出军事文本中的命名实体和部分专有词汇,降低特征词数量,改进后的领域特征词筛选算法将准确率和召回率分别提高20%和16.7%,提出的领域特征词向量描述方法所生成的特征词向量具有较强的领域性。
- 秦杰曹雷彭辉赖俊
- 关键词:向量空间分词
- 基于Lucene的本地搜索引擎研究与实现被引量:4
- 2014年
- 为了改善计算机传统搜索在效率和返回结果上的不足,基于Lucene全文检索高效、准确的特点,采用非结构化文档结构化的思想,提出了文档内容自然分片索引的方法,实现了一个针对本地资源的个性化搜索引擎。
- 秦杰宋金玉张广星
- 关键词:LUCENE本地搜索
- 一种改进Borda分值的决策方法被引量:1
- 2015年
- 针对传统的Borda法存在无法反映方案之间优劣程度和容易被操纵的缺陷,设计了一种Borda分修正算法。该算法充分考虑了全局成员和单个成员两方面的利益,借鉴模糊Borda法变换得分值和SPAN法中成员相互作用的全局思想,对Borda分矩阵进行修正;根据加权和公式集结方案的综合值进行方案排序;最后,通过一个算例验证了该算法的可行性与准确性。
- 秦杰贺毅辉赖俊
- 关键词:SPAN加权和
- 基于综合值修正的领域概念筛选算法
- 2016年
- 为了提高领域概念筛选的准确率,对测试数据进行了筛选,指出了算法误筛选常用词汇的问题,分析了常用词汇的高一致度值导致高综合值的缺陷,设计并探讨了术语综合值修正参数,改进了原有综合值的计算方法,放大了领域概念与常用词汇之间的差别。仿真实验表明,修正后的综合值与原综合值相比,变化趋势一致,但幅度更大。数据实验表明,在不影响领域概念筛选结果的基础上,改进后的筛选算法增大了领域概念的综合值,同时降低了常用词汇的综合值,实现了常用词汇的剔除,提高了准确率。
- 秦杰曹雷彭辉赖俊