王晓斌
- 作品数:4 被引量:21H指数:2
- 供职机构:电子工程学院更多>>
- 发文基金:博士研究生创新基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 中文领域本体学习中术语的自动抽取被引量:15
- 2009年
- 提出一种领域术语自动抽取的混合策略,首先进行多字词候选术语抽取和分词,然后合并其结果,最后通过领域相关度和领域主题一致度抽取出最终领域术语。在多字词抽取和最终领域术语抽取阶段分别对现有方法进行了改进,降低了字符串分解的时间复杂度并提高了领域术语抽取的准确率和召回率。实验表明,术语抽取准确率为90.64%,优于现有的抽取方法。
- 温春王晓斌石昭祥
- 基于独立分量分析的隐蔽Web领域聚类被引量:1
- 2009年
- 针对隐蔽Web主题领域自动识别问题,提出一种基于独立分量分析(ICA)的聚类算法。对查询页面进行页面文本抽取和预处理,利用TF-IDF公式计算权重并选择前N个权重最大的特征词构造文档矩阵,在使用潜在语义索引(LSI)进行特征重构的基础上通过ICA分解获得类别信息。利用LSI的词共现分析和文本降噪能力提高聚类准确率。实验表明聚类平均准确率达到90%以上。
- 王晓斌温春石昭祥
- 关键词:潜在语义独立分量分析文本聚类
- 基于贝叶斯信息准则的文本主题数估计被引量:5
- 2009年
- 特定领域的主题识别和关键词提取有着广泛的应用,但通过人工指定识别或文本聚类自动生成的主题类别缺乏客观的度量方法。该文结合基于BIC准则的模型选择理论和独立分量分析技术对主题的数量进行概率估计,给出主题数量在BIC意义下的统计分布。在此基础上实现了文档矩阵的ICA分解,并根据分离的独立分量获得主题的关键词及其权重。实验表明,该方法在没有领域知识支持的情况下能估计出反映文本集合的主题数并提取相应的关键词。
- 王晓斌温春石昭祥
- 关键词:主题识别关键词提取独立分量分析贝叶斯信息准则
- 基于DEVS的网络设备仿真建模技术研究
- 在分析目前网络设备仿真建模所面临的主要问题的基础上,简要介绍了DEVS规范及其基本构成要素.以以太网交换机为实例,对基于DEVS的网络设备仿真建模技术进行了研究.最后对网络设备建模的其它相关问题进行了讨论,就基于DEVS...
- 辛元王晓斌胡荣贵
- 关键词:交换机计算机仿真仿真建模网络设备
- 文献传递