孙波
- 作品数:4 被引量:16H指数:2
- 供职机构:西南科技大学信息工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于模糊支持向量机的剪接位点识别被引量:2
- 2011年
- 为了提高模糊支持向量机(FSVM)对剪接位点的识别精度,提出一种计算样本隶属度的新方法。将样本到两聚类中心的距离比值作为样本的初始隶属度,采用K近邻(KNN)方法计算样本的紧密度,最后将初始隶属度与紧密度的乘积作为样本的最终隶属度,这样既提高了支持向量的隶属度,又降低了噪声样本的隶属度。将此方法应用到剪接位点的识别中,对组成性5'和3'剪接位点的识别精度分别达到了94.65%和88.79%,与经典支持向量机相比,3'剪接位点的识别精度提高了7.94%。
- 孙波李小霞李铖果
- 关键词:模糊支持向量机剪接位点识别选择性剪接
- 文档图像几何畸变快速校正的新方法被引量:3
- 2010年
- 针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,首先采用连通域标记方法进行单词及文本线的检测;然后根据单词中位点信息线性拟合得到其校正基线;最后根据校正基线和垂直位移距离分别对单词进行旋转和位移而得到校正后的图像。与传统方法相比,该方法得到的校正基线和垂直位移距离不受文档具体文字内容的影响,能更加准确地代表单词的倾斜走向,并保证校正后的单词在水平方向上对齐;同时表现出了很好的鲁棒性。经过分析算法的计算复杂度,并与传统方法相比较,该算法的效率和鲁棒性较高。
- 宋丽丽吴亚东孙波
- 关键词:连通域标记
- 基于非线性支持向量机的原核生物基因识别被引量:1
- 2009年
- 应用非线性最小二乘支持向量机对原核生物进行基因识别,通过寻找序列开放阅读框(ORF),并与可靠基因位点文件进行比较产生训练样本集,然后提取样本GC含量和Z曲线特征,并利用T检验方法检验各特征值所包含的信息量,设计出了非线性最小二乘支持向量机分类器识别基因。结果表明非线性最小二乘支持向量机的识别率比Fisher判别和线性支持向量机在不同的特征组合下分别提高了7.09%-29.97%和10.97%-25.45%,并且在特征值信息量较小的情况下非线性最小二乘支持向量机更能表现其优越性。
- 张继宏李小霞孙波
- 关键词:基因识别原核生物GC含量Z曲线T检验
- 改进的文档图像扭曲校正方法被引量:10
- 2011年
- 由照相机拍摄的文档图像可能因扭曲变形导致OCR软件不能正确识别。为解决上述问题,采用图像分割技术进行单词及文本线检测,利用线性拟合得到单词的较低基线和较高基线,根据校正基线对单词进行旋转和垂直位移,得到校正后的图像。实验结果表明,该方法能快速有效地校正扭曲的文档图像,使校正后的图像在光学字符识别阶段的识别率有较大提高。
- 宋丽丽吴亚东孙波