崔静静
- 作品数:12 被引量:22H指数:3
- 供职机构:西南交通大学信息科学与技术学院更多>>
- 发文基金:中央高校基本科研业务费专项资金教育部科学技术研究重点项目国家级大学生创新创业训练计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 智能藏语盲文学习机的设计与实现被引量:1
- 2011年
- 基于西藏地区盲人学习的实际需要,设计了一种新型的藏语盲文学习机。系统采用SPCE3200作为主控芯片,通过外接的盲文键盘实现模式选择与点字训练,根据一定的算法实现存储和调用外扩Flash(SD卡)中相应的的语音资源,利用SPCE3200自带的解码器和两路16位快速模数转换器(DAC),完成MP3和WAV格式文件的播放,通过SPY0030功放实现声音的双通道立体声输出。实际测试结果表明,该系统响应速度快,运行稳定,具有点位训练,标准语音的播放以及录音并存储等功能。该系统可以帮助藏族盲人朋友独立地学习藏语盲文,也可以用于藏语的盲文教学中,使藏语盲文的学习更加方便、快捷。
- 武强崔静静边巴旺堆次仁朗杰
- 关键词:盲文SPCE3200键盘
- 基于条件随机场的敏感话题检测模型研究被引量:7
- 2014年
- 敏感话题通常包含态度倾向性,且具有一定的先验知识,如何有效利用这些先验知识来判断网络文本的敏感性是敏感话题检测的研究难点和热点。在充分利用条件随机场强大知识拟合能力的基础上,提出一种基于条件随机场的敏感话题检测模型。抽取特征词项,并结合敏感词汇库,将待检测文档和敏感话题类别分别表示为条件随机场中的观察序列和状态序列,再利用敏感话题类别中的先验知识来构造特征函数,从而使观察序列和状态序列建立联系。将待测文档中的特征项根据概率标注为敏感话题类别中的词项,在此过程中采用Viterbi算法对观察序列的可信度进行估计,并依据估计所得的概率值对待测文档中的特征项进行敏感性标注。实例验证结果表明,该算法能够得到较好的准确率、召回率和F度量值。
- 翟东海崔静静聂洪玉于磊杜佳
- 关键词:条件随机场特征函数VITERBI算法
- 基于相关性反馈的自适应热点话题追踪模型被引量:1
- 2014年
- 针对在热点话题追踪过程中容易发生话题漂移的问题,提出了基于相关性反馈的自适应热点话题追踪模型。为准确把握话题的动态演变过程,首先,在词频-逆向文档频率(term frequency—inverse document frequency,TF-IDF)的基础上引入了相关度因子。其次,构造了报道与话题的相关度计算公式和新特征词能否反馈加入到话题词汇库的判别函数。同时,利用了话题词汇库本身的特性,构造了自适应更新阈值和自适应相关阈值的动态计算方法。最后,根据各个特征词对该话题贡献度的大小,对更新后的词汇库中的各特征词动态赋予新权重。实验结果显示,和其它3类追踪器相比,该追踪器模型的漏报率平均降低0.018、误报率平均降低0.063,这表明,该追踪模型更适合于解决话题漂移问题。
- 翟东海鱼江聂洪玉崔静静杜佳
- 关键词:自适应阈值
- 基于互信息的热点词发现和突发性话题检测研究被引量:2
- 2013年
- 针对舆情监测中现存的热点词提取方法精度不高、速度不快的问题,文章采用互信息作为热点词突发性的度量手段,并使用类间离散度作为调节因子来构建热点词的突发性度量公式。在此基础上,构造了改进后的动态突发性向量空间模型,并用于网络中突发性热点话题的发现与追踪。实例验证结果表明,文章提出的改进方法能够获得很好的准确度P、召回率R和F度量。
- 翟东海王佳君聂洪玉崔静静
- 关键词:互信息
- 基于改进的χ~2检验的热点词突发性度量研究被引量:1
- 2013年
- 采用原始χ2检验公式进行突发性度量时存在低频词偏袒问题,论文提出了结合TF的改进的χ2检验方法能有效克服该问题。该方法将词频累加和作为文档统计篇数的影响因子β引入原始χ2检验公式从而解决了低频词偏袒问题,提高了度量热点词突发性的精确度。动态突发性热点词库依据改进后的χ2检验公式得到的突发性度量值来建立,并将该词库运用在动态突发性向量空间模型中来发现与追踪网络突发性热点话题。实例验证表明,利用该文的方法进行话题发现与追踪,可以获得有更高的准确率、召回率以及F度量。
- 翟东海聂洪玉崔静静于磊杜佳王佳君
- 关键词:词频
- 基于语义相似度的话题关联检测方法被引量:6
- 2015年
- 为有效识别任意两篇报道的相似性,提出了一种基于语义相似度的话题关联检测算法.该算法首先通过计算特征词之间的相对熵作为两篇报道中特征词之间的语义相似度;其次,通过计算平均语义相似度获得特征词和报道之间的关联度;最后,结合特征词在语料库中的TF-IF(term frequency-inverse document frequency)权重计算两篇报道之间的关联度,实现报道之间的关联度检测.本文提出的方法与现有的向量空间模型方法和仅依赖于平均点互信息的方法进行了比较,并通过TDT4中文语料进行测评,结果表明,基于语义相似度的关联检测方法能够更好地利用文本的语境信息,提高了现有检测系统的性能,其最小DET(detection error tradeoff)代价降低了3%.
- 翟东海崔静静聂洪玉杜佳
- 关键词:语义相似度相对熵
- 基于自适应簇中心选择的文本聚类算法研究被引量:1
- 2013年
- 为解决传统的K-means算法需要人工确定K值和随机选取初始簇中心容易陷入局部最优的问题,提出自适应簇中心选择算法。首先将任意选取的一篇文档和与其距离最远的文档作为初始簇中心聚类得到2个大类并重新计算簇中心,然后,找出与新的簇中心距离大于设定阈值的文档并依据文档距离判断是否需要增加新的类别,迭代上述过程确定聚类簇中心及类别数。实例验证结果表明,提出的算法与改进的K-means算法相比,在聚类结果的质量和算法收敛的速度上都有明显的改善。
- 翟东海聂洪玉崔静静杜佳
- 关键词:海量数据挖掘K-MEANS算法
- 基于U形有向无环支持向量机的多类文本分类研究
- 2013年
- 针对原始的有向无环支持向量机(Directed Acyclic Graph Support Vector Machine,DAGSVM)多类文本分类算法结构图中存在误差累积以及路径冗余的问题,提出一种改进的有向无环图支持向量机多类文本分类算法。将易于分离的那些类两两组成两类分类器放置在结构图的上层,有效克服了误差累积问题,通过将原始的分类结构图改造为U形图以及引入集合运算进行类别判定,有效剪除冗余路径并降低时间复杂度。实例表明,该算法能有效提高类别判定的准确率并降低时间复杂度。
- 翟东海杜佳聂洪玉崔静静
- 基于CRFs模型的敏感话题识别研究被引量:4
- 2014年
- 条件随机场(CRFs)是一种判别式概率无向图学习模型,将其引入敏感话题识别中,提出了基于CRFs模型的敏感话题识别方法。将随机挑选出的一篇待检测文本s和剩余的待检测文本分别作为CRFs模型的观察序列和状态序列来计算文本s和其余待检测文本间的相关性概率值;然后将相关性最高的那篇文本和文本s合并表征一个类别;同时,将相关性最低的那篇文本作为另一个类别,将这两个类别作为CRFs模型新的状态序列,剩余的待检测文本作为新的观察序列进行迭代,据此实现敏感话题的识别。在数据集上进行的实验中,该方法的耗费函数的值为0.01943,宏平均F度量的值为0.8235,都取得了很好的效果。
- 翟东海聂洪玉崔静静杜佳
- 关键词:条件随机场
- 基于双粒度模型的中文情感特征词提取研究
- 2014年
- 为了能够快速准确地提取出海量文本信息中的情感特征词,提出从情感词语集中通过人工筛选得到种子词并对其情感强度赋值,同时,以这些种子词为基准计算出情感词语集中其他词语的情感强度值,从而得到各特征词在词语级及句子级的倾向性贡献度值。然后,将特征词在词语级、句子级这2种不同粒度情况下计算出的情感倾向性贡献度值有机结合起来,构造出基于双粒度模型的中文情感特征词提取模型。该提取方法考虑了特征词在词语级和句子级2个方面的情感倾向,使最终提取出的情感词的准确率得到了提高。实验表明,只要有一个全面的情感词典系统和一组准确恰当的种子词,提出的方法可以获得良好的准确率和召回率。
- 翟东海杜佳崔静静聂洪玉
- 关键词:情感分析