张田
- 作品数:2 被引量:4H指数:1
- 供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金黑龙江省留学归国人员基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于音频的数字媒体内容分析及其可视化
- 2010年
- 为了对音视频内容进行更加有效地分析,将信息可视化方法引入数字媒体信息处理领域。设计并实现了集多媒体信号采集、大词表连续语音识别、文本检索和音频检索为一身的多媒体内容可视化分析平台,取得了较理想的效果,充实了信息可视化理论并对其具体应用进行了有益尝试。
- 张田李嵩高畅邱荣发李海峰
- 关键词:信息可视化语音识别文本检索音频检索
- 基于音乐认知原理的音乐旋律发现技术被引量:4
- 2010年
- 旋律是音乐主题思想的最重要表现手段,分析音乐的旋律、研究智能旋律分析处理方法是音乐信息检索领域的重要课题之一。本文根据脑神经科学及认知心理学关于人类对音乐感知特点的研究成果,引入听觉显著度(AS)的概念,提出了基于音乐认知理论的模拟人类认知过程的旋律发现技术。在前期处理阶段,针对音乐特性采用常数Q变换(CQT)建立音乐的频谱统计模型,采用贝叶斯理论计算每个半音子带数据分布的听觉显著度特征,利用时序神经网络检测各个时刻的听觉变化,得到旋律分量的候选。在后期处理阶段,我们提出了表达形式接近乐理与认知的旋律流(MelodyStream)的概念,以人对音乐和弦感知结果作为先验知识,进行旋律候选分量的规范化处理。在包含各种乐曲风格的实验音乐数据库上,验证了所提取结果同人类听感的接近程度,根据旋律流来捕捉传统旋律线获得了75%的准确率,主观听感打分对旋律流的接受度超过90%。
- 李海峰孙佳音张田马琳
- 关键词:音乐认知