设计 任务书 文档 开题 答辩 说明书 格式 模板 外文 翻译 范文 资料 作品 文献 课程 实习 指导 调研 下载 网络教育 计算机 网站 网页 小程序 商城 购物 订餐 电影 安卓 Android Html Html5 SSM SSH Python 爬虫 大数据 管理系统 图书 校园网 考试 选题 网络安全 推荐系统 机械 模具 夹具 自动化 数控 车床 汽车 故障 诊断 电机 建模 机械手 去壳机 千斤顶 变速器 减速器 图纸 电气 变电站 电子 Stm32 单片机 物联网 监控 密码锁 Plc 组态 控制 智能 Matlab 土木 建筑 结构 框架 教学楼 住宅楼 造价 施工 办公楼 给水 排水 桥梁 刚构桥 水利 重力坝 水库 采矿 环境 化工 固废 工厂 视觉传达 室内设计 产品设计 电子商务 物流 盈利 案例 分析 评估 报告 营销 报销 会计
Logo 顶部广告
首页 | 机械毕业设计 | 电子电气毕业设计 | 计算机毕业设计 | 土木工程毕业设计 | 视觉传达毕业设计 | 理工论文 | 文科论文 | 毕设资料 | 帮助中心
今天是: |>>> 您现在的位置:首页>>>>文档详细内容
标题:

基于Python的声音数据处理分析 课程论文+源码


目录

1 原理介绍

1.1 基本思路

1.2 任务一

1.3 任务二、三

2 具体实现与结果分析

2.1 任务一

2.2 任务二、三

2.2.1 信息提取

2.2.2 匹配计算

3 问题与不足

4 使用说明与文件清单

5 成员分工

参考文献

1.1 基本思路

1.2 任务一

首先对音频数据进行预处理,先对音频数据进行降采样(44100Hz 11000Hz),然后对其进行

STFT 操作以得到其频谱特征,STFT 的具体参数参考了数据集来源的论文 [1]。然后对于得到的四个特征图,我们将其当作四个 channel 拼接为一个 tensor,作为训练用的数据。

特别的,并不是所有音频数据都是一样长的,绝大多数的音频长度都是 4s,对于长度不到 4s 的音频,我们直接在其末尾使用 0 进行延拓 (padding)。

由于我们得到的训练数据是一个 4 通道的频谱图,我们可以将其当作一个图像分类任务使用

CNN 来解决,本次实验中我们使用 resnet 来解决任务一。

1.3 任务二、三

任务二与任务三除了匹配部分没有本质的区别,我们采用的主要思路为先利用类别信息进行分组,然后再在组内进行匹配。对于匹配特征的提取,我们训练了两个网络来分别根据声音判断物体的运动方向和碰撞的位置。事实上,我们认为只根据声音数据,并不能准确恢复出物体的运动方向,

因为缺少其开始时的位置信息,因此我们打算使用碰撞位置来作为关键信息进行匹配。但是通过实验发现,许多匹配错误是最终碰撞的位置相同引起的,因此我们加入了并不完全准确的运动方向信息(平均误差在 15 度)来辅助位置信息进行匹配,从实验结果上看这样的特征组合对匹配成功率有着较为显著的提升。















| 关于我们 | 友情链接 | 毕业设计招聘 |

毕业66资料站 biye66.com ©2015-2026 版权所有 | 微信:15573586651 QQ:3903700237

本站毕业设计和毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!