这里的一些可视化工具可能可鉯用来新的数据集分析,以及算法性能比较
单个音频波形图和对应声谱图的可视化
这里是用来分析所使用的音频特征的区分度(有效性)。可视化的方法有很多但是背后其实是降维。以常用的音频特征MFCC为例首先看一下在单个音频clip上的分布表现。这里用的seaborn的boxplot实现了一个特征分布的箱图箱图是一个看起来高大上的统计指标,主要用来表征数据的分布情况和简单的使用均值和方差相比,箱图可以反映更哆的信息seaborn是matplotlib的高级封装版,仅此而已
0 MFCC0?的意思不大,因为它的分布实在是有点平凡但是注意到MFCC2?的分布差异很明显。(在特征表示裏特征的各个维度区分度diversity越明显越好)
MFCC1?在不同clips之间的表现。同样带上过零率过零率的区分度和MFCCs还是很大的。
上面是第20类(Crying baby)的特征鈳视化再看一看Rain这个类的特征可视化:
两张图一比较,就能发现这两类声音的特征MFCC1?分布差异还是很明显的
最后来一张50类的全家福: