西西河

主题:哪位搞音频或者语音的,请教一个基本概念 -- 黑猫夜行

共:💬46 🌺36
全看分页树展 · 主题 跟帖
家园 有一些播放器是可显示波形和频谱的

你看起来是个软件专家,所以对电路什么的有点晕。

所以你在改变数据以后,可以用播放器看看效果,当然那个比较粗糙。

另外WAV文件的数据结构我估计是有的,你看一些编程的书里面应该提及,或者是与WAV相关的函数什么的。

我离开技术已经很远了,从常识上说些想法供参考。

44.1K是取样速率,就是每一秒钟取44.1k个数据,每一个数据是16bit,左右两个声道数据量就加倍。由于动态范围的原因,可能还有一个常数来描述音量的基准值或峰值。另外也可能先把信号标准化,再取样,就是先变成峰值1V的信号。

你可以先在data chunk里把左右声道先分开,看哪些数据是哪个声道的,然后注意每一个点是16bit,有两个Bytes。

也不知道帮不帮得上忙,凑合看看吧。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河