西西河

主题:哪位搞音频或者语音的,请教一个基本概念 -- 黑猫夜行

共:💬46 🌺36
全看分页树展 · 主题 跟帖
家园 居然绕到采样频率上了,难怪楼主越看越糊涂

楼主的问题其实很简单:

wav文件里每个数据点里到底存的是什么?为什么加一点减一点听不出区别?

这单纯就是声音波形曲线如何离散量化的问题。44.1k的意思就是每1/44100秒做一次a/d。16bit就是每个a/d结果得到的数字是16位长,也就是说总共有2^16个也就是65536个离散量化级(也可能是2^15个,我忘了正负数如何处理的了,不过反正就是这意思)。

如果不做其他处理,那么这16位数据就是wav数据块里每个数据点里存的数。当然wav允许几种不同的存法,有PCM,alaw, ulaw等。这样文件里每个数据点里存的就是最初的16位原始数据再经过处理的结果(比如alaw,ulaw是原始数的log)。

至于为什么每个数据点加点减点听不出多大区别,可能有好几个原因。比如有的播放器自带normalizer,这样就把加的减的量等于过滤掉了。还有就是既然有那么多量化级,每次到底加多少减多少合适?人耳的敏感度不是线性的,有可能加的减的部分正好不敏感。还有溢出问题等等。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河