主题：【原创】实例分析如何在产品中选择、评估和使用开源软件一 -- yueyu

共:💬17 🌺34 新:

【原创】实例分析如何在产品中选择、评估和使用开源软件二

要讨论如何选择codec，必然要先对audio codec做一番了解才行。以下就是小弟的一些山寨版理解，欢迎批评指导

和其他的数据压缩编码一样，音频的编码也分为有损和无损压缩两类。

无损压缩，基本上都是对音频取样数据之间的差值用Golomb－Rice code以及结合Linear Prediction Coefficents来进行

虽然近年来无损压缩也取得了不小的进展，很多压缩比都能达到一半左右了。不过在网络速度还不是足够快的情况下面，暂时还没办法

采用无损压缩进行语音信号的传递

对于有损压缩，感谢psychoacoustics model（声学心理模型？）的研究，告诉工程师，在声音里面，有一部分是人无法感知到的。

对于这部分声音，在进行压缩的时候可以放心地删除而不会让人觉得有什么损失。

点看全图

外链图片需谨慎，可能会被源头改

主流的压缩算法比如Mp3，Ogg Vorbis，AAC，WMA,ATRAC等都是基于psychoacoustics model来进行压缩的。我们可以看到，其

压缩比非常之高，通常能将数据压缩到原始数据的5％到20％而让人感觉不出显著的音质损失。

对于我自己的应用，其实我需要压缩的音频数据非常单一，仅仅是Speech而已。而对于Speech的压缩，其实有更多的办法以取得更高的

压缩比和解压缩之后的语音效果。

那么，究竟是什么方法能够取得更高的针对Speech的压缩效果呢？

点看全图

外链图片需谨慎，可能会被源头改

答案是CELP

最近工作紧，写的慢，大家见谅。我尽量持续写下去，因为很多东西我也还在做

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友