西西河

主题:【原创】实例分析如何在产品中选择、评估和使用开源软件一 -- yueyu

共:💬17 🌺34 新:
全看分页树展 · 主题 跟帖
家园 【原创】实例分析如何在产品中选择、评估和使用开源软件二

要讨论如何选择codec,必然要先对audio codec做一番了解才行。以下就是小弟的一些山寨版理解,欢迎批评指导

和其他的数据压缩编码一样,音频的编码也分为有损和无损压缩两类。

无损压缩,基本上都是对音频取样数据之间的差值用Golomb-Rice code以及结合Linear Prediction Coefficents来进行

虽然近年来无损压缩也取得了不小的进展,很多压缩比都能达到一半左右了。不过在网络速度还不是足够快的情况下面,暂时还没办法

采用无损压缩进行语音信号的传递

对于有损压缩,感谢psychoacoustics model(声学心理模型?)的研究,告诉工程师,在声音里面,有一部分是人无法感知到的。

对于这部分声音,在进行压缩的时候可以放心地删除而不会让人觉得有什么损失。

点看全图

外链图片需谨慎,可能会被源头改

主流的压缩算法比如Mp3,Ogg Vorbis,AAC,WMA,ATRAC等都是基于psychoacoustics model来进行压缩的。我们可以看到,其

压缩比非常之高,通常能将数据压缩到原始数据的5%到20%而让人感觉不出显著的音质损失。

对于我自己的应用,其实我需要压缩的音频数据非常单一,仅仅是Speech而已。而对于Speech的压缩,其实有更多的办法以取得更高的

压缩比和解压缩之后的语音效果。

那么,究竟是什么方法能够取得更高的针对Speech的压缩效果呢?

点看全图

外链图片需谨慎,可能会被源头改

答案是CELP

最近工作紧,写的慢,大家见谅。我尽量持续写下去,因为很多东西我也还在做

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河