西西河

主题:【原创】科学的欣赏流行乐 -- 比的原理

共:💬309 🌺1010 🌵31
分页树展主题 · 全看首页 上页
/ 21
下页 末页
    • 家园 准备上课的时候借用。

      本学期上工程数学,以前都是用收音机调谐作为傅里叶变换的例子,楼主这篇浅显易懂,而且更活泼有趣,准备上课的时候借用这个贴子先科普一下。

      多谢楼主好文。

      • 家园 最好小心一点

        这里基频的定义是不严格的,至少和物理上的定义是有区别的,自己看看无所谓,拿出去教课可能需要更严谨的定义。

        • 家园 应该问题不大

          2维的声带最多是可能会有两个基频,但如果各向异性比较弱的话,差别应该不大。也可能是声带么,顾名思义长方向的基频要比短边方向上的基频低很多,短边方向的基频可能都超过3000了,可以忽略不计。在声音这么低的频率下,连续介质模型是足够的,所以楼主说的没什么问题。

          • 家园 高估二维了

            从我观察到的结果来看,人声绝大部分情况下都是一个基频。

            事实上,别说二维,就是三维的物体,也没几个是多重基频的。

            基频的定义里也没提到这一点。再说,基频的定义是

            当发声体由于震动而发出声音时,声音一般可以分解为许多单纯的正弦波,也就是说所有的自然声音基本都是由许多频率不同的正弦波组成的,其中频率最低的正弦波即为基音

            也就是说,永远都是取最低那个频率,逻辑上讲基频也只能有一个。

            • 家园 这个么

              虽然可以取最低那个频率为基频,但其他方向上的"基频"也同样有跟其配套的泛音。我想可能对人来说主要是声带是个长条形,可以看成准一维,短边的基频已经很高,人耳都听不到了。鼓什么的二维膜是各向同性的,所以基频简并也听不出两个基频,不知有没有模类的乐器是4:3比例的。

              • 家园 可以考察一些三维物体

                这个问题我还没仔细想过原理。不过,我们可以考察一些三维物体,比如音叉,形状够复杂吧。我们都知道音叉是有固定基频的。怎么敲都是一个音高。

                再比如玻璃杯,编钟,甚至一个长方体铁块。根据常识我们知道他们都是有固定基频的。

                这跟空气柱共鸣同样。一个试管样的空气柱固然可以共鸣,一个烧瓶状的共鸣腔也可以共鸣。只不过空气柱直接算长度就知道共鸣频率。烧瓶需要算形状体积什么的。

                所以对什么形状的物体来说,都应该有单一基频。只不过为了简化一般我们只分析一维。

        • 家园 哪里不严格?

          google基频,wiki只有一个定义,甚至都不是多义词。

          基本頻率(或簡稱基頻,fundamental frequency),当发声体由于震动而发出声音时,声音一般可以分解为许多单纯的正弦波,也就是说所有的自然声音基本都是由许多频率不同的正弦波组成的,其中频率最低的正弦波即为基音,而其他频率较高的正弦波则为泛音。

          音乐演奏或歌唱中,基音是区别音高的主要元素,决定旋律。而泛音则决定乐器或人声的音色。

          http://zh.wikipedia.org/wiki/%E5%9F%BA%E6%9C%AC%E9%A0%BB%E7%8E%87

          英文wiki:

          The fundamental frequency, often referred to simply as the fundamental, is defined as the lowest frequency of a periodic waveform. In terms of a superposition of sinusoids (e.g. Fourier series), the fundamental frequency is the lowest frequency sinusoidal in the sum. In some contexts, the fundamental is usually abbreviated as f0 (or FF), indicating the lowest frequency counting from zero.[1][2][3] In other contexts, it is more common to abbreviate it as f1, the first harmonic.[4][5][6][7][8] (The second harmonic is then f2 = 2f1, etc. In this context, the zeroth harmonic would be 0 Hz.)

          http://en.wikipedia.org/wiki/Fundamental_frequency

          我甚至都找不到物理上的基频定义,要不你找一段物理的基频定义我看看?

      • 家园 谢谢支持!

        信号处理的老师么?

        我也觉得用声音来讲傅里叶变换直观有力多了,也能让学生切实的理解傅里叶变换的巨大实用性。

        • 家园 不是

          学生是通讯专业的,老师是物理专业的。

          主要是老兄讲的好,原理清晰,题材又很活泼,很花了些功夫。

    • 家园 第七章:头腔共鸣

      这一章,将讲到声乐系统里最最重要的几个概念,虽然这几个概念基本上是等价的,他们是

      头腔共鸣,歌手共振峰,声压,高位置,芯,金属芯,面罩共鸣。

      上一章的视频里已经演示了歌手共振峰,这章展开。

      [FLASH]http://player.youku.com/player.php/sid/XNjcyODI3MzA0/v.swf[/FLASH]

      http://v.youku.com/v_show/id_XNjcyODI3MzA0.html

      声压一词本来是物理名词,等价于“音量”。然而就像很多其他词一样,在声乐界,声压有着完全不同的定义。

      在声乐界(或者说乐评界),声压的定义是:歌手的声音能否压住伴奏(或者说穿透伴奏)。

      那究竟什么样的声音才算声压大呢?实践上来说其实很容易鉴定,人声是不是被伴奏压住,很容易感知出来。尤其是现在流行届废渣满地走,经常出现歌声被伴奏淹没的局面,这实在是很容易发现的。视频开始的一段很好的解释了为何声压很重要:live演唱,声压低的话,观众真的会听不见歌手唱什么。

      究竟是什么造成了这个现象?

      声音的掩蔽效应

      首先,同频率的两个声音,振幅大的那个会掩盖振幅小的。听觉上来说,完全感受不到低振幅的声音。

      其次,频率接近的声音,振幅大的会掩盖振幅小的。比如一个500hz的声音有60分贝,另一个550hz的声音有50分贝,那550hz的这个声音几乎会被掩盖,听觉上基本听不到(每提高10分贝声能提高10倍,振幅提高3倍左右)。

      所以在live大音量伴奏的情况下,人声被掩盖是很可能发生的事。

      那究竟什么样的声音才算声压大呢?

      音量大的歌手肯定声压大

      这是废话。。。

      高频泛音丰富的声音声压大

      这个问题要从两方面来解读:

      1. 歌手共振峰

      声乐理论界极为重要的概念,我们看图:

      点看全图

      外链图片需谨慎,可能会被源头改

      上图为伴奏/语言/演唱的平均频率分布图。(频谱图)

      实线为管弦乐伴奏,可以看到,管弦乐伴奏的能量主要集中在低频,在500hz左右达到峰值。随着频率提升迅速降低。(多年看我图的同学,应该有很直观的感受:各种图里,500以下的低频总是有很多线,那都是伴奏)

      第二条线为语言线,可以看到和管弦乐伴奏基本相似。所以用正常的说话方式去唱歌,必然被伴奏掩盖。

      第三条线为伴奏+演唱,很明显,演唱在高频(2500hz左右)大幅超越了伴奏线。

      这个高频的峰被称为歌手共振峰(singer’s formant,或vocal ring),是歌手声音能否穿透伴奏的决定性因素。声乐里讲声音的“芯”就是指这个。

      实践上来说,男歌手的歌手共振峰一般出现在2500-2800,女歌手的歌手共振峰出现在3000-3200。关于共振峰的界定,学术界存在很多不同的说法,总的来说,3000hz左右的都算是。

      事实上,如果观察歌手的频谱图,会发现歌手的最强泛音一般不是这个“歌手共振峰”,而是一个低频的峰,就是图中500的那个(当然根据元音不同共振峰也不同),高频的共振峰一般要低一点。所以有部分学者认为应该改名为歌手高频共振峰和低频共振峰。

      不过显然高频共振峰起到的作用更大;而且,高频共振峰是演唱独有的(图上很明显,说话是没有这个高频共振峰的)。

      歌手共振峰是怎么产生的?

      最早解读歌手共振峰的学者认为歌手共振峰来自于喉腔。目前还没看到有其他的解读,似乎大家都认可喉腔是歌手共振峰的来源了。(虽然大家对什么情况下产生歌手共振峰还有争议)

      可能大家对喉腔究竟是啥有点困惑,再贴一下图:

      点看全图

      外链图片需谨慎,可能会被源头改

      其实喉腔很小的。

      小知识:喉腔咽腔的区别?喉腔是呼吸管道独有的,咽腔是呼吸和消化管道共用的。也就是说,咽腔连着喉腔和食道,上面来空气则送到喉腔去,来食物则送到食道里去。

      这很好的解释了为何歌手共振峰几乎稳定的出现在3000左右,不随喉位变化而变化,也不随演唱内容而变化。因为喉腔的大小大家都差不多阿!这也很好的解释了为何男女会有细微不同:因为男歌手喉腔更大一些(有喉结阿),自然共鸣频率低一些。

      西方学者认为:产生强大歌手共振峰的必要条件是降低喉位,扩大咽腔。当咽腔扩大的一定程度的时候,喉腔将不作为声道(vocal tract)共鸣的一部分。而是单独作为一个共鸣腔起作用(http://hyperphysics.phy-astr.gsu.edu/hbase/music/singfor.html)。这个理论被我朝人民无情的打脸:因为我朝歌手高喉位唱歌(唱戏)的太多了!我朝学者认为,高低喉位都能产生歌手共振峰。(http://yysx.cnjournals.cn/ch/reader/create_pdf.aspx?file_no=19870403&flag=1&journal_id=yysx&year_id=1987)

      众多概念的关系

      只有一个问题无法解释:那就是,我们感知上觉得,高频泛音是从头腔上来的阿!我们谈了这么多年的头腔共鸣,难道搞错了,丫是从喉腔出来的?完全不科学阿!

      有部分人是这样解释的:所谓的面罩共鸣,只是一个假象,实情是鼻骨振动引发的错觉。顺便科普一下面罩共鸣:现代美声的核心理念,以鼻腔为核心的共鸣,把共鸣点做在鼻腔靠前接近面罩的位置上。

      共鸣点是什么?实质上只是演唱者的一个感觉。当激发了头腔共鸣的时候,演唱者会有一个强烈的感觉,鼻腔里有一个点在发声。(这就是为什么古人认为头腔可以发声,有了头声一说)共鸣点更高的话会感觉额窦(眉心)在发声,民族唱法就是共鸣点在额窦。

      当然了,现代学者认为这只是一个错觉,或者说,鼻腔和额窦确实共鸣了,但是起到的作用并不大。

      有歌手共振峰的歌声,听感上会有“焦点”。也可以叫“芯”。有时候音色像金属,那就是“金属芯”。

      简单的说,这些错综复杂的概念,本质上并没有太大差别。

      2. 人耳的听觉敏感性

      人耳的听觉范围是20hz – 20000hz,但并不是对所有频率的声音都一视同仁的。看图:

      点看全图

      外链图片需谨慎,可能会被源头改

      上图源自wiki,我加了3000坐标,并且用黑色实线强化了一下。

      这图什么意思?我们看最下面一条红线,这条线的意思是:这个线上的声音可以让人耳感知到0分贝。(0分贝不是没有声音!0分贝的定义是刚刚能让人耳听到的声音)所以,3000hz的声音,只需要-7db左右即可让人感知到,而1000hz的声音,需要2db左右才可以让人感知到。依此类推,100hz的声音需要25db左右才可以让人感知到。(每差10db,声能相差10倍,振幅相差3倍左右)

      依此类推,上面的红线对应的是20db, 40db等等。

      很显然,人耳对3000hz左右的声音最敏感!基本上2000hz – 4000hz的声音都是人耳敏感区。

      所以,高频泛音可以更有效的被人耳感知到。高频泛音丰富的歌手,声压更大。

      为什么会这样?跟神经系统肯定有关系了。另一个不能忽视的因素就是:人耳本身就是一个共鸣腔,这个共鸣腔对3000hz左右的声音强化最大。

      视频解析

      我尽量找了一些对比度大的。

      阿妹 VS 哈林 VS 张雨生

      点看全图

      外链图片需谨慎,可能会被源头改

      哈林的声压算不错,图上看人声线明显,高频泛音不错。听感上感知度很好。

      点看全图

      外链图片需谨慎,可能会被源头改

      阿妹的声压就太小了。听感上声音很暗,混在在伴奏里难听清。甚至听起来阿妹似乎比哈林低了好几key(其实俩人同key)。图上看就是阿妹的声音线基本被伴奏淹没,高频泛音稀缺。阿妹素来是共鸣差的,唱到这个水平属于预料之中。

      点看全图

      外链图片需谨慎,可能会被源头改

      张雨生的声压那基本上秒杀前面二人了。人声线明显,高频泛音丰富。张雨生算是高喉位发声也能获得歌手共振峰的典型。

      郁钧剑 VS 阎维文

      点看全图

      外链图片需谨慎,可能会被源头改

      经典大气的小白杨,居然被郁钧剑唱得这么有气无力。。。尤其是经典的亮嗓句“来来来”,差不多被伴奏淹没了阿!图上看很明显,3000段有微小泛音,没法形成有效歌手共振峰。

      点看全图

      外链图片需谨慎,可能会被源头改

      阎维文这个真的是秒杀的节奏。。。声音洪亮有力,声压巨大,这才是我们熟悉的小白杨嘛!图上看形成了标准的3000段歌手共振峰,这就是传说中的“芯”。

      点看全图

      外链图片需谨慎,可能会被源头改

      点看全图

      外链图片需谨慎,可能会被源头改

      这句更明显,阎维文这又是秒杀的节奏阿。

      多说两句:

      阎维文的频谱,非常像前面那张伴奏人声图了(那张图是歌剧演唱的平均图)。就是巨大低频共鸣+3000段高频共鸣。

      事实上,在男歌手领域,美声就是人类标杆。流行男歌手水平比较高的会自然而然的向美声的发声状态靠拢,比如阎维文,韩磊等。这不难理解,因为男声到一定境界,肯定要追求声音洪亮,而男美声是人类洪亮的极限,所以自然而然的就会去靠拢。

      “洪”即为大音量,大胸腔共鸣,图上的巨大低频泛音就是了。“亮”即为声音有“芯”,有高位置焦点,就是图上的高频泛音了。

      理论上讲,这样的声音是最理想的:巨大的低频泛音包裹着“芯”高频泛音,整体饱满有力。其实像后面宝哥那句暴力高音,虽然声压大到爆表,其实美感缺失。只有高频泛音但缺失低频泛音衬托的声音,就容易太尖,不浑厚。

      姚贝娜 vs 小胖

      点看全图

      外链图片需谨慎,可能会被源头改

      不用看图都知道,姚贝娜声压完爆小胖。

      点看全图

      外链图片需谨慎,可能会被源头改

      图上看也很明显,姚贝娜的声音线碾压小胖。其实分析他俩不太适合分析什么高频泛音。这就是单纯的音量上的碾压。

      点看全图

      外链图片需谨慎,可能会被源头改

      点看全图

      外链图片需谨慎,可能会被源头改

      我还真没找到小胖独唱的长音,勉强找一个吧。对比的是姚结尾完美的inside。

      小胖属于典型的声音没有“芯”。图上看就是没有明显的高频泛音。像他这种基本没共鸣的声音,在我看来是很难算作歌手的。

      林志炫 VS 张雨生

      说实话,这两者相比较,比小胖和姚比较还离谱:哪有用假音跟真音比高音的!大仙的确是达成了高音届史上最伟大的成就:用假音和真音比高音然后华丽丽的输掉!

      点看全图

      外链图片需谨慎,可能会被源头改

      点看全图

      外链图片需谨慎,可能会被源头改

      这两人的线数量上看差不多,但是宝哥能碾压大仙,靠得就是爆大的高频泛音了。

      比的原理:第八章:真声,假声,头声

      通宝推:二手玫瑰,西伊,北纬42度,mezhan,西门飘飘,为中华之崛起,rentg,牛栏山二锅头,陈王奋起,史文恭,

      本帖一共被 1 帖 引用 (帖内工具实现)
      • 家园 同一个人唱不同歌时音频特征是不是一样的?

        同一个人唱不同的歌,别人还是能听出来是同一个人,不知道软件的分析也能作出同样的判断?你作的图谱中,对同一个歌手唱不同的歌,伴奏不同的情况下,共同特征是不是明显?换句话说,如果你看了同一个人10个图谱后,给两个图谱,一个是他一个不是,能不能很容易看出来哪个是?

        或者说,人在不同噪音背景下都能分辨某个特定人讲话,靠的是什么?

分页树展主题 · 全看首页 上页
/ 21
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河