西西河

主题:314-Laurance Doyle:怎样实现跨物种交流 -- 万年看客

共:💬1 🌺7
分页树展主题 · 全看首页 上页
/ 1
下页 末页
  • 家园 314-Laurance Doyle:怎样实现跨物种交流

    https://www.youtube.com/watch?v=l-visVMXc6s&t=588s

    ……我是一名搜寻地外文明的SETI专家,我的背景是天体物理学以及信息论。今天我们要讨论怎样利用信息论这一数学工具来设计一款智能过滤器,用于寻找外星智能生命。这场讲座的基本理念如下:如果我们将南极比作火星,并且通过研究南极来推演火星上的可能的生命形态,那么也可以将座头鲸的叫声比作外星生命发来的信号。今天的主题就是地外文明搜索应当借鉴人与动物的交流,尤其是人与海豚和座头鲸的交流。

    SETI研究所的前任主席Frank Drake博士在60年前想出一个公式,用来组织人们思考外星智能生命的方式。这个公式是一系列系数的相乘算式。首先要有一颗合适的恒星/R*,恒星附近的合适区域要有行星/fp,行星上要有生态系统得以存在的先决条件/ne——根据我们目前的理解就是要有液态水,有了条件之后要发生生物学反应,然后要出现生物物种/fl,其中某些物种必须足够复杂,以至于具备复杂的交流系统/fi——这一点是我们今天讲座的基础,最后这个物种还得掌握跨星际交流的技术/fc,而且他们的文明还得维持得足够久/L——我们并不清楚文明存续的一般时限有多久,比方说埃及就仅仅存在了3000年左右。正是因为有了这个公式,天文物理学家才会跑到阿拉斯加为座头鲸录音。

    画面上是M96号螺旋星系的照片,4100万年前这个星系发生了超新星爆炸。这样的爆炸能创造除了氢与氦之外的各种元素——氢与氦是大爆炸的产物,其他元素都要通过超新星爆炸才能产生。超新星就好比宇宙里的蒲公英,到处播种。全靠超新星爆炸创造的各种元素才能构成树木、人类与座头鲸,更不用说承载这些生命的行星了。在确定fp方面,近几年我们取得了很大的成就。在过去十五年间,随着开普勒望远镜的运作,我们已经发现了4000多颗行星,其中很多行星的尺寸都和地球差不多。我曾经是开普勒科学团队的成员,我的任务是确定行星能否在双星周围形成。银河系当中有一半恒星存在于双星系统之内,如果我们发现双星周围不仅能够存在行星,而且行星还能长期停留在宜居区之内,那就太了不起了。我很幸运地发现了画面上这个系统:一颗较小的红巨星和一颗较大的恒星组成双星系统,编号Kepler 16b的行星环绕它们运行。在《星球大战》当中,天行者卢克生在天上有两颗太阳的塔图因星球,所以我想把这个系统也称作塔图因。NASA的工作人员打电话通知了乔治.卢卡斯,想知道我们能不能把这个地外行星称作塔图因,以及他能不能来我们这里参加新闻发布会。卢卡斯本人倒是没来,但是他派来了工业光魔公司的主管John Knoll。这场新闻发布会将科学发现变成了世界级的新闻故事:“塔图因被发现,科幻小说变成科学事实。”这条新闻足足火热了一个礼拜。画面上是Kepler 16b的模拟影片——顺便一提,这颗行星确实处在双星系统的宜居区。双星系统的宜居区也会变动,因此Kepler 16b的轨道会从双星之间运行到双星之外。这样的双星系统名叫食双星,因为它们会相互遮挡。我们之所以能够发现Kepler 16b,因为它同时运行到了两颗恒星的前方。我们现在知道特定的双星系统周围可以存在行星,而且几乎一半此类行星都位于宜居区里——双星系统当中或许存在某种有利于行星存在于宜居区的机制,因为双星系统周围的行星位于宜居区的概率大约是普遍平均值的四倍。

    以上是我在投入目前工作之前的职业背景。现在我的研究方向是来自地球海洋的智能信号——严格来说这也算是地外信号,或者说陆地以外的信号。我们可以通过地球上的上百万种动植物交流系统先来练习一下跨物种交流的能力。我们可以通过信息论研发一般的算法,从而找出一套寻找智能生命的机制,以此确定某一段信号是否来自智能生命。SETI一直在询问地球以外是否存在无线信号发送器。我们在地球上常用短波无线信号,频率在一赫兹左右。打开收音机转一圈旋钮就能换台。自然界无法产生这样的无线信号。已知自然产生的最窄频无线信号是气体巨行星发出的脉泽信号。如果用这种信号来制作广播,那么需要将旋钮旋转300圈才能换台。换句话说,短波无线信号是技术能力的体现。因此SETI一直在寻找更窄的载波,但是他们并没有检查电波传递的信息。要怎样通过信息来确定发送者是否有智能?我希望在讲座结束时我能说服大家相信,我们已经初步掌握了一套方法来量化一段信息本身的智能程度。寻找地外技术的进程已经开始了很久,可是寻找地外智能的进程才刚刚开始,而这套判定智能的规则可以帮助我们扩大搜寻范围。通过研究地球上各种不同的沟通系统,我们可以设法用数学来体现普遍化智能的本质。目前我们只会寻找像人类一样的智能。在SETI的会议上人们都在讨论要不要向太空发送圆周率或者是黄金分割比例或者其他数学常数。但是一旦你面对面地研究过座头鲸之后,就会发现它们虽然很聪明,却并不是人类。所以我们需要打开关于智能信号的思路,然后才有可能够认出此类信号。

    为了确定我们不会将外星智能生命的信号与天文物理现象相混淆,我们首先研究了脉冲星。脉冲星是规律脉动的超新星残骸。当初我们刚刚发现脉冲星的信号时一度将其称作“小绿人信号”,因为这些信号如此有序,似乎体现了技术能力,听起来简直像是莫尔斯码或者拖拉机引擎。说句实在话,这像是智能信息发出的技术信号吗?接下来我再展示一下我们应用的一部分智能过滤机制。只要将这套机制应用在脉冲星信号上面,就会发现很容易区分开天文物理现象与真正的外星智能生命。

    作为对比,再来见识一下我们研究的若干物种发出的信号。例如棉花会释放化学信号;虎鲸、座头鲸、瓶鼻海豚都会发出声音信号;黑猩猩会利用表情、手势以及声音;大象会使用呼噜呼噜的叫声——换句话说,所有动物植物都会沟通。如果我们不在它们身上练习一下就太可惜了。先来看看蜜蜂。蜜蜂一开始是护士——所有的蜜蜂都是雌性——然后它们成了建筑工人,最后成了寻找花蜜的导航者。它们用扭扭舞来指示蜜源方向。蜜蜂的脖子上有肌肉可以在黑暗的蜂巢里指示垂直方向,在扭扭舞当中垂直方向指得是太阳的方向,扭扭舞的角度是蜜源相对于太阳的角度,扭动的次数指的是蜜源与蜂巢之间的距离——换句话说蜜蜂用的是极坐标——扭动一圈的时间则指代外面的风速。这样一来蜂巢里的蜜蜂就知道了应当怎样前往蜜源。年轻的蜜蜂还不熟悉扭扭舞,必须要看好几次才能理解;老一点的蜜蜂只要看一眼就直接飞到蜜源去了,可见这个行为可以习得。有趣之处在于扭扭舞显然是象征性的,花蜜并不在蜂巢里,换句话说蜜蜂通过扭扭舞讨论了并不当面存在的东西。有人不确定蜜蜂有没有象征性语言,我想这个问题的答案现在已经很确定了。画面左下角是正在迁徙的抱团蜜蜂,在这里它们跳得是DVAV舞——DVAV是“背部-侧腹部-腹部振动”的缩写——这是蜜蜂的一种方言,用来讨论哪个探子发现了最好的筑巢地点。康奈尔一位教授称之为蜜蜂民主,这种历经几百万年的民主远比我们人类的民主制度更古老。

    总体来说,研究动物植物的人们总会发现他们的研究对象比他们想象的更聪明。动植物比我们想象的更愚蠢的情况从来都没有过。画面上这篇我写的论文利用信息理论分析了棉花与黄蜂之间的沟通系统。如果我们能运用物种之间乃至生物界之间——例如动物和植物之间——的信息传递机制,那么一旦我们接收到外星信号就可以应用起来。总之,棉花可以将交通管控信号单向发送给黄蜂,引导后者落在特定植株上。黄蜂表现的不错,足有73%的成功率能够落在正确的棉花上——棉花面对两种掠食者,一种是蠕虫,另一种是毛毛虫,黄蜂只吃毛毛虫,因此所谓正确的棉花就是招了毛毛虫的棉花。这里需要说明一下73%这个数据的来历:研究人员在棉花地里进行了气相色谱法分析,然后除去这块棉花田里所有以棉花为食的掠食者,摘掉棉花植株上所有被啃过的叶子,以免黄蜂闻到掠食者本身的气味,让空气里只剩下棉花释放的化学指示剂,用来指示喜欢吃毛毛虫、不喜欢吃蠕虫的黄蜂应该落在哪朵棉花上。在这样的情况下,73%的黄蜂会降落在招过毛毛虫的棉花上。73%这个数字意味着棉花的空中交通管控信号在进化层面上比较年轻,因为效率还有很大提升空间。此外,棉花释放了2.4比特的信息,意味着黄蜂有5.5个选择,这就是棉花的词汇表。我在论文里推测,如果棉花只需要面对两种掠食者,为什么需要五个词的词汇表?由此可知棉花实际面对的掠食者种类肯定多于两种。宾夕法尼亚大学的植物学家问我:“你怎么知道还有更多类种的掠食者?我说:“是棉花告诉我的。”从此之后植物学的研究人员开始对信息论产生了兴趣,因为信息论能让你拥有平时没有的见解,哪怕是在植物与动物之间。*

    *【Quantification of Information in a One-Way Plant-to-Animal Communication System by Laurance R. Doyle】

    我们的研究侧重于海洋哺乳动物,因为它们的大部分沟通用的都是声音,因此我们可以录音研究。而且它们还是社会化群居动物,社会结构非常复杂。它们还非常聪明,具备文化传播的特质。所以我们着重研究了瓶鼻海豚与座头鲸,画面上是瓶鼻海豚的词汇表,或者说瓶鼻海豚的常见叫声的音调升降曲线……有实验表明瓶鼻海豚能利用音调升降曲线来分类不同的信号,因此升降曲线对于它们很重要,就好比我们人类说同一个词的升降调不同也意味着不同的情绪含义。对于瓶鼻海豚来说,信号的持续长度并不能定义其意义,只有升降调曲线才能决定。这就像瓶鼻海豚一样。

    现在我们先来看看我们使用的第一项智能过滤器,也就是齐普夫词频分布定律。当初齐普夫让自己的学生们数出《尤里西斯》当中有多少个e,多少个r,多少个o,等等,最后一直数到q,然后将数据制成图表——顺便说一句,空格在英语当中大约占据15%的篇幅——发现10%的字母是e,8.5%是t,5.7%是a,等等,直到最后q的占比是0.1%。将所有这些比率的数值按从高到低的顺序画在坐标系里,可以得到一条45度的斜线,或者说斜率为-1的线段,e在最高点,q在最底点。这意味着一本英语书籍当中字母的分布会形成斜率为-1的斜线。然后他又用同样的方法分析了中文汉字,斜率也是-1;他又研究了俄语音素,结果还是-1;日语录音同样遵循齐普夫词频分布定律。几乎所有人类语言都遵循齐普夫定律。还有很多其他编码也都可以用齐普夫定律来分析,比方说莫尔斯码。如果只看点与划的分布频率,莫尔斯码看似不符合齐普夫定律。但是如果将点点、划划、点划、划点各自分离出来再分析,距离齐普夫定律就比较贴近了。如果你将点点点、划划划等组合都作为个体信号单位,那么莫尔斯码同样遵循齐普夫定律。顺便说一句,我们也用齐普夫定律分析了脉冲星的信号,发现所得斜率只有-0.7。当然,我们一开始就没指望脉冲星能够发出符合定律的语言学信号。熟悉齐普夫定律的人们可能会认为,在语言现象之外还有其他信号也会遵循齐普夫定律,此话不假。对于一套信号系统来说,符合齐普夫定律是成为语言的必要不充分条件。换句话说,不符合齐普夫定律的信号肯定不是语言;符合齐普夫定律的信号或许是语言,但是依然必须进一步分析。

    更深一层的智能过滤器被称为香农熵。我们听一段座头鲸的声音。这是语言吗?你们是否听到了有智能的沟通?很难说,除非使用客观的数学标准来分析。我们知道一切人类语言都能构成斜率为-1的斜线,不过我们并没有想到地球上的其他沟通体系是否也能显现出这条斜线。语言学家经常主张齐普夫定律可以用来区分人类语言与其他动物的交流方式,但是我觉得未必。过去一百年来,人们一直主张人类生理学与其他动物完全不同,但是这个理念属于维多利亚时代,如今我们终于摆脱了这个理念。现在我们知道,就基因层面而言,就连最普通的植物都有可能具备比人类更复杂的基因。语言学也是同理,现在我们正处于思想认识的过渡阶段。我们正在意识到,人类语言与其他生物相比或许并没有如此孤立。所以我认为,齐普夫定律以及我接下来要说的信息论同样有助于我们研究动物的交流方式。

    信息论衡量的是信号的相互依赖度,这被称为熵顺序。第一层熵顺序或者说零级熵取决于一门语言的词汇量,具体算法是将信号数量以2为底数取对数,得出的结果意味着这门语言仅仅通过基本字母能够承载多少比特的信息。换句话说,第一阶香农熵遵循齐普夫定律。第二阶香农熵研究的则是语言的图表结构。比方说我在英语当中随便挑一个字母,你猜猜这个字母是什么。你可能猜是e。假如我挑的这个字母是首字母为t的单词当中的第2个字母呢?那么你大概会把你的回答改成h。你之前不会一上来就猜我挑了h,但是接下来你知道了我挑的字母前面是t,这样一来t就影响了我的挑选范围。所以你又猜了一个h,这个回答更有可能正确,因为the的确是英语当中最常见的单词。信息论衡量信号结构的复杂度以及信号之间的条件概率。换句话说它衡量的是信号之间的相互关系或者说规则结构。你可能会问,人类语言具有规则结构也就算了,为什么动物的交流也有规则结构?因为规则结构有助于纠错。比方说你把某句话抄写了一遍,结果不小心抄错了。你可以填入缺漏的单词与字母,因为语言要遵循规则,可以依靠上下文——用数学术语来说就是条件概率——在信号单位或者说字母之间复原遗漏的信息,这是非常合理的做法。有没有理由在野外这么做?当然有。如果信号非常重要,那么弥补错误的机制就很有必要。凡是允许关键信号的错误得到修正的机制全都有助于生物的生存。

    脉冲星不遵循齐普夫定律,那么海豚宝宝又怎么样?我首先要说说明一下,人类婴儿的哇哇叫并不遵循齐普夫定律,因为其中各种信号的出现频率都差不多,在坐标系里体现为一条横线而不是斜线。但是随着婴儿逐渐成长,他们言语当中的冗余显著增加,也就是把一句话说很多遍:“妈妈,妈妈,妈妈。”假设这个婴儿并非在祖鲁文化当中长大,这一现象显然鼓励了他们舍弃吸气音。假设他们生在英语文化当中,这一现象显然鼓励了他们发出m音。在画面上的图表里,黄色竖线代表人类婴儿的儿语,并不遵循齐普夫定律……蓝色的竖线则是两头生在海洋馆里的瓶鼻海豚幼崽发出的声音。在2到8月这个区间,人类婴儿的黄线正下方就是海豚幼崽的蓝线,两者在垂直方向完全重叠。换句话说,我们可以在数学层面主张瓶鼻海豚幼崽也会说儿语,也会随便发出噪音。长大一点的瓶鼻海豚幼崽倒是没有过于呈现“妈妈,妈妈,妈妈”这样的冗余现象,但是它们很快也落在了-1斜线上。在数学层面上,我们可以肯定海豚宝宝也要丫丫学语,等到完全掌握语言能力之后则会遵循齐普夫定律。成年瓶鼻海豚自然也要遵循齐普夫定律。这是我们第一次发现非人类物种遵循齐普夫定律。从那以后我们发现了若干其他物种也遵循这一定律。另一方面,松鼠猴与地松鼠的叫声则不符合齐普夫定律。而且我们发现海豚也有二级熵,或者说海豚的不同信号之间也存在条件概率——说得再明白一点就是海豚也有句法或者语法。我也不知道除了句法语法这些术语之外我还能怎么说,因为动物语言学还是一门相对年轻的学科。将来动物们或许会有属于自己的术语,目前我姑且将海豚的语法直接称作信号之间的条件概率。这种特质对于海豚在背景噪音当中相互沟通非常重要,因为它们需要修正信号错误。

    画面上是计算香农熵的公式,也就是信息论背后的数学支撑。在第零级以2为底数取对数意味着信息的单位单位是与比特,比特是香农引入信息论的单位。p代表一个信号出现的概率。基本上第一级信息熵指的是将交流系统当中的每一个信号的出现概率加在一起,然后乘以以2为底数所取的信号数量的对数,也就是将信号出现的频率与信号携带的信息相乘,得到的数字就是香农信息熵。熵这个词在信息论这边的含义与热动力学那边差不多。在热动力学当中你打开一个装着气体的容器,气体可以在更大的容器里以更多种状态存在,所以熵就增加了。又好比说一个房间如果只用不收拾,肯定会越来越乱,这就是熵在热动力学这边的定义。在信息论这边,熵指得是信息的可能性。比方说中文汉字有几千个,英文字母只有26个——算上空格的话是27个——因此中文的信息熵比英文更高。这并不意味着我们不能用英语表达出相当于汉语表达的意义与内容,而是意味着英语与汉语相比要先一步进入更高级别的熵关系。

    座头鲸或许有着大海里最复杂的声音体系。与人类语言的平均值相比,它们的信号数量更多。而且早在人类之前好几千年它们就有了自己的全球互联网。我们研究鲸鱼的地点是阿拉斯加以南。这里的鲸鱼叫声可以分为社交呼叫、进食呼叫以及浪漫的求偶呼叫,此外它们还会为了歌唱而歌唱。阿拉斯加鲸鱼的叫声与夏威夷鲸鱼的叫声显然有区别,就好像一般人类的对话与一般人类的歌声听上去不一样。有许多资料都记录了鲸鱼有多么聪明。我播放一段座头鲸的叫声,听上去不像我们印象里的鲸歌,因为鲸鱼们正在进行社交讨论,至于讨论的话题很可能是如何捕鱼。我们知道鲸鱼会支起气泡网来抓鱼。如果不生成气泡网的话,它们就吃磷虾。但是阿拉斯加的座头鲸发现了气泡网技术——我不确定世界上其他地方的鲸鱼会不会这一招——它们将让鱼赶到气泡网里边,然后张开大嘴把鱼都吃掉。我想请大家听一听鲸鱼的相互争论。每当气泡网出现漏洞、鱼群逃脱的时候,你就能听到鲸鱼们发出这些类似吵架的声音。如果用拟人方式来解释此类观察结果,那么鲸鱼大概是在说:“我刚才早就到位了,你跑哪去了?”……听上去没那么浪漫是吧?画面上是座头鲸撒开气泡网的实例,旋转的气泡网的直径大约是100米,能够困住里边的鱼。我们尝试复制小型气泡网,结果发现很困难,因为我们没有像鲸鱼那样的技术本能。我们确实理解关于气体扩散的波义尔定律、伯努利原则以及浮力,但是理解与应用是两回事。总之你要有大量的技术知识才能用气泡网来捕鱼。

    ……这第二段录音的节奏与频率都位于人能听见的范围内。我们小时候游泳,在水下听岸上的人说话,声音听上去就像这样。换句话说座头鲸正在试图以人类的方式跟我们交流——这或许是过度解读,但是它们确实试图发出类似人类的响声。我们想说鲸鱼的语言,不想让鲸鱼说我们的语言,所以现在我们出海录音的时候在船上全都不准说话。我认为这是非人类物种试图以人类方式和我们交流的实例,这与SETI的终极目标的区别并不很大。在这张照片上,张开气泡网的鲸鱼游到了我们身边。我们给其中领头的鲸鱼起名叫迈尔斯,取自著名小号手迈尔斯.戴维斯。如果我是一条鱼,听见它的叫声肯定马上逃走——实际上鲸鱼的叫声能与鱼的身体产生共振,所以鱼群没有多少选择,只会被吓到网里。我们认为座头鲸百万年来一直这样捕鱼……从船上往水里看,鲸鱼确实很像外星生物,不是吗?它们和我们生在同一颗行星,它们有一套全球交流系统,它们的社交网络非常复杂,它们还会使用工具,总之他们非常聪明。你不能说“它们没有智力,所以我们不必与它们沟通。”我认为关键在于克服我们关于我自己的交流体系的人类中心观点。

    再来看看智力过滤器。俄语字母、英语字母、阿拉伯字母、俄语音素、海豚叫声、座头鲸的求偶与捕鱼叫声全都位于可以通过过滤器的区间,或者说这些信号系统的香农熵斜率都在-0.5到-0.9之间。要是有地外生命的信号也落在同一个区间的话,那将会非常有趣。不幸的是,蜘蛛猴的叫声、地松鼠的叫声、座头鲸的日常叫声以及鸟叫声位于这一区间之外,而大象叫声则位于区间以内。我们正在研究越来越多的物种,看看谁能通过智力过滤器。我们现在可以区分天体物理学现象与智能的外星信号。我们知道其他复杂的社会性物种也要遵循信息论原则,甚至就连地外系统依然要遵循信息论原则,唯此才能传播知识。就算是外星人也不可能绕开信息论的量度。我们正在将这一切原理应用在艾伦阵列望远镜接收到的信号上。

    归根结底,我们希望量化不同物种在各自的交流系统当在构成句法的能力。句法越复杂,交流系统的纠错能力就越强。有些人类学家认为人类文化的复杂性使得导致了人类发声的复杂性。如果我们通过信号来衡量地外生命的交流复杂性,或许他们的社会复杂性也能够用数学来衡量。能用数学来外星文明的社会复杂性,这个想法听上去挺好的。我们是不是应该看着群星自问“我们是否孤独”?我认为这样做确实很浪漫,但是我认为我们应该更关注眼下就在地球上的非人类沟通系统,因为地球上有好几百万种这样的系统可供我们学习,谢谢大家。我们孤独吗?下面这声叫声是座头鲸的叫声,我们认为应该是“再见”的意思。

    通宝推:不远攸高,
分页树展主题 · 全看首页 上页
/ 1
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河