西西河

主题:河里程序员不少,应该知道对人工智能而言数据的重要性远高于模型 -- 亮子

共:💬58 🌺257 🌵2 新:
分页树展主题 · 全看 下页
  • 家园 河里程序员不少,应该知道对人工智能而言数据的重要性远高于模型 -- 有补充

    数据就是人工智能的粮食。人工智能的四大要素,数据,模型,算力,应用场景。中国在数据跟算力上都有短板,算力上所幸现在半导体奋起直追,且看成效。模型上希望有专业人士聊聊,应用场景现在中国下了吃奶的劲推数字化,估计这个不会差到哪去。

    可以有空找两篇人工智能的论文读一读,很多都是模型和代码给你讲的明明白白的。但数据集就往往语焉不详。不同模型可能尺有所短寸有所长,但是不同数据量训练出来的效果太大了。

    大公司自带数据,做人工智能自然是近水楼台,但是不同部门为了数据打架也不是啥新鲜事,你用我们部门的数据进行训练做出成绩了,KPI算谁的。小公司尤其是做tob的公司,求数据做训练都得求爷爷告奶奶的,尤其碰见对接银行政府之类的要求数据保密的公司,出差是少不了的,基本得去人家的地方做训练。虽然现在也有小数据学习,但是效果嘛...

    数据上美国掌握全球互联网,每天的数据量要远远大于中国,而且是不同种族,不同文化,不同语言的优质数据。这就是全球收割的好处。中国只有本土互联网,最多加上一些东南亚国家的数据,虽然体量也不小,但是跟全球互联网的数据自然无法对比,而且基本都是汉语文化圈的数据,很容易就过拟合了。现在百度也要出鳖版的chatGPT,个人猜测很可能是中国人用的很顺手,但是外国人用的就抓瞎。

    至于欧洲印度之流,现在基本是美国的数据农场,不谈也罢。当初中国建墙的初衷是隔绝外部反华信息的渗透,但是却意外的保护了中国没沦为美国的数据农场,应该说是无心插柳柳成荫吧,老欧洲貌似也要学中国开始建墙了。

    通宝推:方平,广宽,
    作者 对本帖的 补充(3)
    家园 前几年默许大公司过度收集个人信息,也是发展人工智能的考虑 -- 补充帖

    但也就近两年数据出境才提到国家安全的高度。也不知道滴滴事件最后到底如何了。

    也别说政府对chatGPT不重视,也许民间有轻视的情绪,但是相信高层政府绝对是重视的。上大学的时候教数值计算的老师提过,90年代初的时候就搞过计算机建模辅助政府决策。高层对新技术的敏感性绝对超过一般人的想象

    家园 其实引申开来讲制约现在中国发展的是市场大小而不是技术 -- 补充帖

    中美贸易战也是因为市场,凭什么苹果能在中国卖华为不能在美国卖,我用一句国家安全把你苹果禁了可以吗?没了苹果中国就回到通信靠吼的时代了?

    市场是技术的粮食。市场大——收益丰厚——能拿出更多的资源投入技术迭代——迭代出先进技术进一步抢占和巩固市场。形成正向循环。

    资本主义野蛮生长的时代列强们为了抢市场大建海军人脑子都能打出狗脑子,哪一个惨烈程度都不下于军阀混战。现在中美才哪到哪,还在wto框架内吵架已经很文明了。

    相比之下俄罗斯还在执着于土地实在有点一言难尽,那个地方真没有发展市场经济的基因。

    家园 人工智能的基础是数据标注,这可是标准的劳动密集型行业 -- 补充帖

    以后中国的第二产业容纳不了那么多人之后可能就指着这个行业容纳了。这个行业要求不高,眼睛不瞎能识字会用电脑就行。主要还是要求心细。数据标注的如何直接决定人工智能训练的效果咋样

    • 家园 (转自知乎)ChatGPT 有多高的技术壁垒?

      原文链接:ChatGPT 有多高的技术壁垒?国内外除了 OpenAI 还有谁可以做到类似程度? - wgwang的回答 - 知乎

      https://www.zhihu.com/question/581806122/answer/2882225612

      结论就是中国目前并没有基础理论上的差距,但是工程上的差距极大,原因很多,不完全是技术上的。

      技术壁垒没有很高,技术本身的话有许多机构都能做。壁垒高的在于:

      1,钱

      2,大规模语料的整理,本质上还是钱;

      3,中文来说尤其难的一点在于,中文资料本身比英文少太多;

      4,大工程的能力,本质上还是钱;

      5,理想,与钱有关,但不完全是钱;

      6,政策,比如国内的审核问题,这点难以放开说,与钱没那么大关系了;

      用户反馈和专业人士反馈的壁垒:ChatGPT 能够根据用户反馈进行快速升级,这对后来的类似 ChatGPT产品形成了另一个壁垒。另一方面,大量的专业认识对 ChatGPT 的评估产生了大量的论文和 blog,这些内容也是 OpenAI 完善ChatGPT 的宝贵资源.

      作者:wgwang

      链接:https://www.zhihu.com/question/581806122/answer/2882225612

      来源:知乎

      著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

  • 见前补充 4859751
  • 见前补充 4858550
      • 家园 美国的编程文化,巴西的足球文化

        美国的编程文化是不是像巴西的足球文化那样深入人心啊?似乎他们涌现了不少非常年轻的优秀程序员。

        印度的海量人才为它所用,咱们华为的一个技术突破靠的是一个俄罗斯数学人才。

        这有点任重道远啊。

        • 家园 我倒是觉得美国的冒险文化

          河友,好像是大山猫,说过一句话:美国这个民族就是往死里做,做完了发现没死,喘口气接着做。估计也是follow他自己的历史,当年没有沉到大西洋喂鱼,路上没有染上传染病被扔下海,自然有种怎么做都不会死的感觉,就带到了现在。

          美国这几家现在大家叫得上名字的公司,创立者是不是多多少少都有点辍学的经历?特别是这个chatGPT,高中出柜(你一个高中生,有必要吗),斯坦福辍学(难道是老师已经傻到你都不能忍了)。

          一个成功者背后必然有大量的分母。 美国社会的优点就是对这些分母特别宽容。很多公司里的底层人员,你一打听,都有好多次个人创业经历。还有一些失败,去大厂挣钱,有钱了又创业,继续失败。在这个过程中,相对不需要担心父母催婚,妻子儿子埋怨,朋友瞧不起,甚至不用担心个人财产归零(宽容的破产制度)。 这是这个社会在创新这一块充满活力的原因。

          通宝推:方平,
分页树展主题 · 全看 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河