西西河

主题:河里程序员不少,应该知道对人工智能而言数据的重要性远高于模型 -- 亮子

共:💬58 🌺257 🌵2 新:
全看树展主题 · 分页 下页
家园 河里程序员不少,应该知道对人工智能而言数据的重要性远高于模型 -- 有补充

数据就是人工智能的粮食。人工智能的四大要素,数据,模型,算力,应用场景。中国在数据跟算力上都有短板,算力上所幸现在半导体奋起直追,且看成效。模型上希望有专业人士聊聊,应用场景现在中国下了吃奶的劲推数字化,估计这个不会差到哪去。

可以有空找两篇人工智能的论文读一读,很多都是模型和代码给你讲的明明白白的。但数据集就往往语焉不详。不同模型可能尺有所短寸有所长,但是不同数据量训练出来的效果太大了。

大公司自带数据,做人工智能自然是近水楼台,但是不同部门为了数据打架也不是啥新鲜事,你用我们部门的数据进行训练做出成绩了,KPI算谁的。小公司尤其是做tob的公司,求数据做训练都得求爷爷告奶奶的,尤其碰见对接银行政府之类的要求数据保密的公司,出差是少不了的,基本得去人家的地方做训练。虽然现在也有小数据学习,但是效果嘛...

数据上美国掌握全球互联网,每天的数据量要远远大于中国,而且是不同种族,不同文化,不同语言的优质数据。这就是全球收割的好处。中国只有本土互联网,最多加上一些东南亚国家的数据,虽然体量也不小,但是跟全球互联网的数据自然无法对比,而且基本都是汉语文化圈的数据,很容易就过拟合了。现在百度也要出鳖版的chatGPT,个人猜测很可能是中国人用的很顺手,但是外国人用的就抓瞎。

至于欧洲印度之流,现在基本是美国的数据农场,不谈也罢。当初中国建墙的初衷是隔绝外部反华信息的渗透,但是却意外的保护了中国没沦为美国的数据农场,应该说是无心插柳柳成荫吧,老欧洲貌似也要学中国开始建墙了。

通宝推:方平,广宽,
作者 对本帖的 补充(3)
家园 前几年默许大公司过度收集个人信息,也是发展人工智能的考虑 -- 补充帖

但也就近两年数据出境才提到国家安全的高度。也不知道滴滴事件最后到底如何了。

也别说政府对chatGPT不重视,也许民间有轻视的情绪,但是相信高层政府绝对是重视的。上大学的时候教数值计算的老师提过,90年代初的时候就搞过计算机建模辅助政府决策。高层对新技术的敏感性绝对超过一般人的想象

家园 其实引申开来讲制约现在中国发展的是市场大小而不是技术 -- 补充帖

中美贸易战也是因为市场,凭什么苹果能在中国卖华为不能在美国卖,我用一句国家安全把你苹果禁了可以吗?没了苹果中国就回到通信靠吼的时代了?

市场是技术的粮食。市场大——收益丰厚——能拿出更多的资源投入技术迭代——迭代出先进技术进一步抢占和巩固市场。形成正向循环。

资本主义野蛮生长的时代列强们为了抢市场大建海军人脑子都能打出狗脑子,哪一个惨烈程度都不下于军阀混战。现在中美才哪到哪,还在wto框架内吵架已经很文明了。

相比之下俄罗斯还在执着于土地实在有点一言难尽,那个地方真没有发展市场经济的基因。

家园 人工智能的基础是数据标注,这可是标准的劳动密集型行业 -- 补充帖

以后中国的第二产业容纳不了那么多人之后可能就指着这个行业容纳了。这个行业要求不高,眼睛不瞎能识字会用电脑就行。主要还是要求心细。数据标注的如何直接决定人工智能训练的效果咋样

见前补充 4858542
见前补充 4858550
家园 现在的关键是国内互联网平台如何出海,还要能把数据回传

好像去年末有个上海泄露10亿安全数据的消息,也不知道有没有后续了

家园 河里成天喊闭关锁国的想想中对美开放但是美对中开放吗?

可以让我们吧抖音数据回传从而更好地训练模型以提供更好的服务吗?

家园 人工智能就好比不同人只要智商差距不太大,勤能补拙是做得到的

怎么勤,拿数据喂

家园 一说这个我就想笑

国家支持企业过度收集个人信息

不实名制,网上什么也干不了

然后又保护不好个人信息,也不打击那些买卖个人信息的玩意

为他人做嫁衣

互联网企业在国内作威作福,去国外就当孙子

家园 所以滴滴被锤了么,也就这两年开始重视数据安全

国内互联网企业这德行确实

家园 重拿轻放,对柳家处理太轻了,最近还有缓和

估计要白色恐怖了。

家园 美国的编程文化,巴西的足球文化

美国的编程文化是不是像巴西的足球文化那样深入人心啊?似乎他们涌现了不少非常年轻的优秀程序员。

印度的海量人才为它所用,咱们华为的一个技术突破靠的是一个俄罗斯数学人才。

这有点任重道远啊。

家园 年年国际奥赛都是中国霸榜,很多都去了美国

人家的平台机会更多,有用武之地,这个就是中国目前最大的弱势。

点看全图

家园 想多了,就像改开之初外国大品牌来中国收购国有品牌

然后雪藏废掉一样。这些大才到外国,估计也就是一高级打工的,做点外围辅助类的工作,开发算法之类高级岗位想都别想,等到了年龄,也没做过什么大项目,一旦学习能力下降,经验不足跟不上时代,就扫地出门。美国人的算盘就是我不用这些人,但也决不让你用。

家园 “经验不足跟不上时代,就扫地出门”在中国概率远大于外国

程序员行业起码是这样。这就是为啥251事件这么出名的背后情绪。我有多位在国内的同学朋友在中年从一线民营企业被请走,去了国企或者外企。而在国外的这种相对少得多。

家园 那只是普通程序员的命运

在国内,真的人才是会放到重要岗位上,是真有重大项目可做的,重要项目做多了,身价自然就上来了。

中国外国唯一不同的是:在国内,对真有能力的人,是真的有机会;而在外国,对真有能力的中国IT人才,他们就是要废掉你的能力,一点机会都不给的。

家园 不大认同

比如,你可以看看那些奥赛金牌的,在国内、国外的发展对比。或者清华某年一个班毕业生在国内、国外的对比。

当然,你要说总书记这样的岗位是中国人,那是不错。但是同时也要看到的是,这个岗位是从十几亿人选出来的;而大陆赴美华人总共才多少?比成材率,哪怕是政界,在美国也比国内高。

全看树展主题 · 分页 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河