西西河

主题:【商榷】杨世光说,我们已经掉入中等收入陷阱了 -- 哎哟

共:💬127 🌺986 🌵28
分页树展主题 · 全看首页 上页
/ 9
下页 末页
              • 家园 GPT的技术核心Transformer模型有数百亿个参数 -- 有补充

                据说训练一次,就要耗电19万度,可见训练集数量庞大。毕竟美国是互联网中心,纯中文的数据相比还是太少。

                虽然GPT给出的回答都是已经有的答案,理论上并没有创造力。

                但昨天故意找别扭的要求GPT写一首“关于月亮上环形山下一块歪七扭八有个手印石头的五言绝句”

                GPT写的诗如下:

                月明环形山,歪扭手印石。

                古老与玄妙,在这微光中定格。

                它存在多少时光里,目睹世界变迁。

                它是否曾经被爱抚,也是否受到忧伤。

                它让人想知道,万物的历史与生存的意义。

                在强调了要求4句每句5个字的五言绝句后,GPT又做了一首:

                月影在环山,歪石印手形。

                古迹玄妙存,光中永定格。

                它见证历史变,知万物生存意。

                爱抚忧伤有,历史与意义有自我。

                显然GPT对绝句只有4行20个字不太理解。但第二首前四句,已经完成要求。

                第一首中的那句:“它是否曾经被爱抚,也是否受到忧伤。”是跟命题要求中的“手印”对应,但也有那么点诗的味道了。

                好的算法加上庞大训练集反复训练之下,GTP的已经不是简单堆砌文字那么简单了。国内被限制了高性能显卡和AI芯片,又没有那么庞大互联网数据的情况下,想追上确实不容易。

                作者 对本帖的 补充(1)
                家园 只要知道chatGPT这条路能走通,剩下就是砸钱的事情了 -- 补充帖

                原来这条路谁也不知道是不是坑,国内敢砸钱的就少。现在chatGPT走通了,而他的原理其实几年前就差不多成熟了,就是花钱砸硬件,砸人力进行人工评估干预,transformer基础的超大规模预训练模型,超大规模训练集。

                清华有个GLM130B的AI,一开始也是没钱没硬件,后来还是硬件厂商赞助才训练出来,效果也不错。

                最多再过一年半载国内类chatGPT的文字生成AI也会遍地开花。

                当然头汤是喝不着了

              • 见前补充 4860183
              • 家园 泉大这篇有失水准啊

                这应该是有监督的机器学习的一个成就吧。 从机器学习的角度,中文,英文根本没啥区别,从一组数字到另一组数字之间建立联系。你这组数字是中文,英文,还是什么语根本没有任何区别。就算有,可能是一组数据有十万个元素,另一组有二十万而已。 关键是建立联系。

                机器学习的本质就是数学里的优化。有监督的学习在我看来就是加了限制条件的优化(constrained conditions),真实世界里,无限制条件的优化的用途是很少的,大部分问题都是有限制条件的。走到这一步,必然大大加速机器学习的应用。换句话说,只要人能做的好的,机器就必然可以学习到人类的最好水平。这就相当了不起了,相当于重复性的工作可能意义就越来越小了。

                就说用来学习的大知识库,目前大部分的论文,都是英文写的。目前百分之百的code,都是以英语为基础的各种语言写的。这怎么能说汉语有优势呢?

                通宝推:外俗内正,
              • 家园 没有人搞 AI甲骨文判读?
            • 家园 这里程序员多,应该知道AI最重要的不是模型而是数据集

              美国恰好是全球互联网的数据供他训练,而中国只能用国内互联网的数据训练,这数据集体量差距太大了。抖音海外数据又没法回传

            • 家园 牛人和能人还是喜欢那种地广人稀的生活环境

              但是美国的人口规模已经不能支撑起完整的产业链了,问题是它还是西方的带头大哥,可以利用盟友的产业链给自己服务,这个怎么破?

              中国人口多,可以搞完整产业链,但是人口密度太大,导致很多能人留不住,国外的能人也不愿意来(不光是工资高低的事情),这些年好了很多,可还是比不上老美。

            • 家园 能自主,追赶也可以,只是不爬行也是好的

              独立很重要。

              也许中国这么大,可以互相冲击,积累出,配合出好东西吧。

              • 家园 要做一件事情,

                最难的不是知道怎么造,而是知道这个东西能不能造出来。

                既然通用性人工智能是能造出来的,无非就是堆数据,那美国人能堆,这边也能堆。

                • 家园 做人还是老实的好

                  说说都很简单,孟子给我们留下的大而化之,都快把搞技术的人害死完了,还这么坚强地住在你脑子里。

                  比如说芯片,能知道造出来,你造一个?当然了,你可以说核潜艇一万年也搞出来,这没有错。等你搞出来,跟别人一比,连个拖拉机都不如,还好没有真刀真枪地对决,否则就好看了。

                  现在依然是同样的问题,别人做出来一个产品,你说,这不难,我也能做,你现在做出来,我50年以后也能做出来,说这样的话,有意义没?

                  为啥就是不愿意正视自己,老老实实一步一个脚印地往前走,笨鸟先飞,别人睡觉,我们人多,轮换着不睡觉,别人一个人一天干8小时,我们6个月一天也干8小时,这样才是追赶的老实做法。

                  • 家园 你看得明白那是因为水平高,然而各位大老板们可没你这么有水平

                    中国版ChatGPT争夺战,谁能最终脱颖而出?

                    https://user.guancha.cn/main/content?id=929468&s=fwzxhfbt

                    百度抢跑,腾讯字节紧随,ChatGPT中国版不会太遥远

                    根据路透社的说法,百度正在开发一款由AI驱动的聊天机器人,呈现形式自然与大受欢迎的ChatGPT类似,并计划在3月将其整合到百度主要的搜索引擎中。

                    与此同时彭博社也给出了更多相关细节,例如这家国内的搜索巨头还计划建立一个独立的网站,供用户使用该工具。

                    百度过去这几年一直在寻求转型成一家人工智能公司,在包括自动驾驶汽车和用于人工智能应用的芯片在内的技术上投资数十亿美元,这也让其成为了最有潜力抢先开发出与AI相关产品的国内科技公司。

                    ===========================

                    如果你认为搞不成,就不要在这里和我吵,去劝劝这些老板们不要把钱都打了水漂才是正道。

                    • 家园 没有跟你吵

                      百度?看看他们投资了多少自动驾驶,看看百度的地图,搜索就不说它了。

                      • 家园  百度一度是我认为国内公司里面最有希望的

                        也只有它(我的消息有限),真金白银的在美国开公司,开高价挖人。 阿波罗,给马公开40多万的年薪。

                        我其实一直觉得应该把大炼芯片的钱投到自动驾驶上。主要公路两边按距离装好sensor,直接从道路建设上解决自动驾驶的难题。然后倒逼芯片产业来吃这块蛋糕。 这样美国想抢还是想学都做不到。 现在和人家抢图形识别的赛道是以短击长。

                      • 家园 还是那句话,你认为不靠谱,光说服我是没用的

                        你得说服那些大老板,如果你真帮他们省了大钱,赏你个三瓜两枣就够花几辈子了。

                        你有这个自信不?

                        • 家园 我老了,再说这些都是你们年轻人的事

                          尤其是你这个白领,绝对不是白领的白领,我看你相信他们,要不推荐你去做百度或者是腾讯的公关大喇叭?估计给你一个枣够你吃几辈子的。我老了,不需要了。你赶快点。

分页树展主题 · 全看首页 上页
/ 9
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河