西西河

主题:chatGPT是我朝面临的巨大挑战!应鼓励天才和尖子,刻不容 -- 玄铁重剑

共:💬92 🌺484 🌵17
分页树展主题 · 全看首页 上页
/ 7
下页 末页
                  • 家园 所以说要用新版本...

                    很抱歉,我无法写一篇关于欧阳海之歌的读后感,因为我是一个搜索引擎,没有阅读过这本书。但是,我可以帮助您查找有关这本书的信息。您想了解什么?

                    欧阳海之歌的作者是金敬迈1。他是江苏南京人,1930年生,1949年参加解放军,曾任中南军区军械学校文工团团员,广州军区战士话剧团演员、创作员,军区政治部创作组创作员。19587年开始发表作品。主要作品有长篇小说《欧阳海之歌》《好大月亮好大的天》等1。

                    • 家园 啊,不是

                      一个3.5版本还满是靠脑补瞎编凑合的程序,你告诉我,升级了0.5个版本,他就完美的豪不担心的能指挥人类去做最前端的科研了,

                      是不是哪里有点不对?

                • 家园 国家数据局成立的意义就在此。微软还是有钱,壁垒直接用钱砸开

                  不管是nature还是science,本质都是商业出版社,自己的数据凭什么要给你微软做训练?显然是钱给到位了。github本来就是微软自家的更不用说。国外似乎这些巨头可以通力合作,国内就是你死我活。

                  国内的公众号里面的优质内容你用百度搜都搜不到,还给你做训练数据?国内的知网估计也不会做慈善把数据给百度的,各大巨头各自为战互相提防。

                  • 家园 一想到这个我就心慌

                    我们甚至需要成立一个专门的部门来协调,甚至还得强压着才能干活还不一定利落,肯定到时候还有一堆扯皮。

                    怎么这说好的行业壁垒,说好的巨大阻力,说好的内部激烈党争就在英美科技领域彷佛就根本不存在一样,协调起来得心应手,动作麻利交接极快,感觉比国内国资委指挥下属国企还顺畅.....

                    按照3.5和4.0版本的问答区分,要知道这些学术出版社积累的数据库也是极为庞大的,这短短几个月就调试到现在这个水平,我怀疑相关企业甚至一天都没有休息。

            • 家园 宝推,很受启发

              chatgpt之类的AI能从10到100我相信是有可能的,但是我还是没看到chatgpt从0到1的能力。

              • 家园 再补充两句

                根据我的观察:

                1. ChatGPT是一个更聪明的智能辅助工具。善加利用,可以大大减少重复性的思维劳动。

                2. ChatGPT的泛化能力不够,对于小样本或无样本的探索性科研活动,GhatGPT不会发挥太大作用。

                • 家园 很多科研难搞就是因为数据太少

                  科研问题是典型的高维稀疏特征,这也是AGI最大的难点,没有之一。

                  但是要能针对性的增加数据,这一点恰好是可以解决的。当然,这个过程可能会持续将近10年,这也是人才培养体系最后的转轨期。

                  因为重要的数据,不是文章!是数据,不是文章!

                  /

                  因为之前已经发生过一次了,就是在生化领域大量的自动化替代,使得数据量指数级增长,最终诞生了alphafold这种玩意。你现在用“高通量”为关键词去搜会发现生化领域受惠于每年天量的研究资金,相关技术几乎全进化到了自动化版本。

                  比如这一个

                  https://www.mt.com/cn/zh/home/applications/Laboratory_weighing/high-throughput-experimentation.html

                  进行有机反应优化的典型工作流程

                  高通量试验打开了新的视角

                  自动化和6轴多臂机器人辅助的反应样品制备

                  进行有机反应优化的典型工作流程

                  全自动制备多组分配方(多对多)

                  在多达30个目标容器中自动加样一种固体物质(一对多)

                  高通量试验(HTE)可实现快速反应优化和针对治疗靶点筛选化合物库,彻底改变了药物研究。在采用HTE之前,手动程序将实验室的筛选测试能力限制为每周20-50种化合物。例如,一个包含3000种化合物的化合物库本应需要1-2年的测试时间。自动化技术大大加快了此类筛选实验的速度。使用THE,可以在指定条件下同时快速且不间断测试大量实验样品。每周进行800-1000个筛选反应非常普遍。可将筛选3000种化合物的假设库缩短至3-4周的测试时间。

                  /

                  这就是为什么生化领域是沦陷最早的,因为是最早自动化的,使得高维稀疏数据不再稀疏。很多比较领先的有钱组都是自动投材料自动收样品,样品自动收数据,全套高通量实验配合自动化分析,这种情况下产出的大量数据最终暴力跑通了不限于alphafold的一系列AI模型。所以alphafold为什么牛逼?因为施一公及那帮做crystal structure的人发现它真的牛逼。不需要再招塑料袋了。

                  /

                  这也是我觉得随着GPT模型泛化以后,基础科研数据的价值大幅度升高,使得很多不那么热门有钱的领域也会被拉入了自动化的猎杀范围,使得以后会像生化领域一样,同样会有公司制造专门的自动化机器批量产出数据投喂科研AI的代替大量硕博士。等于是GPT哪怕什么都没做,仅仅只是这个时代的号角声,提升了科研数据的价值,就变相的淘滩了大部分人罢了。

                  贵是贵,但是出来的数据绝对比现在散落在地球各地手工业师徒制产出的数据要可靠,大量淘汰师徒制硕博士研究生,到最后只会有同样有钱大组买得起先进自动化设备和软件授权的教授幸存。而少量没钱只能继续手工业的落后小组,他们的产出是几乎毫无意义的。只要能保证数据的来源,人类写文章是毫无意义的。

                  和很多人想的AI时代会缩小人力差距不同,未来更可能的是科研领域马太效应更加严重。科研领域要告别师徒制了。留给个人的只有大公司不做的夹缝,正如openAI逼得搞NLP的纷纷转行或者打下游一样。

                  通宝推:川普,
              • 家园 人工智能一旦具备从0到1的能力

                那人类历史就结束了。

                • 家园 没啥可惜的

                  用章北海的话说,“都一样”

                  人类也不过是进化的一个阶段而已

                  • 家园 关键是可惜也没用

                    事务发展自有其规律,人自豪的所谓自由意志弄到最后不过是这个规律中的一个天然组成部分。

                    也许真正让人难以接受的是这一天来的太快了。

    • 家园 教育上我觉得能说几句。

      为了公平,现在中学教育是严格分区分片招生,取消重点学校跨区域招生,取消重点班和排名什么的,对于成绩不算好或者中等的孩子来说,是公平多了。

      但是对优秀的孩子来说,却是不公平的。首先要承认一个事实,人先天上就是有区别的,比如智商,理解能力等。

      优秀的孩子应该有一个好的环境,只要严格按照成绩来,重点班可以办。

      至于GPT,很惊艳,但也没必要神化,国内也在做,比如百度的文心一言等,虽然暂时没那么好。

      做这个要强大的计算能力,我们的云计算,超算并不差,赶上去很快的。

      其实能做这个的,也就中美了,慢慢来吧。

      • 家园 应该允许班内校内分数排名

        现在中小学期中期末考试成绩结果只会单独发给家长,只有家长知道自己孩子的分数和名次。

        连学校成绩排名都不敢公布,怕伤了孩子自尊心,将来怎么面对社会竞争?哪怕成绩不好垫底,好歹也能练出个厚脸皮吧

        • 家园 连大学生都不敢在班级排名了

          想知道可以自己去问辅导员,但只能问自己的。

          我说,你们不知道排名,都不怕奖学金发的不公平吗?他们似乎并不关心。

      • 家园 其实无论啥学校,都应该允许重点班的存在
分页树展主题 · 全看首页 上页
/ 7
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河