西西河

主题:【原创】从过去的龙年看未来的中国(连载) -- diamond

共:💬1615 🌺32110 🌵174
分页树展主题 · 全看首页 上页
/ 108
下页 末页
              • 家园 您以为美国只有Google的数据库?

                单是我们知道的搜索引擎就有不下十个了,其中有名的有Yahoo、AltaVista、Infoseek,然后才是Google、Bing。这还只是基于Internet的。

                Google 还有Google Scholar、Google Books、Google Patents等等深层数据库,我孤陋寡闻,腾讯、淘宝、百度现在还没有吧。Apple的Siri和iCloud实际上也是基于数据库的,现在应该也没有遇到国内竞争。

                海量的数据实际上还在那些非免费的数据库中,比如ANALOG、STN、Thomson Reuters,Elsvier其中的数据挖掘和信息处理方法已经超过了我的想象——想想棱镜都是通过什么工作的?莫非是人工,显然不可能。

                • 家园 【“您以为美国只有Google的数据库?】无聊
                • 家园 如果只是罗列,国内的网络数据库也是相当的不少啊

                  你能举出十个国外的因特网公用搜索引擎,我也能很轻易的举出十个国内的类似综合搜索引擎。不说“百度”,三大门户都有自己的搜索引擎,搜狐的“搜狗”,网易的“有道”,新浪也有自己的搜索引擎,但它比较出名的是它的另一个开放式数据库“爱问”;此外比较知名的还有腾讯的“搜搜”,奇虎360的“360搜索”,不算太知名的还有慧聪的“中搜”,人民网的“即刻”,新华网的“盘古”,淘宝也在做自己的搜索引擎,我这还是刻意没有提微软的“必应”和雅虎的“Yahoo!”。至于一些更小规模的我都不提了。

                  除了这些综合型数据库检索服务,国内免费的专一数据库搜索服务也不少,比如视频资源搜索方面迅雷的“狗狗”(已经关闭了,估计是吃了版权官司,但现在迅雷还在开发新的数据库检索技术),优酷土豆也在开发自己的视频专业搜索引擎,还有“风行”,这已经是云搜索范围了。至于音乐图片之类的不说了吧。

                  至于付费的数据库,国内也不少,最著名的就是清华同方的“中国知网”,它还有一个大众化的子库“吾喜”;另外同等规模的还有科技部西南信息中心建立的“维普”,国家图书馆背景的“超星”;商务方面还有中企网的“中企动力”等等。此外还有更加专业的只对特定客户开放的档案级别电子数据库,也有专门公司负责制作维护,例如原科技部直属的“青苹果数据中心”,这些都是有的。

                  举了这么多例子,其实就是想说明,也许我们都没注意,也就是几年的功夫,国内在资料信息化管理方面已经铺开了很大的摊子,各种名称此起彼伏。至少在规模上是绝对不逊于国外先进地区的。关键还是技术创新,当然首先是跟踪(或者说是山寨),更关键的还是对资讯开放的程度。

                  例如语音搜索方面,我知道的是至少中国移动在这方面一直有折腾,百度也是,其他公司我不知道,但也能够想象得到,只是还没有很成熟的服务,像苹果那样的。图形搜索方面也是这样的。

                  至于开放程度的问题,最近百度地图在尝试一项新的服务,提供部分国内城市三维地图数据服务,看上去是百度的创新,实际上是各个省级测绘部门根据高层要求将其部分测绘数据库对公众开放的结果,百度只不过是一个被选择用以公开的信息平台。同样道理,很难想像,谷歌没有得到美国政府各个相关部门的电子数据库支持和开放,它哪里能够提供这么多新奇的服务。

                  通宝推:铁手,
                  • 家园 很可惜,数据库不光是看名字,还要看收录的深度和广度

                    以及影响力。

                    不说别的,以我的专业——化学来看,全世界目前没有什么数据库能够超过CA、BA、MEDLINE的,中国的那几个数据库,自己连国内期刊的收录完整都做不到,更不要提数据的加工和查询的便利了。

                    我这么说不是妄自菲薄,而是说We still have a long way to go。信息工作整个二十世纪直至目前独步全球的,想要赶超没那么简单。

                    • 家园 书斋里的东西和Industry是两码事

                      Thomson Reuters在书生们看起来牛逼哄哄,但真的在市场上做data provider在三年内就被Bloomberg打得毫无还手之力。真跟他们的人聊聊就会发现,不过是一群本科水平的印度码工花点时间的积累而已,而且这种积累完全可以用蛮力和钱来弥补

                      • 家园 Bloomberg 也是美国的啊

                        也许我见识有限,不过人家美国人内斗的结果是自己的水平提高,我们也就是在旁边打酱油而已,不是吗?这和我的观点不冲突啊。

                        • 家园 里面的tech有三分之一都是中国小硕

                          ,而且很大一部分是文科生转的R&D,就能轻易搞定Reuters。Reuters里边R&D也一堆中国人和印度人,半斤八两。这能说明的唯一问题就是:信息技术根本就没什么high tech,只有sales和marketing才是美国的宝。

                    • 家园 腾讯淘宝百度等对自己数据库的利用水平,远远超出您的想象

                      期刊之类的,确实国内没怎么搞

                      • 家园 你可以试着登录“中国知网”CNKI:)

                        它的另外一个名称就叫做“中国期刊网”,对内还有一个名称叫做“中国期刊全文数据库”。是国家级别的信息建设项目。

                        外链出处

                        还要完善数据库的内容及结构,但已经做得很好了。毕竟这个数据库是从头做起的。可惜必须是付费用户才能全文浏览。

                        另外还可以试试这个:外链出处,也是国家级的期刊数据库,比较侧重于学术期刊的检索

                        • 家园 谢谢了,Cnki 、维普、万方的数据库都在用

                          互有千秋。可惜,连国内的期刊这几家都做不到收录全面。数据库方面,任重而道远啊。

                          • 家园 其实还是钱作怪

                            国内数据库的期刊价值都低,所以需要用的人就少,这样一来搞好它的意愿就低了。

                            像SCI,EI这些数据库,市场价值高,所以搞好它的价值就高,意愿就高了。而且这些已经早就排他了,后面再想搞也就只能跟在后面了。

                            等什么时候以中文做为发表语言的期刊杂志变得热门和抢手了,什么时候维蒲,万方这些就变得异常好用了。

                    • 家园 的确需要持续的投入,改进和技术创新

                      架子搭建起来了,但数据远远不能满足需求,我觉得这是问题,也是后进者的机会。

                      不管怎么样,持续发展才是根本。

      • 家园 'Tis the last conflict!

        花本章引言最后一句

        “这是最后的斗争,团结起来到明天,英特纳雄耐尔就一定要实现”!

      • 家园 有个问题不懂,IT小白一个,为什么说西方不希望中国制造

        CPU?

        如果说有一类产品是西方国家最不愿意中国能够生产的,那就是集成电路芯片,如果要在其中挑一种他们最不希望中国制造的,一定是计算机的中央处理器(CPU)。

        • 家园 资本可以容忍外包其他的工作

          但是技术含量最高的一个制造, 资本一定要亲自掌握。所以个人电脑的其他部件可以让珠江三角洲的工厂制造,但是CPU 就只有 Intel, AMD 等寥寥几家可以造。

          本来资本还希望垄断操作系统,但是来自民间的开源项目使得他们的垄断泡了汤。著名的 Linux 就是这么来的。这是草根阶层借助新技术对资本的反击。

          通宝推:流云天下,
分页树展主题 · 全看首页 上页
/ 108
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河