大数据带来“弯道取直与换轨”的新机遇
涂子沛、陈刚、张跃在思客讲堂活动现场 姚冠华/摄
4月27日,著名大数据专家涂子沛、贵阳市委书记陈刚、北京浩瀚深度信息技术股份有限公司总裁张跃应邀做客《思客讲堂》,共同探讨大数据带来的新经济模式,数据如何开放与管理,大数据技术将给中国社会带来的挑战和新机遇等话题,现场讨论“火花四射”,各种精彩观点层出不穷。本次活动由思客与观数科技、北大国发院博士论坛联合举办。
开放数据,政府应该走在商业机构前面
思客 :BAT拥有大量的数据,而且是他们的核心竞争力。涂老师,您曾担任阿里的副总裁,假如您是马云,会开放数据吗?
涂子沛 :事实上,阿里一直在开放数据。 开放数据首先是公共部门先开放,然后是商业机构。所以,公共部门应该做领头羊 。贵阳在这方面做了很好的工作。 但是阿里不可能全部开放, 因为涉及到商业竞争,这部分数据是商业机构投资,然后他搜集的数据。他有所有权,所以他可以拒绝开放,可以封闭。但是开放有很多层次,可以说向整个社会开放,也可以向一个人开放。比如阿里向个人开放,我想看个人的消费记录能不能看,中国正逐步向这个方向前进。 我希望看到的是公共部门在引领数据开放,而不是商业机构 。如果是商业机构在引领中国的数据开放,那我们的公共部门就缺位了。
图为新华网董事长、总裁田舒斌与嘉宾在“数据化生活与共享经济”思客讲堂现场。姚冠华/摄陈刚 :涂子沛的观点我是赞同的。政府在数据开放的方面应该走在前面。走在前面,我认为有两句话: 第一,政府要搭建规则,搭建秩序,让数据有序的开放,让数据更安全的开放。第二,政府是目前社会最大数据拥有者,而这些数据来自于民,应当服务于民 。在保护个人隐私的前提下,在保护社会公共安全的前提下,数据应当尽可能的开放。但是我们现在看到一个问题是什么?有不少的部门想开放数据,但是他不知道怎么开放。因为大家都知道,大数据是一个双刃剑,数据开放的同时意味着社会的风险。怎么样在数据开放的同时尽可能的保护隐私,保护社会的公共安全?这就是政府在数据开放中面临的一个问题。
那么,我们贵阳推进开放,现在做三个层次:第一,先把政府数据开始共建,通过数据的共建,建立统一的数据标准和数据存放接口的互联,使得数据从产生开始就有共同的标准,共同的可使用的结构化的尺子。第二方面,可以实现政府部门数据的互通。现在出现许许多多的事情,就是因为政府之间的数据不通,工商填一个表,下一个部门还要填同样的表格。
涂子沛:开放数据首先是公共部门先开放,然后是商业机构。姚冠华/摄涂子沛 :这是我回国亲历的一个事情。我租了一个房子去办证,拿了一堆的资料。现在政府把行政中心放在一起,柜台就是开放式的。我跟办电卡的说我要办电卡,他要我复印资料;我在这边办水卡的时候,那个人还要我再复印一套资料,这就说明这个数据完全没有连通。
陈刚 :他刚才讲的这个故事也不是贵阳的故事。实际上,政府部门之间数据要互通,我认为这是第二个阶段。 最重要的阶段是政府的数据和社会共享 。我认为最重要的一条,怎么样来共享,怎么样来有序的共享,怎么样共享产生的是正能量。
在这个过程中,我认为政府需要探索数据有序开放的模式。我们现在讨论比较多的是抱怨政府数据不开放。其实政府有政府部门的担心,这个数据开放之后如果造成了隐私的问题,造成了公共安全的问题,谁来负这个责任。因此,数据开放需要一个加工再处理的过程。
比如,把身份证号码、电话号码、住址去掉,然后把有价值的数据向社会开放。现在做的比较多的是停车场的数据,其实城市交通的数据就可以向社会开放。我知道有人比我的想法更聪明,如果用这些数据干一些不法的事情就会出麻烦。我们首先是契约式的开放。你是一个法人,是一个可以承担责任的人。我跟你签订约定,把数据有序的向你开放。你用这个数据可以服务于社会,也可以给自己的企业带来价值,这就形成有序的数据开放。
政府的数据如何有效开放,现在还没有标准的答案和统一的格式。贵州作为大数据的综合试验区,我们有义务探索这个路径。
图为新华网副总编辑、主持人刘娟与涂子沛互动。姚冠华/摄大数据时代,不要讨论所有权,而要讨论使用权
思客 :在数据有序构建的过程当中,政府在里面有很多协同的作用,包括很多政府部门和企业,您觉得这里面最大的难题是什么?
陈刚 :我觉得人类进入信息社会,大家都认为数据具有巨大的价值,甚至认为数据是未来社会的核心价值。现在围绕这个核心价值全链条的实现过程没有规则。比如,我作为淘宝的一般消费者,在淘宝上面买东西,我形成了我的浏览记录、消费记录,形成这个数据是谁的?阿里现在说是他的,我认为是我的。因为我花钱买东西了,即使我没有花钱买东西,我也花时间在网站上浏览。
我们现在有一个共同的问题,数据的所有权归谁?我认为现在众说纷纭,如果一个东西的所有权都没有说清楚,价值链的产生谁来享有。 人类社会还是很聪明的,现在有越来越多的共识,不要讨论数据的所有权是谁的,而是讨论这个数据的使用权是谁的。 这个数据阿里发现了,阿里就有它的使用权,我想问阿里,你们下一次能不能把个人的消费数据在网上公布。我今天给淘宝提一个意见,淘宝在我们个人消费单子里面永远没有一个栏,计算累计消费的钱数,我想在软件设计当中有一个考虑,就想怕花钱太多不敢消费了。
涂子沛 :陈刚书记刚刚问的阿里问题,我可以反过来问陈刚书记,我在政府部门也留下了很多数据。那些数据我看到了吗?那些数据更加关键,是整个社会的基础设施,无数的商业机构。刚才陈刚书记说了政府是最大数据的拥有者,换句话说我们最大的数据就在政府,政府掌握了我们所有的数据,这些数据能分享给我们吗?我们今天也没有看到。
还有,阿里巴巴其实做了一些工作。我们做的不够完美,但是我一直在做。每年年底的时候会出一个淘宝时光机,这件事情很了不起,把一年的消费记录全部分门别类做一个总结,有消费的总额。很多消费者拿到这个报告之后,有人反馈告诉我说,眼泪都流下来了,为什么?因为他一年的记录被精心的记录下来,精心的分析。 数据能激活一个人的记忆,所有的记忆沉淀在那里 ,你的消费过程,可能花钱太多,有可能有喜悦,也可能有不高兴,在年终的时候看到一个这样的报表,所有记忆重现,给人感觉很好。 我们要尽量做到“数据有温度。”
互联网伦理构架建立在数据共享的基础上
陈刚 :数据开放到底往哪里走,数据开放的规则和标准怎么制定,这不是阿里和贵阳市政府的事情,是全社会的事情。
无论今天在现场,还是在互联网上的听众,你们在这样的社会中,也会有许许多多的信息泄露遇到的麻烦,事实上,这是全社会的问题。 我认为在这个过程中,政府要发挥主导性的作用,就是政府来制定规则,引导秩序,甚至于应当在互联网建立伦理构架,这个伦理构架是建立在对数据的基本认识的基础上 。所以,这一条路,我认为需要共同来探索。
张跃在现场提到,数据开放的核心问题是是否对开放者有利 陈杰/摄张跃 :听了两位的讨论,深有感触。这正是互联网时代,包括大数据时代比较混沌的问题。我就说两点:第一,数据是谁的?这个非常简单,谁有能力就是谁的。你没有能力,就不是你的,你有能力就是你的。
第二,数据的开放问题。这个问题既简单又复杂,如果片面的看就非常复杂,这里面有隐私问题和责任问题,而 核心问题是不是对开放者有利,只要有利开放不是问题 。
商业有商道,社会上有伦理。可能有些问题也是我们这个社会共同承担的一个发展的历程。我觉得贵阳大数据的建立本身就是中国在互联网经济、大数据时代的一个路标性的事件,必定会成为历史的一个标杆的产物。
我也特别祝愿,在中国大数据时代能够弯道超车,让我们民族在大数据时代能够把一些弱势,比如诚信、契约,把这个事干得更好,让世人承认咱们,中华民族确实很伟大,这是我的一个想法。
关联是大数据核心当中的核心
思客 :能否给大家分享一下您如何通过数据的挖掘,使之成为商业价值?
张跃 :我们是一家做互联网流量检测和流量数据采集,以及控制、优化的公司。目前来说,在中国互联网最高端,采集设备几乎百分之百是由我们提供的。低端的这些数据采集有很多家公司。浩瀚深度每天10个T以上是有的,这个数据很大,而且是不断地流淌着,存不下来,都浪费了。我的基本客户就是运营商,运营商现在也发现了这些数据是金矿。如果不断的流失掉,确实量太大。
第二,这些金矿的挖掘是一种技巧。大数据里面是有黄金的,刚才二位都讲到骚扰电话、骚扰短信,恰恰是大数据应用的一个空间,也是我们大数据将来产品消费的空间。如果通过大数据,他知道你就要买这件东西,他还去骚扰别人吗?打电话是需要成本的,不光是电话费的事,还需要时间,还要雇人。假如大数据分析告诉他你要买这个东西,这样大数据产品就有了。
我个人认为, 这个通信时代,之所以要产生后续的大数据时代,就是因为他有产品空间,有需求 。所以,在这方面我觉得骚扰电话、骚扰短信,恰恰是我们大数据未来的一个市场空间。不要忘记了,这就是我们服务的对象啊。
所以,我在掘金的过程当中,帮助运营商发现的过程当中,找到一条把大数据变成有用产品的路,比如客户画像,数据安全保护,隐私的转换,隐私的脱敏等等。我们找到了这条路,但是很遗憾的是,大数据归谁啊?浩瀚深度太小了,我没有地方,挖掘出来也没有办法变成产品。我期待着,我们能够为社会做这些,我们把这个产品做出来,这个产品是什么?就是关联。 关联就是大数据核心当中的核心,它就是金子 。什么是关联?共享这个事看你出多少钱,不给钱是不能共享的。我觉得这个非常重要。
Uber也好,滴滴打车也好,不给钱,给你坐车吗?共享的前提是优化。这里面有为客户服务的便利性、经济性、舒适性,甚至我的愉悦性,这是客户需要的,我觉得共享的前提还是要给钱。
痛客计划:分享痛点,寻找创业机会
思客 :陈刚书记,您现在打造的“云上贵州”非常有名气,这里面也有共享经济的问题。您建立这么多大数据的中心,现在产生的商业价值怎么样?
陈刚 :今天讨论的主题是共享经济。共享经济是互联网时代的一个重要特征,贵州省贵阳市抓住这个机会,利用大数据推动经济发展。刚才子沛讲了两个例子,纽约时报100多年的报纸怎么录入进去,他把它变成了验证码,让所有人用验证码进行录入。这是一个很好的创意。但是,产生这样创意的人并不多。 能否把提出问题的人和解决问题的人分开,我认为这是未来创新的一个重要方向。
事实上,杭州的图书馆也好,纽约时报也好,许许多多,包括今天在座的各位都会有问题。但是我们以往的思路是什么?你提出问题,你自己想办法解决。我们没有张总那个能力。但是 贵阳推出了一个“痛客计划”,就是我不管能不能解决这个问题,把社会的痛点提出来,我就是痛客 。这个痛点也许能解决,如果能,我当初提出这个痛点就是有价值的。
比如刚才说的纽约时报100多年的报纸,可能许多的单位都有这个问题。我们搞这个痛客计划之后,把这个痛点提到这个痛客计划上,他不知道怎么解决,但是社会上有很多聪明人来解决这个问题。
今天,我分享一个我自己的痛点,也是亿万消费者的痛点。我们知道今天中国发售的邮包,零售的商品应该是几十亿件。我现在也是淘宝和京东的消费者,我买完东西之后,每天或者每一次消费之后,都要考虑这个盒子怎么丢掉。现在每天消费了多少盒子?扔掉多少盒子?这也是我的痛点,也是社会的痛点。我们有没有可能,有一家企业,有一些聪明的人像发明集装箱一样,可以发明重复使用的小邮盒,这样来解决社会的需求。我相信这一定有人有办法。今天我借助新华网发布我的一个痛点,如果社会响应,我不要今天的知识产权。我告诉大家,如果今天网上的听众听了这个消息以后,请你们关注贵阳的“痛客”网站,你们去申请注册成一个痛客,不要自己去创业。你们把这样的想法提出来,我们给你加上水印,确认这个想法是你第一个提出来的。如果我们和一些有创意的人,像张总这样的人,找到解决方案,最终形成一个产业,你有可能是这个企业最早的不出钱的股东。
一个鸡蛋的故事告诉你政府如何平衡网络经济和实体经济
思客 :现在有一个说法,实体经济比较暗淡,互联网经济红红火火。而一个国家长远来看,实体经济是非常重要的。陈刚书记,您怎么平衡这个比例?
陈刚 :刚才子沛讲了一个观点,工业可以柔性制造,谈到工业4.0。现在消费也有一个消费4.0,但是 工业4.0和消费4.0怎么连接,我认为现在一个重要的思路是要把中间的信息打通 。有些打通,比如说商品的零售,像阿里巴巴这种模式,可以是跨区域的,甚至是跨国界的来完成。但是送鸡蛋这件事情,一定是在社区内完成。我们能不能把社区就近的生鲜超市和家里冰箱的物联网进行对接,这样就形成一个现实和想象的很好结合。所以我认为作为政府来说,我们做的事情不像他们两位那样出很多奇思妙想, 我们需要做的事情就是把他们的想法,由政府搭建平台,让社会用利益驱动的方式实现整个链条的组合,这就是政府要做的事情 。
涂子沛 :这个思路很好。这背后就是实体经济,它有一个衔接,在政府可能正是在这个时代不断往前推进。越来越清晰地看到,政府就是在虚拟经济或者互联网经济和实体经济的节点上能够发挥巨大的作用。
发现问题是人类的智慧,机器没办法做到
思客 :在未来的共享经济时代,更多的是机器替代人的脑力。现在有一种说法是中等收入或者越有知识的人群面临失业的风险越大,由此也带来很多社会上的问题,那怎么解决这个问题?
陈刚 :其实每一次科技革命都是在解放人类的麻烦,帮助人类找到更容易解决问题的答案。互联网大数据实际上是解放人的脑力,接着就产生了一个简单的逻辑关系,许多人会失业。就像我们在几十年前讨论要不要搞大规模化生产,现在看到很多生产线不需要几个人,从原来的手工作业变成规模化生活,确实会造成很多人失业,但是人类社会就是这样进步的, 淘汰一个落后产业的同时,会让人产生新的创新动力,研究社会新的发展机会,所以大家去当痛客吧 。
陈刚:淘汰一个落后产业的同时,会让人产生新的创新动力。姚冠华/摄张跃 :人工智能也好或者科技发展很多奇思妙想也好,我认为逃脱不了三要素:生产力、生产关系和生产资料,只要人们正确的对待它就行。AlphaGo再厉害,是工具,毕竟不是人。所以你把它当做工具,一切烦恼都没有了。如果你把它当做人就出现了比如伦理等很多说不清的问题。所以人们有的时候在区分工具和人本身之间,有时候在这一点上是模糊的。所以人有幻觉,会得病,会抑郁。在这方面来讲,人还是要回归本质,机器是我们创造的工具。
涂子沛 :AlphaGo其实真的不可怕,为什么呢?AlphaGo就当不了痛客,它不会发现问题,它只会解决程序化的问题,它解决的每一个问题都是程序驱动的,而 发现问题才是人类的智慧 。要把发现问题的人跟解决问题的人分开,有些人发现问题,有些人解决问题。那我们人类去发现问题、去定义问题,这是机器没有办法做的,因为这些都是新的,要发现新问题、定义新问题,有一部分问题,重复性的,比如打字员的工作,借书采购员的工作,就可以让AlphaGo去做,实现人类的跃升。
我现在就很想做解决问题的人,比如今天刚刚说的这些问题,那今天就要解决,我们今天站在和世界同步的问题上,美国也面临这些问题,那这些数据到底归谁所有?谁有所有权?谁有使用权?什么时候可以使用?怎么使用?这需要一个方案。刚刚陈书记见到我说你是大数据的布道者,但是今天不仅仅需要布道,还需要解决方案。这个解决方案会帮助中国去把握弯道超车、后发优势的机会,如果我们解决的好,那我们今天跟美国就站在同一个起跑线上了。
大数据带来“弯道取直与换轨”的发展机遇
思客 :您和张总都提到了弯道超车,您认为我们现在真的具备了一个弯道超车的机会和能力吗?
陈刚 :互联网、大数据给了我们一个特别的机会,我认为不应当简单把它形容为弯道超车。因为弯道超车意味着你比别人有更大的胆量,也有更大的风险。 我们能不能换个思维,我们叫弯道取直,我们干吗要跟它一起弯道超车呢?我们能不能修一条直道,直接过去 。所以在这个方面,我认为大数据、互联网给了我们中国这样一个机会,也给了我们这些后发达的,像贵州这样的地区一个发展机会。以前所有的工业文明要建立在物流、制造、金融等基础上,但是现在信息社会,人和人、国家和国家在网络空间距离上是相等的,也就是给我们这些后发达的地区一个新的发展机会。所以我认为贵州该采取的路线是弯道取直。
涂子沛 :不要错过贵州,不要错过贵阳,事实上是不要错过这个时代。今天讲的是弯道超车,弯道取直。我还想在这个基础上提出一个说法就是换轨,重新起跑。原来在互联网这个轨道上跑,贵州和北京相比可能是有差距的,可能差500米,老是追,它是追不上的。但是今天裁判员重新吹哨子,说你们不要跑了,换一个轨道,在移动互联网这条轨道上重新起跑。在这条轨道上,中国和美国、贵州和北京我们是没有差距的,可能5米都没有,完全是并驾齐驱。 这就是今天中国的机遇,是一个换轨的机遇,就是从工业换到数据文明。