谢谢主持人,谢谢主办方的邀请,其实只要介绍我是上海大数据联盟的常务副秘书长就可以了,今天我分享的主题主要是大数据和产业创新这块领域,我在这里给大家推荐一些对于大数据领域的一些认识,在这个领域里面为大数据企业做了很多服务。从我自己做大数据联盟最大的体会,今天是在交大,我们联盟里有一家企业,研究生二年级,三个人创业,前年开始做,去年创业平台做的不错,一个大数据的竞赛平台,这个平台去年大概估值一千万,在这个领域里头,行业也对他认同,今年以来承担了大量的大数据竞赛,一系列大赛奠定了平台,他们今年下半年又要进行再一轮融资,现在这几个小伙子已经休学了,其实包括在这个时代,确实有很多人在紧紧把握互联网+ 和 大数据+的风口。这个领域里头有一大批的热血青年,时不我待型的,还有没日没夜的人,周六周日工作,节假日也工作,很多会议他们都是晚上开的,这个领域像打了鸡血一样,关键是内生动力,这个时代是创造奇迹的时代,而且是自我实现梦想的时代,这样的话大家都有内生动力,为自己干活。
接下来给大家简单介绍一下这里的一些体会,大数据时代已经到来了,前面说了创业的情况,大数据如何改变产业,大数据时代的到来,大数据的风口已经到了,大数据归纳为信息时代,计算机时代、互联网、大数据时代,自己所在的单位是上海超级计算中心,前两个时代,互联网时代中国不占优势,而且是跟随者,习总书记2014年提出来了信息化网络安全强国战略,在计算机和互联网领域,我所在的超算中心是全国最大的计算能力的机构,计算腾空全球第一,但是我们的核心芯片用的要么就是英特尔的要么就是AMD的,我们的操作系统也和人家没办法比,所以在这块领域底层的东西我们还是用外面的东西,互联网时代也是一样,一系列的东西都是外国的标准,从本质上来讲,我们虽然这波互联网也好,其他的东西发展的这么快,但是我们的底层东西有欠缺性,网络强国的战略提出是非常有道理的。但是我们看看大数据时代,和国际上的时间点是差不多的,其实2012年号称是大数据元年,中国其实2013年的时候大数据可能前面专家对于数据的理解更深刻,大数据时代这本书是2013年的时候看的,后来一系列的传播数据跟随起来了,我们在数据生产、数据消费,我们有巨大的应用场景,这两个领域绝对是世界顶尖的,为什么说是风口,风口不到的时候做一件事情,英雄无用武之地,陈天桥是互联网领域顶礼膜拜的英雄人物,31岁的时候做到中国首富,凭借传奇这款游戏成为了互联网领域的泰斗级人物,后来要做一个盛大盒子,05年的时候投资了三十亿打水漂了,当时风口没到,技术上利用的网络带宽,用户体验比较差,而且政策不允许,当时做的盒子和小米盒子百度盒子功能差不多,现在的话正常的现象,在我们家里有线电视从去年已经不用了,现在从百度盒子解决一切问题,因为有技术有政策,风口真的就到了,以前是没有的。在下一个风口是猪都会飞起来,这是有道理的,而且大家看看时运还是能力,70后在上海,我们大部分人被时代推上去的,我们要结婚要买房子,被迫个人资产上升,这是能力还是时运,打一个问号,时运和能力是共同的,有一部分人选择了这个行业,比如说马云,自己选择了这个行业,但是大部分人是在这个风口上,我们还是信用有了互联网和大数据,我们在风口上把我们吹起来了。大数据技术里头,几个背景我们也可以看一下,技术设施的发展,2011年的时候有一款智能手机,价格一千块钱以下,这是一个因素,智能手机价格下降了,对我们来说他们用得起移动终端,为后来的移动互联网的发展是一个重要的因素,还有我们的流量价格也在大面积下降,那个时候如果放在五年前用彩信发短信大家还要犹豫一下,现在用流量已经不用什么钱了,极大的促进的移动互联网的发展,还有云计算的发展,现在的互联网云计算这个东西,就像水和电一样,水龙头一扭就出来了,现在所在的超算部门就是云计算,存储在云端,还有我们的大数据也是提供这样一些服务,还有我们的计算能力,千万不要忘了巨大的计算能力是背后能够主导和推动大数据真正发展的重要因素,在贵州现在做了一个天眼,就是用背后巨大的超算支持,如果在座的各位同学喜欢看美国大片的话,经常看到天眼系统在全世界范围内抓一个人非常方便,背后有非常巨大的计算能力,云计算、大数据、超算构筑了这个时代的发展。
还有就是社交网络,QQ,到了后来现在使用微信,但是最近一段时间,从去年开始,昨天和几个同学一起聊天,他们说马化腾现在一直忧虑,下一个社交媒体到底是什么东西,所以他们居安思危也是有道理的,但是无论怎么样,我们社交网络的信息推动了我们整个数据的发展,前面有一个专家图形上写的很清楚,从社交网络里头我们可以看到每个人的行为路径每个人的位置信息,甚至每个人的兴趣爱好,腾讯的人和我说,他们掌握了每个人的社交数据,而且是非常真实的,所有的应用场景非常真实,点对点的谈话,可能有些话是含糊的,但是微信的聊天记录和文档是非常真实的数据,现在数据已经形成一种垄断的趋势,在国内BAT绝对垄断,这个生态我们称之为闭环的大数据生态,上海现在做的大数据交易所,今年4月1号成立的,这是中国第十三个大数据交易所,最早成立的是在贵阳,交易所模式是开放的大数据生态系统,开放的生态系统从我们的理解最近遇到了很多困难,待会儿还要去谈这个事儿,现在的交易量很低,贵阳的大数据交易所流水交易就一两千万,实际交易还低于这个数字,所以这个数据未来共享还是交易还是说另外一种模式,现在可能正在探索。
最后一个结论是风口是到了,之后讲几个我理解的大数据改变产业的例子,改变产业肯定是一个工业互联网和工业4.0,甚至我们叫智能制造2025,如果各位同学可以关注,最近在整个产业链生态里头,从国家发改委、工信部,以及上海,工业互联网将有巨大的投入,这个领域做工业制造、工业大数据有很多潜力,原来讲的例子就是现在工业互联网里头的智能制造,其实是个性化需求的一种制造模式,定制的模式,家具衣服都可以定制。
第二,改变了经济发展模式,提供了一种新的模式,像共享经济,各位在座有没有用过映客的,绝对就是共享,共享你的生活共享你的颜值,有人报道,未来五年中国会形成一千多位网红,网红年收入会超过一千万,网红很奇怪我也很奇怪,我看过映客,里面有一些人就是靠着网上和大家聊天,把自己打扮的很漂亮,通过这种共享居然一天也能有一万块钱的收入,很奇怪,有七八万人关注她,告诉大家眼睛在哪整的,双眼皮在哪割的,这个互联网林子大了什么鸟都有,而且这些鸟都有消费能力,构建了这样一个互联网消费群体。
第三个改变了政府的治理模式,最近大家也有体会,最近我们上海在做数据开放的过程当中,只要推动数据开放,政府是一个open的,未来在公权和私权的界定方面,从大数据数据开放和隐私界定是一个契机,在我们这样一个国家,以前有点忽略,领导叫我们干什么就干什么,政府叫我们干什么就干什么,现在这个时代可能有一些更多的想法,为什么要这么做,这么做的依据是什么,政府必须把数据开放出来,数据开放过程当中现在遇到的困难和障碍都存在,现在政府数据不停开放,但是最后有效资本也不是特别多,问题就是我开放出来的数据,万一数据有高手整合一下,导致我无意识泄露了秘密,谁来给我免责,这是很大的问题,我们一直呼吁第三方机构,一直探讨这个问题,怎么样确权,书记的第三方评估免责,这些都是现在存在的困难。
改革的一些具体产业的应用案例,这是精准营销的案例,线上线下都有,其实很简单的描述就是最开始把个人的情况收集起来,描述标签画像,下一步把我们可能需要的产品,在我们可能的情形下,给我们进行推送,这就是精准营销,无非就是现在数据量大了,这个过程当中实际上把供给端和需求端对接,政府是喜欢做这个事儿的,在广义货币不增加的情况下,增加货币的流通量,大家可以想像,我们的通货膨胀不增加,但是货币流动增加,经济活跃度就会增加。
第二个案例就是医疗健康,基因大数据,未来有巨大的应用场景,基因大数据分三游,上游是测序仪器,第二个是测序的服务提供商,第三个是测序服务的应用市场。现在国内数的出来的做基因测序基本上60%—70%都是华大出来的,上个月的15号有一次基因大数据的活动,做演讲的嘉宾里面有三位居然都是华大出来的,有一支团队是2013年华大出来的,经过两年多的创业,现在估值六十亿,因为有一些好的算法,还有巨大的存储,而且不仅仅做测序服务,还有一定的测序提供商的部分,因为市场大了以后,现在投入也非常大,我做了一个简单的梳理,在测试提供商这块,中国现在有150多价测序服务商,这就导致了市场有无序竞争,野蛮生长也是对的,到后面逐步规范。应用市场看两个方面,一个是管生一个是管死,管生就是婴幼儿怀孕期间的产前筛查,准确率还是比较高的,而且某种程度上测男测女比较准,管死就是靶向治疗,说简单也简单,不增加药物的成分,只不过是第一时间更快速的发现病人肿瘤患者的靶点,第一时间发现了,没有增加药,只不过快速发现靶点,因为基因测序时间比较短。这是BAT在健康大数据的布局,腾讯主要做线下部分和互联网对接,对接的是线下的医生集团,做互联网医生,阿里主要是和药品监管合作,这个平台可以监管所有药品的生产流通消费,百度医生基于自己的搜索引擎和百度贴吧做的一些工作。
金融领域非常好,今年四月份,蚂蚁金服的估值已经四千亿了,相当于交通银行A股的市值,生态里头以大数据为基础的信用体系是最基础的最核心的东西,还有大数据平台,阿里自己做了一个大数据平台,在开源的基础上做了,构建了自己的信用体系,芝麻信用,大量的数据背后几秒钟可以授权,非常方便,而且坏账率极低,支付宝颠覆的是银联之间的转帐,支付宝转帐不需要收费,银联提出了挑战,征信其实是把我们的信用卡体系颠覆了,余额宝最早的时候颠覆了银行的借贷体系,这块东西对金融行业是一个巨大的颠覆。我们联盟里面有一家企业是聚信立,做个人征信的,数据来源有六个板块,一个板块运营商的数据,个人通信数据,还有一个就是我们的电商消费数据,还有网银的消费数据,还有个人学历数据,还有公积金和社保数据,最大的力量在于互联网爬虫技术,这就导致了现在是目前来说,个人征信,给P2P平台和银行的中小贷机构用的,所以提供数据,这样的平台日访问量已经超过了十二万,一个月大概流水能够达到七八百万,对于一个只有九十人左右的团队来说已经非常优秀了,现在可以实现自我营收了,他们目前最大的成本就是九十几个人的用人成本,有三分之一是技术人员,专门做互联网爬虫的,还有一款各位感兴趣,是企信宝。
车辆大数据,因为有了定位就有行车轨迹,应用场景在于特斯拉推出的几款应用,可以自动召唤功能,我在这里现在可以启动app,特斯拉在遥远的地方无人自动驾驶开过来了,我看到这个消息以后,我一直很激动,小时候看动画片佐罗,一吹口哨马就过来了,现在实现了这种功能,把我们儿时的梦一个一个实现,而且在我们有生之年都看得到。
还有一个大的应用就是保险市场,这个市场非常大,而且我观察下来,所有的垂直行业大数据应用,最终想要快速变现,都必须和金融对接,和保险对接是毫无疑问的,包括传统是按年结算的,但是车辆大数据保险可以按日结算,如果今天出差,接下来不开车,车停在车库里,不需要给保险公司付费,这个模式蛮好的,但是最大的问题就是每天的行车路径要给保险公司上交,这个问题在于保险公司要有诚信意识,要有社会职业道德,不允许把我的数据用于其他用途。还有一个金融犯罪,现在我们有一些诈骗分子,现在水平很高,因为有大数据人才在里面,用一些看似非常平常的注册,我们一注册,可能用用户名和密码注册,我们懒,我们都用一个用户名和密码,把用户名和密码调过去,就在电商网站去试,一万个人当中只要有一个人试出来了,就监控这个人,可能数据库里面有几十万个人,试出来都是准的,然后监控网民的帐户如果没有异常就不采取措施,当出现网银有巨大金额转帐的话,时机就来了,现在账户上出现了异动,第一时间就打个电话给你,哪个银行最近刚刚转帐一千万,我们怀疑这和洗钱有关,我一开始不相信,如果说这个人本身内心当中也有虚的,一千万有点问题,然后这个钱就麻烦了,就是博傻,从里面看时机,一年里面做一单,休息五年都没问题了。
最后介绍一下上海大数据的主要做法和情况,大概五位一体,交易所、联盟、基地、基金、研究员,目的已经做到了交易所,今年4月1号交易所在静安成立,还有我们大数据联盟同一天成立的,最近在杨浦又成立了大数据新基地,现在上海有两个大数据基地,有一个交易所一个联盟,还有几支基金,静安和杨浦都有政府的引导基金,今年下半年成立大数据研究院,现在上海通过SODA大赛,把政府数据拿出来给创业团队用一用,今年发布了第二期SODA大赛的数据集,主题是城市安全,如果在座的同学有兴趣参加这样一次大赛,倒蛮有意义的,去年的大赛吸引了六百个团队,将近五千个人参加,最近有十个团队胜出,前三个团队项目都被产投给跟进了,马上就有风投进去了,今年可能比去年做的还要好,如果在座的感兴趣的话可以参与一下。还有一个大赛是昨天刚刚发布的,大数据联盟和市北高新共同打造的人工智能BOT,一等奖有两位,奖金八十万。大家感兴趣可以做这方面的尝试,决赛的时候由爱奇艺直播的,赛题昨天已经发布了,在图像当中做人工识别,复赛是在行车记录仪上有一组数据,怎么判断交通数据,还有一个题目是超市里头货架上计算商品的有效性和哪些商品应该及时进行仓储跟踪和更换。如果大家参加的话,可以告诉我一下,这是我们联盟的微信号,如果感兴趣可以扫一下,谢谢大家!
|