市场研究协会 会员登录 | 入会申请
  人物专访
人物专访
  当前位置:网站首页 > 人物专访 > “大数据”问的是拉登在哪
“大数据”问的是拉登在哪

        沈浩老师对于很多人是即熟悉又陌生,熟悉的是学者、传媒大学新闻的教授,调查统计研究所的所长,一位传播学博士。外界更多的是数据挖掘的专家、数据可视化追逐者、商业智能的探索家以及围绕他的所有光环,陌生的是不苛责但却严格的老师、最温暖而浪漫的丈夫、最慈爱并为之骄傲的父亲、最专业的游者、随性简单、快乐并执着的大大男孩儿,更是一位亲切的聊者。或许是头一天没有休息好的缘故,沈浩老师的烟几乎一根接着一根,我们的谈话持续到他下午央视的培训,并没有顾上吃饭,至今想来都特别抱歉。每一次近距离地跟我们的精英们接触,收获的都不止是他们传递的信息,还有掩藏不住的素养与魅力。于是,我比之你们亲爱的读者:真的是无限的享受与无比的幸福。短暂的一个多小时的时间如同做了一个轻松、舒适的SPA和暖暖的日光浴。
        许多年前,沈浩老师就做着和今天的明星一样的事:“跨界”发展。那时市场调查行业刚刚成型,沈浩老师以一个学数学的身份加入进来,身兼两职,一边在学校教书,一边做企业顾问。他用专业技术帮助企业解决问题,用企业丰富的案例反馈教学。在这期间,一方面是运气,一方面是眼光,他最先接触并且引进了很多重要的数据挖掘方法和工具,专家水平的先进研究方法与业余爱好者般的强烈兴趣恰巧结合在一起,为以后的发挥打下了基础。
        如今大数据时代终于来了,沈浩老师看得很清楚,大数据的本质就是数据挖掘,熟悉数学和计算机的他做起来得心应手。但回归市场调查行业,谁能做大数据,怎么做?他说,大数据时代没有一个单一的学科能解决问题,大数据的方法也不是每个人都能学会的,市场调查的实证研究路径与大数据的自动化商业行为有着本质差别。
        市场调查行业究竟如何与大数据时代接轨,沈浩老师没有给出直接的答案。但是回顾自身经历,他总结了三点经验或许可以为我们提供借鉴:一个是团队的重要性。在学科领域里,他和中传新闻传播学院教研室的老师们一起合作了20多年。二是平台。对于任何人平台都很重要,但是走到一定程度,要在平台之下有自己的兴趣和独立的发展方向。第三,事情都是积累出来的。回过头来看,只要踏实在一个领域里钻研,他说,再怎么样也会熬成专家。
        也许有意,也许无意,他抓住了现代最流行的几个关键点,数据挖掘、文本挖掘、网络分析、数据可视化、自然语言处理等等。积累到一定程度,知识有一个爆发点,人的能力也有一个爆发点,沈浩老师认为,这个爆发就是知识可以更好地帮助、带动专业领域里的其他人,这也是最重要的一点。
        跨界进入市场调查
        1986年从北师大数学系毕业的时候,沈浩老师和许多人一样立志要学计算机,报考的是航天领域里的导弹可靠性工程,用他的话说,“我们那年代的人都是振兴中华的热心青年”。可惜外语差了4分,没考上,只好服从分配。但是他依然对计算机专业心心念念,想着也许能去气象学院这样的地方,但是最后却被分到了北京广播学院,也就是现在的中国传媒大学,一个他当时没有听过的地方。在北广的工程基础部,他前前后后教了10年数学,所有课程都教了个遍。基础部那时也买了一台XT的计算机,现在看起来没什么,还是8086、Apple2那样的小计算机,但是大家把它“像宝贝一样存着”。
        1995年后,基础部的教研室在柯惠新老师的带领下开始涉足国内早期的市场研究领域,与市场研究公司有了广泛接触。2000年沈浩老师去香港做访问,认识了著名传播学者祝建华博士,在研究技术和手段上受到了很大触动,尤其是接触了所谓的“网络研究”。回来以后,他开始主攻市场研究的分析方法和统计模型。这段时期还他有一个很有意思的经历,当时他在丰凯兴帮助他们做电脑集成的网络布线,这才发现这是一家市场研究公司,于是就跟他们说起来他也懂这个,还讲了一个很重要的技术叫联合分析(Conjoint Analysis)。从那时候开始,他在市场研究公司做各种各样的培训,推广一些先进的研究方法。后来还担任了益普索公司的首席技术顾问,这一做就是近10年。
        2003年,市场研究协会的成员们在探讨发展思路的过程中提到了“数据挖掘”,他意识到数据挖掘将来会是一个非常有用的东西。在之后的两次沙龙上,因为没人能讲数据挖掘,所以沈浩老师承担了这个重任,用的还是从网站上搜集来的外文材料。2004年,广州移动希望启动数据挖掘项目,沈浩老师帮助他们解决问题,同时接受他们的委派到香港的一家电信公司CSL做培训,当时行业主要强调还是数据分析、建模以及市场细分等等,但是企业超前了一步,希望沈浩老师能够帮他们分析企业内部的大量数据,培训也因此慢慢脱离了市场研究拿着问卷做实证的体系,转而基于海量数据的挖掘分析。
        从2003年开始,作为早期涉足数据挖掘的人才之一,沈浩老师见证了这个过程中很多新技术的诞生,比如商业智能、经营分析、数据可视化,包括跟计算机相关的一些新应用,比如智能系统等等。有一些很重要的软件工具,他是国内第一个看到、买下来、推广的。在教学领域里,他也把这些东西推荐给学生,虽然他的学生都是文科出身,编程属于过高的要求,但是他至少可以帮助他们实现“用到最适合他们的最棒的工具,能够做出超越他们自己的东西”。掌握很多分析软件和工具在他自己来说也是学习和解决问题的重要方法,因为数据挖掘本身是有一套非常完整的方法论和工具的,这样才能很好地解决商业问题。
        数据挖掘这种发现知识的能力,也改变了他过去研究的思维和方式。“过去都是实证,领导说怎么样或者市场怎么样,我们去验证他,但是现在都是发现知识。”通过神经网络算法、决策树、预测技术等等令人兴奋的新方法,数据自身价值的价值凸显出来,这也是沈浩老师对数据乐此不疲的原因。
        “我做的事情就是把数据变成信息,把信息变成知识,但是我更强调怎么把知识传播给别人,形成集体的智慧,所以我又能说还得又能做,有些人只说不做,有些人只做不说。”教书的时候他毫无保留,只要有新东西一定教会别人;2010年有了微博,他写了微博传播机制30讲;他曾经一天接受五六家移动公司的讲座邀请。
         “大数据”问的是拉登在哪儿
        早期社会上没人谈数据挖掘,沈浩老师已经着手钻研,现在所有人都在讲大数据,但是他清醒的看到很多人对大数据的本质是误解的。
        虽然他自己也经常说,现在终于盼到了大数据时代,但是究竟为什么大数据这么火?“第一,大数据到来的现实是不可否认的。第二,今天的大数据对社会产生了重大的影响,它是社会的东西。第三,大数据会影响商业,它是商业的东西。”大数据深深嵌入现代社会生活的特点使得很多人文学者、商人都可以从不同角度大力提倡或阐述大数据,但是本质上很多人是误解大数据的。到底什么是大数据,谁懂大数据?有人问:“沈老师,你是不是大数据专家?”沈浩老师说:“其实我也没见过大数据,因为对我来讲是大数据的,对企业就是小数据,对移动就是更小的数据,对GOOGLE那就不算数据,所以什么算大数据?其实大数据的本质就是数据挖掘。” 
        大数据时代最大的特点是采用智能、自动和半自动化方式去寻找隐藏在数据中的那些事先不知道的趋势、模式和相关性。这其中有几层含义,首先,大数据挖掘是从IT的思想去思考问题,尽管人的思想仍然是重要的。其次,大数据从狭义上可以理解为一种发现知识的方法,这些知识是不可能事先知道的,比如通过分析发现女人爱看韩剧,这不是需要海量数据挖掘做的事。更重要的是,大数据不寻找average,如果需要average,可以用样本代替,比如市场研究解决的“平均人”的问题,就是通过样本去追踪北京人怎么样、高学历人怎么样、女大学生怎么样等等,但大数据问的是:拉登在哪儿。“只要拉登敢打电话、敢发邮件,就可以从海量的信息中把他找出来,卫星追踪他,导弹就下来,这就是精确打击。而企业完全可以在大数据时代精确打击每一个消费者,分析每一个人的行为特征,利用数据科学和网络科学去定位市场。”
        过去移动有大数据,淘宝也有大数据,但是跟我们没关系,即使有关也是为了解决企业经营的问题才去挖掘数据。今天通过大数据分析,人们可以知道哪儿发生了流感,可以预测票房收入,可以抓取全部的社会情绪。比如现在大数据主要的兴奋点微博和facebook、twitter,想象一下,微博是不是最丰富的人?我不了解你,但我知道你关注的是谁,我不知道你是什么样的人,但你的粉丝会知道你是什么,包括你的价值观、生活形态、消费行为等等。因为人们的社会化生活已经成为现实,人们需要在线交流。在这个领域,大数据不光是对数据进行的分析,还涉及到非结构化数据,也就是文本,以及视频、语音、图片的分析。
        这就是大数据,我们可以算计每一个人,因此就可以计算社会,所以就产生了社会计算(Social Computing)。过去社会学的随机抽样被称作“绞肉机”,是因为它剥离了人的社会情景和关系去研究这个人所属的群体,所以每个人都只是样本,个人行为不被关心,人们只关心average的群体行为,也就是过去社会科学所谓的整体论思想,但是还有一种自然科学的思路是研究分子、原子的组织结构和无规则运动,以及它们之间的相互关联呈现出的群体形态。实际上,人在做选择的时候往往也依据为他人、依据关系的存在,比如因为孩子成为一个母亲,因为丈夫成为一个妻子。关系决定了角色,从网络关系去捕捉社会关系,这种社会网络分析就是社会计算一个很重要的理论。
        市场研究要拥抱大数据
        分析数据、写报告,解决微观具体的问题,在沈浩老师看来这是典型的市场研究,也不可避免的是后见之明。市场研究也需要预测,但预测靠的是统计技术,依然是在需要寻找过去的规律、外来的东西。但是今天人们更多的需要的是洞察力(insight)什么叫洞察?就是寻找到转折点,“社会的变革不是靠正态的,是靠变态的转折点去改变的”就像一个人的生活一样,有了孩子这个转折点,生活状态就完全改变。对于一个企业来讲,这个转折点可能就是一个人、一个产品,比如乔布斯一个人,一个iPad,一个iPhone,就改变了三大产业。如果能够了解造成转折点的原因,很多社会问题便会迎刃而解。举了例子,比如公交一卡通,一张卡片记录了人们所有的交通刷卡行为,如果数据能够被捕捉到并且分析和展现出来,那么北京交通问题的缓解和控制就会变得异常简单,这就实现了人们经常说到的“智慧城市”。
        那么如何捕捉这种转折点呢?数据挖掘就有这样的能力,因为它会自动从海量的数据中寻找到这些转折,只问关系不问因果,不需要证明,只要事情发生了、有商业价值就OK了,但是实证研究则很难做到这一点。
        现在的很多互联网研究都没有包括市场研究公司,比如苹果,它在一定程度上是不需要专门研究受众的,因为它的iTunes, AppleStore都可以对用户进行分析。于是传统市场研究公司的事都交由机器去做,而市场研究更多的是帮助传统的市场、企业去做研究,目前依然是为了解决问题才去设计问卷、收集数据的。
        将来,如果技术和投资回报达到一定程度,完全可以采用全网检测。抽样检测将不再需要,因为人们所有的行为都已经被记录下来,也不在是为了做分析而去收集数据,而是商业的、自动化的数据积累和生成。“这个生成的数据可能越存越多,也许越多越有价值。今天没有价值,将来有价值,今天是噪音、是垃圾,明天新技术就可以从低密度下发现有价值的东西。”
        市场研究需要创新,需要拥抱大数据,但人才是个问题。大数据需要的更多是偏向IT人员,而不是策略研究人员。“大数据不是一般人能学会的,一定要有IT技术。”因为人的能力是有限的,譬如在捕捉上千个字段,光靠人眼无法识别出哪个字段是重要的,只能是汇总并部署在电脑上,由人来制定分析规则。
        有一天,沈浩老师和他的一个朋友说,一定要学R。他也在微博上感慨道:“有个语言叫R,未来会改变世界。”现在他甚至希望自己的儿子也能学会这些新技术,只要他有兴趣。
        数据挖掘是业余爱好
        拥有众多身份和选择的可能,沈浩老师对于什么是自己的主业的看法既谦虚又坚定,同时也很酷。他说,主业做老师,是因为好为人师,不愿意干别的也干不了别的。至于数据挖掘,那是业余爱好。如果做企业的技术顾问需要坐班,他宁可不去。“学什么只会了30%,如果能够触类旁通,就会了50%,如果能教给别人、别人听得懂,才会了70%。”
        作为老师,他本人的学科背景带来的很大优势就是他看到什么东西基本都能马上学会,但是他的学生都是文科出身,不是数学也不是计算机,所以大多数人还在传统研究领域学习,真正进入到大数据的很少,只有一部分人可以做到数据可视化。他不光要面对学生的困惑,和他相对的老师圈子都是有困惑的,彼此交流有困难,做事风格也不同。但是沈浩老师并不灰心,“我不能说我这是数学,只能说是数学的思维方式,因为更重要的是数据的应用能力,”他说,这个专业要掌握的东西是研究方法,这套东西在数学系能做,在经管系也能做,做什么都行,就是因为有自己的一套工具和方法。不会没有问题,思想方式跟进了就到了。也许这听起来像是技术工人的“工具论”,但是在大数据时代,人们须依赖于这种工具来帮助解决问题。不过他还是希望在中传的媒调专业能成为国内最好的专业,在定量研究方法上获得一定的影响力。其他高校的新闻传播学都没有高等数学、线性代数、概率论这些课程,但是他们8年以来都在让学生上这些课,所以有一种说法是,他们把理科的学生当文科培养,把文科的学生当理科培养,困境是存在的,但总归能够培养出学生数字功底较深的新闻传播学学生,正如当初跨界发展的沈浩老师自己一样。
        现在他的工作室里面都是对数据挖掘有兴趣的本科生和研究生们,他也经常办一些兴趣小组或者开一两个进修班,博客也成了他的第二课堂。
        兴趣也是他自己最看重的东西。沈浩老师说自己能做、能说,但是不爱写,他觉得任何定量的数据写出来都需要有定性的演绎,像是价值上的判断,这是人家文科和社会科学的优势,自己则不擅长。另外,他总是在追求操作新的技术,总是在向前跑,静不下来。虽然愿意给人讲,但是不愿意写成书,不愿意写就是不喜欢写。“我做事情都是按兴趣做的。我这人从来不会预测未来怎么样,如果说明年怎么样我知道,10年以后怎么样我不知道,但是我可以看到现在讲这些新东西是有收益的,干自己喜欢的事能够带来收益,这是最好的事。”
        他说跟别人比起来,自己的特点是爱玩、比如照相、越野、滑冰、滑雪……“只要是玩的我都行,基本上都不落后别人。”今年3月份下雪的时候,他就带着相机去上课,顺路拍出了非常好的照片,中午下课拿着雪具直接去河北滑雪去了。除此之外,他到过两次新疆、西藏,穿越过罗布泊、海拉尔、珠峰、沙漠,中国大部分地方他都开车去过,去年他还在美国开了7000公里多,今年又开了8000多,走大路也走小巷。他在家基本待不住,经常是想起来就飞到哪儿去玩一玩,带着一台电脑,走哪儿都是讯息。妻子是他在北师大的大学同学,有时也跟他一起去越野,两人兴趣相投。每年年末,沈浩老师都会在微博发上一条,大意是说“今年把挣的钱玩了,明年把玩儿的钱挣回来”。
        学生说他没脾气,他也从不跟家人生气,他说,“不争不就完了吗?”不涉及政治,不擅长权势,不在乎谈价钱,不习惯拐弯抹角,沈浩老师说,“其实我应该去当科学家”,做着一些纯粹的事情,而不是在人文领域跟人打交道。
        他有时也自我调侃“有技术没文化”。尤其在开车在沙漠里的时候,朋友结伴走上三天,大家都是用车台,没有人听他讲数据、讲EXCEL、讲商业这些专业问题,人们都在谈人文、地理、社会、文化,他说,这个时候才知道没文化的人有多悲哀。不过走了那么多地方,每个地方发生什么事情他也看在眼里,经历了就知道文化是什么东西。再加上他有种能力就是迅速地和各个群体、无论穷人、富人交上朋友,朋友多文化慢慢也就有了。

采访/撰文:刘向清/张翕
原话录音整理:摩瑞市场研究公司


友情链接
中国信息协会    国家统计局    涉外调查许可证办理    中国数据分析师官网    APRC    ESOMAR    GRBN    
 
CMRA微信公众号   CMRA微信号

关于协会 | 会员专区 | 招聘信息 | 联系我们

地址:北京市东城区东四十条21号北京一商集团大厦308室 电话:010-64087451,64087991

Copyright 2015-2025 www.cmra.org.cn All Rights Reserved 技术支持:中才智达

中国信息协会市场研究业分会 版权所有 京ICP备18038404号-4 京ICP备18038404号-5