导语:
大数据是指数据规模巨大、数据类型复杂的数据集,其本身蕴含着丰富的价值。尽管大数据已成为媒体和专家热议的话题,但其有效利用程度仍然偏低。高德纳(Gartner)咨询公司副总裁兼著名分析师Debra Logan认为,95%-97%的组织和外部研究机构对大数据还只是处于探索阶段,对于大数据的研究才刚刚起步。有鉴于此,太和智库研究员近希撰文对目前大数据应用的场景和领域进行了简要介绍,对未来中国大数据应用的趋势作出了初步分析,并指出当前及今后一个时期大数据应用领域所面临的挑战。
案例一:特朗普并非“黑天鹅”
不少人对特朗普当选大跌眼镜,认为这是一次“黑天鹅”事件,然而通过分析2016年7月26日至11月7日美国大选期间的有关数据,我们不难发现特朗普的成功逆袭并非偶然。根据特朗普和希拉里在不同传媒平台上被热议的内容,通过相关内容抽取所做的倾向性分析,人们得出了二人在选战期间的舆论积极倾向变化图(如图1-1)。
图1-1::舆论积极倾向变化图
从图表中可以看出,倾向于特朗普获胜的比例较为稳定,而希拉里虽然曝光度颇高,但受“特朗普一半支持者都是无耻之徒”的言论、“邮件门”、邪教控国论、与警卫性丑闻等负面影响,希拉里已陷入信任危机,美国民众对其好感骤降。因此不少美国民众抛弃了在三次电视辩论中貌似取胜的希拉里,选择了看起来“更为诚实”的特朗普。
案例二:高速公路拥堵趋势预测
图1-2:全国高速拥堵趋势
图1-3:春节期间易拥缓高速路段
2017年1月18日,新华网联合高德地图,根据往年车流量信息、高速拥堵信息等数据,运用大数据技术对2017年春节期间高速公路的车流拥堵情况做出预测,为人们选择高速公路出行提供参考信息,从而在一定程度上缓解了高速公路的拥堵压力。
案例三:电信大数据的多领域应用
国内电信运营商对于大数据的应用主要集中在基于位置的大数据分析服务、针对网络广告的潜在客户挖掘服务、征信服务、行业精确营销服务以及防诈骗等领域。以打击电信诈骗为例,江苏省公安厅副厅长程建东表示,自2016年8月使用线上恶意呼叫电信拦截平台后,平均每天拦截诈骗电话2.1万次,电信诈骗案因此同比往年下降84.6%。通过应用大数据技术,警方有效提升了打击电信诈骗的能力。
案例四:电网运营智能管理
美国加州电网系统运营中心管理着加州超过80%的电力供应,每年向3500万用户输送电力2.89亿兆瓦,电力线长度超过4万千米。该中心采用Space-Time Insight的软件对电网运营进行智能管理,综合分析来自气象、传感器、计量设备等各种数据源的海量数据,预测各地电力需求变化,同时进行智能调度,平衡全网电力供需,并对潜在危机做出快速响应。
案例五:心脏病致死几率评估
美国麻省理工学院研究人员约翰·古塔格(John Guttag)和柯林·斯塔尔兹(Collin Stultz)创建了一个计算机模型,用以分析心脏病患者的心电图数据。他们利用数据挖掘和“机器学习”技术筛选海量数据,发现心电图中出现三类异常的人在一年内死于二次心脏病发作的机率比未出现者高1-2倍。相比传统筛查方法,这种有大数据技术介入的新方法能够识别出更多心脏病致死高危病人。
未来随着大数据技术的不断完善升级以及在医学领域的广泛应用,医生将能通过对患者健康数据信息的深度挖掘让诊断和治疗更为精确。比如服药,将不再遵循传统的“成人每日三次,一次一片”的方法,而是通过检测服药者血液中药剂是否已经代谢完毕自动提醒其再次服药。
据统计,2016年近 40%的中国公司正在实施和扩展大数据技术应用,另有30%的大中型公司计划未来一年内采用大数据技术。随着各种相关政策落地以及大数据应用领域的突破,预计中国大数据将在2017年迎来大发展。
(一)基于大数据技术的人工智能得到更加广泛应用
2016年,无人驾驶汽车试驾成功,AlphaGo在围棋对弈中胜出。随着人工智能技术的日益成熟,未来公司企业将越来越多地运用甚至是依赖于人工智能技术。虚拟助手、智能机器人、智能顾问、自动驾驶汽车等多种技术都将得到更为广泛的应用,而这一切都与大数据技术的发展与支撑密不可分。
(二)“机器学习”技术成为高科技投资重要领域
随着大数据分析能力的提升,很多企业已开始进军和投资“机器学习”技术领域。高德纳咨询公司称,“机器学习”是2017年十大战略技术之一。“机器学习”和人工智能系统正在超越基于规则的传统算法,创建出越来越多能够理解、学习、预测、适应甚至是自主操控的系统。
(三)智慧城市建设力度进一步加大
截至2016年6月,全国95%的副省级以上城市、超过76%的地级市,总计逾500座城市(占世界智慧城市创建总数一半以上)在政府年度工作报告中明确提出将要或正在建设智慧城市。中国已经成为世界创建智慧城市的主要试验场,并引起美国、新加坡、欧盟和其他金砖国家的高度关注。此外,在可预见的将来,中国约70%的大数据需求将集中于政府应用和金融领域,而政府数据也将成为一项重要的国家资产。
(四)预测分析工具将倍受重视
根据2016年调查显示,目前虽然仅有29%的公司使用预测分析技术,但预测分析工具在帮助企业把握商业先机、发掘潜在商业利益上所发挥的作用正在日益凸显。未来随着预测分析技术的日臻完善,企业将会越来越意识到运用预测分析工具的必要性和重要性,预测分析工具的使用数量也必将大幅增长。
(五)企业将普遍运用大数据技术强化网络智能防护能力
许多企业已将大数据分析纳入安全战略范畴,特别是在网络防护方面。网络安全日志提供了以往发生的未遂网络攻击信息,利用这些数据,企业可以有效预测并防止未来可能发生的网络攻击。目前,一些公司正将其网络安全信息和管理软件与大数据平台结合起来;一些公司则选择向能够提供大数据分析服务的公司求助,为其网络安全防护提供帮助。
根据高德纳咨询公司 2016年7月的研究结果,大数据业务创新已成为“新常态”,但与此同时也有诸多技术领域亟待突破创新。
(一)智能数据挖掘(Smart Data Discovery)
在过去五年中,基于视觉的数据挖掘工具已经颠覆了传统的商业智能(BI)和分析市场,其易于使用,并且能实现数据的快速组合,让用户在数据中找到新观点,对未来的一些假设进行可视化探索。虽然智能数据挖掘在探索数据的方式上一直不断变革,但许多与数据制备、海量复杂数据组合模式探索、见解分享相关的活动仍在很大程度上依赖人工完成。
(二)情感运算(Affective Computing)
情感运算技术能够感知用户情绪状态 (通过传感器、麦克风、摄像机或软件逻辑),并通过执行预定指令做出回应反馈,比如与用户之间的交互,或向用户适时推荐符合其心情的视频等。目前,与多个传感器输入相结合的情感运算技术仍停留在早期概念验证阶段,其难点主要在于寻找出扩展和增长记忆力的算法。
(三)自动驾驶(Autonomous Vehicles)
自动驾驶是指车辆不需要人类干预,借助各种车载技术和传感器,如雷达、摄像头以及控制系统、软件、地图数据、GPS和无线通信数据等,自行驶抵预定目的地。传感器、定位、成像、引导、人工智能(AI)、映射和通讯技术的不断进步,以及先进软件和云计算的快速发展,已经让自动驾驶成为现实。但由于自动驾驶技术本身的复杂性,加之研发成本居高不下,已严重影响了它的可靠性和可购性。2016年5月7日,美国佛罗里达州发生一起车祸,事故车辆型号是特斯拉Model S,车祸中死亡的车主当时使用的正是自动驾驶模式。
(四)自然语言问答(Natural-Language Question Answering)
目前,非对话式、以信息为中心的问答已经实现(例如谷歌Now和Siri),但根据用户个人的对话、环境等完成一段简短对话的技术还不是很成熟,仍面临很多瓶颈问题,如:对有疑问的语句给出合理解释,把未知范畴匹配到已有的知识库中,从有限答案(甚至是一个答案)中做出选择等。按照当前的关注度、发展速度以及技术能力,预计解决这些问题至少还需要5年时间。
信息技术的飞速跃进已将人类拖入大数据时代,加快发展大数据技术是我们对这个时代必须作出的回应。未来,在数据与数据的碰撞、数据价值的深度开发、数据应用技术的落地等方面存在着巨大的想象空间,而大数据技术与各行业、产业的融合也必将产生强烈的化学反应,促使相关行业、产业发生颠覆性变革。与此同时,大数据领域也日渐成为强国竞争博弈的一个重要战场。面对大数据时代的滚滚巨浪,崛起中的中国必须直面挑战,把握机遇,在突破创新中,抢占先机,赢得主动。
太和智库原创文章,转载请注明出处。
—————————————————
国以人兴,政以才治。太和智库,关注时代需要。
微信公众号:taihezhiku