政府大数据开放战略面面观

2015年08月21日
编者按:张耒,太和智库大数据研发首席专家。本文节选自“大数据国家战略课题”,张耒先生为该课题组负责人,太和智库还将会适时发布课题的节选内容,也欢迎各位读者留言指正。文中言论不代表太和智库官方立场。
 

近几年,大数据(Big Data)领域方兴未艾、蓄势待发,逐渐成为社会基础设施的组成部分,就像铁路、港口、通信、水电一样不可或缺。和平崛起的中国,经历了工业化、信息化的高速发展阶段,面对全球大数据化的浪潮,迈入了真正的大数据时代。

 

根据维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

 

大数据是人们获得新的认知、创造新的价值的源泉;大数据是改变市场、组织结构,以及政府与公民关系的方法。当前,各国政府都面临着大数据收集、使用、发布和管理等一系列严峻紧迫的问题。笔者今天想探讨的是,政府开放大数据的必要性及具体建议。

 

联邦政府掌握和维护的信息是整个国家的资产和财富。

——奥巴马 2009年1月21日

 

一、 政府掌握大数据,但缺乏开放大数据的动力

 

我们可能认为谷歌和阿里巴巴等互联网公司是运用大数据的先驱者,但事实上,政府才是大规模数据的原始采集者。政府与企业数据持有人最主要的区别是,政府可以强制性要求人们为其提供信息,而无需进行说服或为此支付费用。大数据本身并不具有价值,而是需要通过创新性分析和应用才能产生价值。但是多年来,各国政府出于自我保护、隐私、创新能力、效率等原因,除传统国家安全层面外,在其他民用和商用领域对大数据的开发和运用少有建树。

 

世界各国的政府都有保密、封闭的基因,面对庞大的公共信息和急迫的民间需求,“数据安全和保密原则”往往成为阻碍数据开放的首要原因。关于数据开放的争议主要表现在以下几个方面:

 

(1) 是否提供原始数据:对诸如失业率、CPI等敏感数据的不同维度、不同标准的解读,可能会引起社会动荡或严重影响经济发展。

(2) 数据安全:数据的开放如何界定安全边界。

(3) 数据颗粒度:数据开放的粒度细到何种程度。

(4) 数据隐私:公民隐私和政府隐私问题。

 

英国首相卡梅伦对此发表观点说:“新的数据权最令人激动。这将确保人民有权向政府索取各式各样的数据,用于社会创新和商业创新。通过这些措施,我们可以创建一个最开放、最负责和最透明的政府。你会有足够多的信息来了解政府是如何运行的、如何花钱的,以及我们的工作成果。使用这些数据、开发这些数据,让我们负起责任来,一起努力,创建一个现代民主的典范。”

 

二、 政府开放大数据的必要性

 

大数据的核心在于对原始数据的加工,并在此基础上通过创新研究,实现产业升级、提高核心竞争力。中国作为全球人口第一大国,多民族共存,市场环境和产业发展充满变化,使得中国成为世界上最复杂的大数据国家。探索以大数据为基础的解决方案,改善现有交通、教育、医疗等传统产业模式,将成为提升国家竞争力的重要手段。

 

旅美大数据专家涂子沛提出:“一个真正的信息社会,首先是一个公民社会”。这种想法和“开放数据运动”如出一辙,“开放数据运动”的倡导者主张政府建立官方机构来公布民用和商业数据,让数据走出政府得到更多创新应用,从而造福社会。阳光是最好的防腐剂,政府向全社会开放所有公共事务的原始数据,包括政府采购合同、公共项目投资、人口与社会保障基金数据、教育、交通、城市规划等,将会使得政务透明、减少腐败、提高效率。

如同工业革命要开放物质交易、流通一样,开放、流通的数据是时代趋势的要求。由此可能带来的潜在风险,比起新技术为人类带来的改变可谓微不足道。

 


上图:开放政府合作伙伴(OGP,Open Government Partnership)的国家分布图

 

三、 世界各国的尝试

 

在这一方面,美国政府做出了大胆的尝试。奥巴马上任伊始即任命了美国历史上第一任首席信息官和首席技术官,对应了他的执政理念:通过公民参与、多方合作,建设一个透明和开放的政府。美国第一任首席信息官维伟克·昆德拉(Vivek Kundra)说:“这是一场数据民主化的运动,我们正在把信息的力量放到美国人民的手中。”他上任120天后,为美国人民建立了一个统一的数据开放门户——www.data.gov,全面开放美国政府拥有的公共数据。就在www.data.gov上线的同一天,个人和团体开发者利用第一批开放的数据,陆续开发了47个应用程序,在城市管理、医疗、教育等领域进行了创新,获得全美好评如潮。截止2011年底,Data.gov共开放了原始数据3721项、地理数据38万项。众多民间公益组织、个人开发者利用数据,开发了1140个应用程序、85个手机app应用,极大地方便了社会大众、提高了美国政府的管理水平。

 

此后,英国、德国、加拿大、澳大利亚、世界银行等国家或组织也纷纷加入“开放数据运动”,出台并实施了开放数据策略。通过开放手中掌握的原始数据,并利用社会资源在大数据领域的创新优势,发挥其独到价值。

 

 

四、 我国政府大数据开放的现状与问题

 

我国政府也在积极推进数据开放,但进展缓慢,并且存在诸多问题。

 

第一,地方政府大数据开放不完全。比如,现在越来越多的电子商务公司需要预测非一线城市的物流状况,在这一过程中首先需要考虑当地交通拥堵程度和天气情况。以交通数据为例,由于目前多数非一线城市的政府尚未开放这方面的相关数据,导致很多公司不得不使用百度地图或高德地图,但后来发现不能再用了,因为一方面与百度合作存在商业机密问题;另一方面,由于交通数据来自于这些公司的统计而非政府公布的大数据,其真实度也不可控。

 

第二,大数据有选择开放,缺乏公平公正。比如最近几年,关于航班动态的应用程序发展迅速,航班管家和飞常准上线时间较早,但却被后来居上的航旅纵横快速反超,其根本原因之一在于航旅纵横是由中国民航信息集团开发的,并垄断了这个行业的大数据。由此可见,数据开放的不公平必将造成相关行业发展的失衡与不公平竞争。

 

自2014年3月将“大数据”首次写入《政府工作报告》以来,李克强总理在多个场合提及这一“热词”。在今年年初贵州考察“北京·贵阳大数据应用”展示中心时,他指出大数据为政府决策提供第一手科学依据,实现“人在干、云在算”。在他今年主持召开的国务院常务会议上,“大数据”被部署了5次。

 

 

8月19日召开的国务院常务会议通过《关于促进大数据发展的行动纲要》,这意味着我国大数据发展迎来顶层设计。李克强总理强调,制定大数据行动纲要,要突出围绕“政府大数据建设”和“创造健康发展的大数据环境”这两项核心内容展开。

 

五、 针对我国政府开放大数据的建议

 

19日召开的国务院常务会议上,李克强总理说:“有一些引导社会经济发展的数据,不涉及国家秘密的,都应该向公众开放,以方便大家使用。”全球知名咨询公司麦肯锡指出,大数据是“创新、竞争和生产率的新边疆。”如果没有信息的开放,大数据将是无源之水。李克强总理深谙此道。从另一方面讲,相关数据的开放,也会倒逼政府数据发布的真实性和规范性。

 

中国的大数据战略已经在大数据行动纲要里清晰阐述,凸现了共享、开放和安全这三大关键词。首先要实现所有部门的数据“共享”,其次是要尽量“开放”,同时要完善产业标准体系,依法依规打击数据滥用、侵犯隐私等行为,让各类市场主体公平分享大数据带来的技术、制度和创新活力。

 

对于我国政府开放大数据的建议主要包括以下几点:

 

一是建立完善的法律法规体系,诸如美国《信息自由法》、《开放政府法》等法律对于信息公开的约束和保护。

 

二是各部门建立数据治理的专门机构,重点在于数据定义的一致性和数据的质量,同时形成数据管理、数据决策的施政理念。

 

三是鼓励大数据创业创新,利用政府公开数据进行研究和奖励。

 

四是加强数据隐私保护,这也是大数据时代的重大挑战。

 

大数据行动纲要的发布对于提升创业创新活力和社会治理水平,对推动政府数据开放将起到积极作用。大数据的海洋波澜壮阔,中国和世界各国站在了同一起跑线上,都在扬帆起航,大数据战略必将成为中国的国家战略。

 

太和智库原创文章,转载请注明出处。
—————————————————
国以人兴,政以才治。太和智库,关注时代需要。
微信公众号:taihezhiku