经济学家钟伟:互联网巨头因数据垄断正在失去初心

2019年年初,反垄断在美国再次进入政治议题中心,最大几个科技公司,如Google、Facebook、亚马逊、苹果可能面临拆分。究其原因,是日渐突出的数据垄断问题,受其拒斥的不仅是消费者和竞争者,甚至可能包括中央银行等政府机构。

作者 / 钟伟 出品 / 公众号“连线2025”(ID:tzcode)

1 数字地球和数字寡头

人们现在经常说“地球村”“地球是平的”。这意味着,从古代的农耕时期到工业文明时期,再到信息化和数字地球时期,不同阶段,人们对于整个人类社会资源的运用和配置,都已大不相同。因此对于垄断和垄断所指向资源的内涵,也早已大不相同。

从农工文明到数字时代,关键资源各不相同

在农业时期,最重要的自然资源当然是土地。如果要在农耕时期有反垄断的话,便是主要抑制土地兼并和集中——抑制土豪阶层和大量流离失所无地农民的出现,使耕者有其田。

在工业化时期,反垄断法就开始出现了——《谢尔曼法》《克莱顿法》和《联邦贸易委员会法》等等。这一时期内,最典型的垄断现象,集中在市场和技术领域。

为了反对市场垄断,尤其是工业寡头的合谋操纵,各国家相继推出了反托拉斯法,防止寡头们相互联合,造成不公平的市场竞争和对消费者的歧视。在防范技术垄断方面,也逐渐出现了专利制度。专利制度问世至今,也有争议,赞美者说它保护了技术、研发、创新;也有说专利法制度“撤掉了追赶者的梯子”。

无论如何,反垄断法与专利法是工业文明时期的两类重要的法律,它指向的是当时的工业、能源或者金融寡头们的市场和技术垄断行为。那么数字经济时代,最为重要的资源是什么?也许是数据。或者说,当下数据垄断带来的危害,和曾经的土地垄断,市场和技术垄断,不遑多让。

传统的六度空间,已骤然向三度空间的演化

传统的工业化时期人们所依存的空间,是所谓“六度空间”(Six Degrees of Separation)。按哈佛大学实验心理学上世纪六十年代的研究,地球上70多亿人当中的任意两个人,大概通过六到七个人,就可以相互联系认识。

六度空间所形成的垄断,不是那么绝对——工业企业即便形成了跨国公司,其市场垄断、技术垄断实质还是一种竞争垄断,这种垄断比较脆弱且不可持续。

后工业文明时期,人类社会逐渐进入信息化和数字化学时期。人类的各种活动被更为紧密地联系到一起,时间和空间被大大凝聚。垄断的程度突然急剧提升,使得空间再度被压缩:“PC+WEB”时期的时候,人类社会的空间已经不再是六度空间,而是三四度空间;到了“移动网络+智能终端”时期,甚至可能是二三度空间。

从六度空间指数级地压缩到到三度空间时,垄断程度的突变现象开始严重加剧:在“PC加WEB”时期,我们发现,行业领先企业已经非常少了,比如说头部的门户网站大概最终只剩下三四家,排在后面的公司市场影响力已非常的衰微;可是进入到移动互联时期,我们突然发现,数字寡头已经猝不及防地涌现。

在移动互联时期,人类社会不再是传统的六度空间,甚至也不再是“PC+web”的三到四度空间,空间变得更为紧密,故而特别容易出现的行业第一名好吃好喝、第二名有吃有喝、第三名之后多数沦落到排队饿死的程度,迫使创新企业不得不在细分市场和行业追求第一名的排位。

这就意味着,前所未有的数字地球、数字经济时期,经济竞争活动已然进入了两度到三度的惨烈空间,能够容纳的头部企业极其少,非常容易形成“赢者通吃”的绝对垄断。

从资源和行政断垄,向技术和数据垄断蜕变

垄断的本意是什么?就是排他性地独占。

比如说对资源的独占,导致了资源配置效率的下降;对市场的独占,导致了市场定价对消费者的不公平。

各种的市场独占、消费者独占、资源独占……叠加起来,又形成了对行业内其他竞争对手——甚至是对供应链的显著负面影响,这些都是垄断所带来的弊端。

通观从工业文明时期到当前数字经济时期,垄断的表现也大相径庭。简要来说,我们大致可以将此其间的垄断分成四类:

第一类垄断称之为自然垄断。例如沙特阿美公司,坐拥开采成本特别低、品质特别好的油气资源。据此,沙特阿美就有可能在边际上形成对全球油价定价权的垄断——这也就是资源型的垄断。没办法,造物主就这么安排了。

第二类垄断称之为行政垄断。在一些计划经济国家,特别容易形成对企业的行政权力型垄断。行政垄断对竞争的扭曲是最为严重的,除非行政权力得以纠正,否则垄断不会消除。

第三类垄断称之为技术垄断。在自然资源垄断和行政权力垄断之后的技术垄断,就是随着后工业文明时期的信息化而逐步出现的。

我们举一个例子:VISA和Windows都曾经长期被美国的司法体系所视为眼中钉,试图对它们发反起垄断诉讼。其中VISA就是典型的技术垄断。

VISA作为信息化早期的一个超级平台,它的技术垄断,简单而言可以这样描述:

一个国家假定有100家银行,那么每家银行都发行银行卡,要使得银行卡能够在各家机构都能够通用互联互通的话,我们需要多少条专线把各个银行的数据中心两两互联呢?

根据数学计算可知:我们大概需要4950条专线,才能够使得100家银行卡能够互联互通的使用。再增加一家发卡行,则需要增设100条专线才能互联互通。

而VISA这一超级平台的出现,则以其银行卡产业的“四方结构”改变了局势:当所有发卡行的数据中心连接到VISA平台后,人便不再需要4950条专线,只需100条专线与VISA平台连接即可。进而再增加一家银行,也只需将专线从100条增加到101家而已。

这就是平台的优势:它能够形成技术垄断、平台垄断优势的同时,还可声称自己大大地降低了市场外部性、提高了交易效率,并增加了消费者福利。

著名的诺贝尔经济学家斯蒂格利茨便曾经说过:在全球范围之内,比较起对Visa提起反垄断诉讼的复杂程度,对Windows发起的反垄断诉讼就简单得像小菜一碟。对VISA等提起凡垄断诉讼的都甚至不是普通的商业机构,而是一些国家的中央银行。可见,应对与处理技术垄断是一件多么艰难的事情。

但垄断没有最复杂,只有更复杂,数据寡头已降临。

时至今日,在数字经济时期,当技术垄断和大数据资源混合在一起,便有形成了数据寡头——这便是我们所说的第四种垄断类型:数据垄断。

数据寡头的特点和原来的Visa或Windows这种技术/平台垄断还不尽然一致:

数据寡头绝对垄断特定行业,比如说支付领域内,可能只有一到两家便占据市场份额的99%,甚至更多。而在传统的线下支付领域,则还有Visa、MasterCard、银联等多家中大型竞争者的存在。

数据寡头绝对封闭地垄断特定行业。百度会哀叹其始终没有形成生态圈闭环,而数字寡头们最擅长的就是“闭环”。数据寡头时期垄断的形式也更多样,并不仅仅是垄断技术、垄断市场、垄断消费者和垄断产品;更重要的是,这是一种超级平台的垄断,导致了一个被称为“闭环”的数据垄断。这足以保障垄断者在垄断中自我膨胀。

如今,数据垄断问题在数字时代变得突出,受其拒斥的不仅是消费者和竞争者,甚至可能包括中央银行等政府机构。

2 新石油: 数据垄断与数据孤岛

在数字经济时代,人们正渐渐地将数据看成是新时代的石油。工业时期的标识也许是电气+煤钢,数字时代的标识也许是技术+数据,也就是今人人人乐道的技术赋能,数据驱动。通俗地比喻,技术象发动机,而数据是石油。

数据资源因其半衰期而稀缺,而非无限

2017年5月,英国《经济学家》杂志刊发了一篇文章,题目名为《世界上最有价值的资源不再是石油,而是数据》,将数据的重要性提到了无与伦比的高度,比工业时期的石油更重要——数据作为数字经济时期的最重要的资源,一旦脱离了它,我们便无从进行各种各样的有效和精准的决策。

数据之所以在现在变得如此重要,是因为它呈现出了不同以往的四个特性:

第一个特性是数据的规模性(volume),也就是我们通常所说的大数据时期;第二个是数据的多样性(variety),以前都是参数化或结构化的数据,现在则是场景化、多样化的数据越来越多;第三个特性是产生数据的速度越来越快(velocity);第四个特性是数据的价值越来越高(value)。

人们还容易看到,在数据寡头的努力下,一座座数据孤岛正在逐渐形成。在当前社会的每个行业内,都有所谓的“独角兽公司”,或者是寡头企业。这便导致了在金融、社交、电商,物流、医疗、酒店、出行等等各个领域,都有各个行业自己的一个或者数个数据寡头。

它们垄断某一个行业内的数据,从行业内来看数据规模庞大,而从跨行业来看则形成了一个个被垄断者占山为王的数据孤岛。这是数据寡头蜂拥而起,构建闭环生态,垄断割据的蔚为壮观时期。

有人可能争辩说——我甚至看到不少数据寡头本身就在说,它们并没有能力去垄断数据,因为数据不能跟石油相比,石油资源是有限的,而数据是在不断产生、不断变化的。

这个理由可能不成立。

数据具有“半衰期”,或者亦可称之为“保质期”,即:

离我们现在时间越久远的数据,它的价值就越低,它也相对可以被废弃;而更具有商业价值和战略价值意义的数据,是越新鲜和越新近的数据。

比如说,最近两三年或者最近几个季度的数据就变得特别重要。同样地,尽管数据寡头倾向于说,其服务的是普惠和碎片化的市场,但高价值客户的二八甚至一九定律仍然有效,因此少部分高价值客户的数据,远远比可能被逐渐湮没的贫瘠数据更为重要。数据既是无限的,也是稀缺的;数据既是垄断的,也是割裂的。

数据垄断和数据的割裂也是并存的。

在数据垄断的同时,尚没有形成适当的数据分享行为准则,这也就导致了在各个行业、各个部门都形成了数据孤岛——政府当然有滋生数据孤岛的问题,财政,税务、金融、工商、工业等等,这些数据可能就不是特别能够共享;同样的,在当今互联网企业领域,一如上文说述,也形成了各立山头、占山为王式的数据孤岛现象,这使得数据积累的速度很快,但深度挖掘的效率却由于数据垄断反而较为低下。

3 数据垄断之多宗罪,多重忧

关于互联网企业是不是形成了数据垄断,尤其是数据寡头是不是形成了数据垄断,这些企业自己有很多辩称——就像Visa,早年运用平台经济理论,号称自己是一个平台,其只是技术垄断而不是资源垄断或行政垄断。

但这种说法是站不住脚的。在产业经济学当中,如果你将自己界定为平台经济,那么该平台的运营就应该出于社会福利极大化的目的,适用于成本加上正常收益的定价法则。一定程度上这些超级平台甚至有可能成为政府的关键性基础设施。

对于平台的垄断,各个国家无不小心谨慎,尤其进入互联网时期之后,对数据垄断,各国家开始密集出台不同的措施。

如何定义和配置数字资源?各国在行动中

欧洲本土并没有在全球出色的互联网企业。但这不妨害欧盟对于互联网企业数据垄断和数据安全保护所投注的精力,却走在了全球前沿。例如在2014年,Facebook斥资 190亿美元收购whatsapp,当时欧盟便启动了对这起交易的反垄断调查。

2016年至今,Facebook、谷歌这样的互联网公司,在欧盟受到的反垄断的诉讼始终不断。欧盟作为一个整体或者欧洲的个别国家,一如法国、英国等,都相继对这些美国互联网巨头们收集、运用或出售海量信息的行为,保留甚至采取了相应司法行动。

那么在中国有没有数据垄断?实际上,尽管有些企业在声称自己没有数据垄断,但中国人民银行科技司司长李伟是这么说的——他曾于2017年6月公开表示:“一些规模较大的机构通过开展综合业务,大量汇集信息流、资金流与产品流,加之基于网络的云存储技术使金融数据高度聚集,数据寡头已经产生。”

实际上,数据垄断已经带来了一系列的问题。

第一宗罪过,数据垄断往往和闭环的超级平台相关,使得平台和商户平台和消费或者用户之间的三角关系变得特别复杂。

到现在为止,我们几乎没有观察到在中国的超级平台上走出过什么像样的企业,那就意味着一家超级平台的成功,是千千万万家、几十万家、几万家商户的辛勤耕耘的结果。

但倒过来,我们应当看到,为什么这些商家在这些超级平台上,本身难以成长为一个优秀的企业?也许每个寄居于超级平台的商家,并非基因使然,它们仅能勉强活下去,但也都缺乏一个成长为参天大树的数据环境和营商环境。至少我们可以说,平台和商户之间的关系,和用户之间的关系,不够阳光健康吧。

第二宗罪过:市场竞争变得扭曲。这也是我们经常看到的反垄断法特别关注的一个问题。实际上,这种市场竞争变得扭曲,并不仅仅是某个领域的个案——当前在诸多领域,比如中国的电商领域、支付领域、物流领域以及商旅出行领域等等,都已经形成了明显的数据寡头。

同时,这些数据寡头使得同业竞争非常艰难,跨界竞争也变得非常艰难。

同业之间排名三四位之后的那些企业,如果想要获得成长,或者想要打通数据孤岛,以更多的数据挖掘来形成自己的差别化竞争优势,已变得特别困难甚至不可能——因为这些企业首先要面临的问题尚不是人力、资金、技术等能力的不足,而是数据资源的不可得。你有好的新型发动机雏形,没有数据来来回多次的跑,技术怎么可能有市场化的转换机会?

数据垄断必然会带来新壁垒,即数据壁垒。这个数据壁垒,正是由于超级平台的生态圈闭环所致,如是数据壁垒难以攻破。比如今年上半年,QQ/微信以申请禁令形式要求法院禁止抖音、多闪用户使用与其同样的昵称与头像。昵称和头像,是个人知情同意之后抖音等就可以使用,还是数据垄断主体可以申请法律禁令,然后一禁了之呢?

第三宗罪过,就是对消费者保护变得日益艰难。

人们知道最多的,是所谓的“数据杀熟”行为。其实,在此之外,他们还可以采取数据标签之类的行为伤及消费者权益,即:对你的画像如此精准,以至于让你看到的东西固然是你想要看到的,但大部分真相已被淹没到你看不到。这样的话也很痛苦。试想如果有一定的数据共享,那么有数据杀熟的同时,市场上就一定会有帮助消费者“反杀熟”的工具,道与魔并起难免。而当下则往往是独角兽的独角戏。

但“数据杀熟”、“数据面纱”,还只是一个表象;更重要的事情是,在数据垄断的情况之下,使得消费者保护的法律合约问题变得极为复杂。

原来消费者在线下购物消费的时候,商家就是甲方,消费者就是乙方,双方签订了一个商品或者服务的购销合同后,双方的合同都较为简单透明,消费者保护的介入难度较低。

然而,在数据寡头的时期,则从供货商,经销商,到物流,到平台,再到收货人是否及时收货等等这一多环节的过程中,涉及到的合约方并不仅仅是甲乙两方,可能涉及到“ABCDE”等等多方。故而最后消费者能不能获得令他满意的产品货物,从源头、到经销商再到物流等等环节中都有可能出现差池,因此消费者保护变得更为棘手。

同样的,如果消费者进行维权,那就必须让政府的有关部门或者是消费者保护部门从数据主体处获得适当的共享有相关数据的权利,但这个度的边界如何厘清,当前也是模糊的。

第四宗罪过,数据垄断往往会带来人们对于大数据处理技术的使用壁垒。

也就是说,本来数据作为一种资源,是可以深度挖掘的;但一旦数据被垄断,那么与数据相关的技术进步便有可能会放慢,形成技术和数据两张皮。

举个例子:正是因为Facebook在数据的采集、存储和出售方面存在不当行为,所以才导致剑桥数据技术分析公司能够运用这些数据,为特朗普团队在选举当中谋得了一定的竞争优势。

这正是数据垄断和数据分享不恰当所导致的。如果我们能有一些关于数据保护和数据分享的恰当行为准则的话,这种情况也许会在一定程度上可以减轻甚至避免。

数据垄断可能带来更大的隐忧。

人们知道,当今人们的金融账户,基本上都是采取生物特征码,再加上一些硬件与用户密码等多重加密手段所形成的。那么在未来,如果这些数据寡头收集了足够多的生物特征码,同时又在硬件和密码技术方面有所突破的话,那也可能会给公民的财产安全带来很大的威胁。垄断本身不会促进安全防护技术的进步,相反,只有适当的数据共享,才能使得后者得到成长的必要土壤。

在数据垄断带来的隐忧方面,人们还可以指向“深度伪装”(deep fake)的问题——如果这些被垄断的数据被不恰当的应用的话,那么在虚拟空间,就可能会出现千千万万个“李鬼”在代替你去做各种各样的事情。

在极端情况下,数据寡头甚至可能拒绝来自政府部门的数据共享要求,使得其商业活动处于不够透明的黑箱之中。例如信贷和征信体系的建设,本身是政府主导的重要基础设施,在数据寡头的自负下,有可能出现政府平台向数据寡头开放,而数据寡头的数据却拒绝向政府开放的尴尬情形。如何处置这些情况?现在都还悬而未决。

数据垄断意味着缺乏恰当的数据分享的机制。这两个事情正好就是一枚硬币的两面:数据垄断不等同于数据保护,而仅仅是数据独占,数据共享不等同于公民隐私侵犯,共享必然需要恰当性原则。否则数据垄断有助于数据寡头的膨胀,却可能使政府、商家、消费者乃至整个社会相当程度上湮没在数据寡头给出的有限数据真相之中。

当然,数据寡头们也极力否定数据垄断的坏处。

有些研究便指出,几乎没有任何可信的证据可以证明,在不断变化的数字经济当中,仅仅依赖数据优势,就能够充分的排斥更优的产品或者服务的提供。

这种说法其实难有道理可言——作为数据寡头,你躺在所垄断的数据之上,就能让你确立长期竞争优势吗?如果相关的研究说不是的,那么这些数据寡头就应该更有动力去开放和共享这些数据。

反过来说,如果数据垄断本身并不能让数据寡头获得可持续的竞争优势,那么依据以一定形式、一定规则去进行分享,对数据寡头本身来说,可能也并不是坏事——除非他们认为数据垄断本身就是他们不正当竞争的优势之一。

4 数据共享!法律尴尬与紧迫现实

问题在于,虽然面对数据垄断、数据寡头和数据孤岛等等一系列的问题;可是从法律层面来看,要做到良好的数据分享的行为准则是非常困难的。

造成这种困难的原因,主要是数字经济的崛起速度太快,而我们原有的反垄断法律体系,还是个陈旧的工业化早期的产物。这些法律体系,指向的主要是市场垄断和技术垄断,几乎不涉及数据垄断问题。

如果我们看一看反垄断法在美国的起源的话,最早已可以追溯到120年前。那个时候的反垄断法,主要针对托拉斯、市场操纵等等这些事情。那个时候面向大工业巨头,金融寡头的垄断,和现在面对数字经济时代的独角兽、头部企业以及数据寡头的数据垄断相比,百年来形势已有天壤之别。

中国的反垄断法是2007年颁布实施的。到了2012年,最高人民法院又发布了一个名为《关于审理因垄断行为引发的民事纠纷案件应用法律若干问题的规定》的司法解释。但是如我们所知,2007年到2012年期间,互联网+概念尚未兴起,遑论数据垄断。

最近,随着国内相关商业竞争形势的变化,公安部等有关部门也在努力推进修订网络安全保护条例,试图把大数据、云平台、物联网、工业自动化控制系统等等都纳入到该条例中去。这些努力自然值得肯定,但是于数据垄断以及数据分享而言,需要形成一个大的法律框架,这些条例还显得单薄。数据寡头如此之强大,相关法律体系还仍稚弱。

我们反复强调,数据保护和数据共享是一个事情的两面。在这方面,中国的立法其实可与欧盟相互借鉴沟通。

比如2018年5月,欧洲已经通过了GDPR——也就是《通用数据保护条例》——这样一个重要的法律文件。像英国,也已通过了DPA——也就是《数据保护法案》。并且在基于是GDPR和DPA的基础之上,英国也在尝试数据共享的操作准则(data sharing-code of practice)。

我个人倾向认为,我们中国要做好数据共享工作,在最基础层面有四方面事情是可以考虑:

第一个层面,是要形成一个数据安全的关键基础设施。

这是国家层面需要去做的事情。哪些是涉及到数据安全的关键性基础设施,需要政府去定义、建设,存储和维护。

第二个层面,需要考虑基于公平透明的原则,如何界定数据主体的法律权利和法律责任。

就欧盟而言,普遍使用的是问责机制——也就是在数据保护方面,谁在数据保护上出了问题就问责谁。

而在中国,由于数据寡头已经足够庞大,面对政府和市场时都造成了足够的扭曲,甚至有考虑劝其自行分拆或者依法强行分拆的必要性。

第三个层面,是建立公民隐私和敏感信息的保护机制,其中还涉及一些弱势人群——包括儿童——的隐私保护问题等。

首先我们必须要有恰当的、通用的数据保护的一些规则,然后在此基础之上,我们才能够讨论数据共享的问题。

第四个层面,是数据共享的行为准则问题。

数据共享有个恰当性前提,我们需要要讨论数据共享的合法性的基础是什么、目的是什么,以及能够共享哪些数据、能够参与数据共享的组织或企业是怎么样的、数据共享的法律协议大体框架应该是怎么样等等。

以上是在数据保护与数据共享问题上,我们当前所看到的在法律层面,所遭遇的尴尬,以及紧迫的挑战。

最高层决策层曾经指出:没有网络安全就没有国家安全,没有信息化就没有现代化。同时,决策层也高瞻远瞩的指出,网络安全和信息化是一体两翼。

我个人对此的理解是,从网络安全角度出发,也就界定了数据必须是有保护的,不能够容忍数据垄断和数据孤岛的现状延续下去。同时,从推动信息化角度出发,就是基于数字经济,在收集、存储、运用以及共享等方面,把数据看成是重要战略资源和社会资源所做的努力。故而,信息化在很大程度上包含着数据共享的工作。

数据共享也不是一蹴而就的,我们需要一些恰当性的原则。只有我们去看到了数据垄断带来的巨大的危害和隐忧,同时又看到数据分享必须稳妥的基于数据安全保护这一前提之下进行,才能够兼顾多方的利益,使得我们尴尬的、滞后的法律体系跟上紧迫的、不断飞速向前发展的现实。

时至今日,中国已与美国等发达国家共同走在了数字经济这一时代潮头的前列。令人担心的也许是,中国一些互联网巨头,由于数据垄断而失去了初心——也就是从一个开放、普惠、面向未来的公司,逐渐的变成了它们成立伊始就曾立志要反对和抗争的那种样子,也就是过于倚赖特权和垄断的公司。倘若不幸如此,那无论如何是一个巨大的悲剧。

本文已注明来源和出处,版权归作者所有,如有侵权,您可以告知我们(点击此处)

参与评论

请输入你的评论!
请在这里输入你的名字