胡凌：什么是数据主权？

By 胡凌 @ 2014-9-6. 5,236

本文用“数据主权”（data sovereignty）描述互联网信息巨头们对海量数据的占有和使用，以区别于依托于传统主权理论而衍生出的“互联网主权”“信息主权”（information sovereignty）等概念。如果说后者仍然带有传统国家安全的政治意味，数据主权则是伴随着云计算和大数据挖掘而进入决策者和研究者的视野。它涉及数据的收集、聚合、存储、分析、使用等一系列流程，背后反映了新经济的价值链，反映了数据的商业价值。本文将按照一系列传统范畴辨明数据主权的实质，以及和信息主权之间的显著差别。文中“数据主权者”“互联网企业”等概念将不加区分。

契约

现代国家主权的理论来源之一是社会契约，人民因种种原因订立契约，推出主权者，从而结束自然状态。通过社会契约，主权者执掌对内的最高统治权，确立合法性。数据主权者同样依赖于契约，只不过从政治契约变成了商业契约。按照通行的契约条款，数据主权者通过提供免费服务换取对用户发表的内容和个人数据的永久使用权，并通过不断改善服务（基于对用户偏好的分析预测）获得合法性。这使得数据主权者拥有永远可以使用的互联网信息，而不必担心用户删除账号退出互联网。

商业契约的订立目标是通过免费信息吸引用户，换取其注意力，获得广告与增值收入，从信息中产生经济价值。它极大偏向于数据主权者，充满了免责条款，并尽力将自己描述成服务合同而非货物买卖合同，从而避免了产品质量瑕疵担保责任。网络产品的服务化正是互联网企业通过技术手段不断实现的目标，例如 SaaS、PaaS 等。

身份与认证

用户和互联网企业之间通过商业契约联系在一起，表明自己消费者的身份。事实上用户不仅仅是被动的消费者，而且是主动的信息和数据生产者。每天有大量信息被用户利用自己的剩余时间生产出来，同时吸引了更多的用户，通过网络效应增加网站的价值。用户和数据主权者的关系就超越了简单的消费者-商家的关系，同时表现为劳动力-工厂的关系。用户可以同他人分享生产的内容，也享受着精准营销带来的益处。和单个用户的个人数据相比，海量用户聚合的信息能够产生更大的集体性价值。

数据主权者不仅仅关心作为消费者的用户身份，还试图将触手伸向其日常工作生活的方方面面，获取相关信息，力图掌握同一人不同的社会身份。数据主权者未必掌握用户的姓名等基础信息，却可以获得更加广泛的真实数据用于精准营销，满足用户管理虚拟身份的需求，身份认证更加彻底。这与政治主权者形成了对照，后者主要关注公民涉及公共生活的行为认证，搜集数据，建成公共数据库（犯罪、税收、医疗、社保），为良好治理奠定基础。

公共领域

表面上看，数据主权者将信息内容向全体用户开放，允许用户生产和共享使用，形成了前所未有繁荣的公共数据池。甚至私人数字图书馆已经在服务便利上赶超公共图书馆。但这并不意味着一个崭新的公共领域就此形成。首先，随着互联网企业聚集的信息内容增加，只有隶属于本主权者的注册用户才有权使用，更不用说相互竞争的其他互联网企业。诸多互联网企业不正当竞争即发端于未经授权大量复制其他同类网站的内容。其次，免费使用只是当前互联网商业模式的副产品，用于积累用户流量，击败竞争对手，并非出于公共利益考虑。第三，这一貌似繁荣的公共领域逐渐被不同的信息帝国瓜分，后者拥有排他使用权，往往会为了自身的经济利益决定如何使用这些数据，而不取决于用户的态度。

领土、边疆与安全

数据主权者通过各种方式寻求信息世界的入口，就相当于掌控了信息世界的“总开关”。在移动互联网时代，移动终端、操作系统、浏览器、平台都可以成为这一入口，以便争夺作为生产资料的信息内容和用户流量。对数据主权者而言，并不存在需要通过军事力量守卫的广袤领土，相反，它要求超越国界边疆，争取数据在主权国家之间畅通无阻。取代领土的将是承载海量数据的服务器。它们可能沉于深海，可能置于太空，可能固定在北极圈，也可能漂浮在大洋上。当数据可以在全球范围内自由流通的时候，云端服务器会在世界各地分布，对主权国家而言就出现了数据跨界监管的难题。目前中国的情形是数据服务器落地（例如微软 Windows Azure 云计算平台），严格限制数据跨国流动，无法适应高速信息流动的后果。

互联网企业对数据的汇集聚合经历了一个过程。在分布式终端设备时代（例如台式机），数据的储存和计算都在本地进行。新兴的云计算进一步将用户数据从他们自己的控制中脱离并占有（从终端储存到不知所在的云储存），同时结合其他免费服务共同追踪用户偏好。用户的一切内容逐渐都可以在云端实现即时访问，也就更加难以脱离特定的信息帝国。

互联网的开放匿名特征使安全问题（木马、病毒、黑客）变得尤为突出。为了让用户享用更好的服务，防止流失，数据主权者不得不加大安全投入，防护自己的网站和服务，同时也占据了广大用户的桌面。当用户桌面和终端还是开放平台的时候，不同的数据主权者难免发生冲突。但随着纵向一体化模式的成熟，巨头们纷纷打造自己的平台，或在全球范围内寻求上下游供应链，使互联网变得愈加封闭。换句话说，数据主权者要求超越传统国界，同时也在打造新边疆。

架构与法律

Lawrence Lessig 的《代码》一书中强调网络空间中的主权权力来自于架构设计，商业契约的订立为架构设计的约束力铺平了道路。上述谈提及的身份认证、塑造内容信息池、创设平台和入口、改变信息的法律属性等都是通过架构设计实现的。在自己的信息帝国领域内，数据主权者拥有至高无上的架构设计权，和法律、社会规范与市场一样，直接在微观上影响甚至决定着用户的行为。这比物理空间中的主权者法律更能有效地实现自己的意志。

从外部来看，在同传统经济利益争夺用户的过程中，数据主权者也同样改变了工业生产时代的法律，财产、隐私、言论、知识产权、不正当竞争、垄断、广告等领域的规则纷纷受到挑战。这一挑战的过程也是数据主权者在生产方式意义上“非法”兴起的过程，互联网企业要求新法律保护其利益，直到它们确立合法性，拥有强大的议价能力为止。

意识形态

和传统主权国家一样，数据主权者也同样需要意识形态维护其利益。诸如合作、信息自由流通、言论表达自由、分享、公共领域等话语纷纷成为捍卫数据主权的无法动摇的基石。这些话语承接传统价值，具有相当的正当性，但在互联网时代，这些话语同时意味着鼓励用户生产大量信息内容，帮助推动消除阻碍信息流通的各种障碍，从中获得收益。像隐私这样的传统价值被认为是无关紧要的，行为经济学家已经证明了人类合作的本能与受限理性，从而使坚守隐私权和个人自主变得不合时宜。

退出、呼吁与忠诚

当互联网尚未成为封建领地的时候，消费者可以自由选择上网或者服务，用脚投票较为容易。但随着平台的兴起，用户的个人信息越来越多地储存在某几个互联网巨头的服务器上，几乎不可能转移个人信息到另一家竞争性公司中，尽管用户可能因不满而呼吁改进，但退出将变得越来越困难。用户的忠诚度只能通过公司不断改进服务，深入挖掘用户信息提供新产品而得到加强。

综上所述，数据主权和基于民族国家的主权实际上存在诸多矛盾和冲突，这种冲突可以简化为信息的政治逻辑与商业逻辑的冲突。当我们讨论互联网主权新问题的时候，可能同时需要从互联网企业的角度关注这另一种“主权”，以及这究竟对用户而言意味着什么。

（本文原载《经略网刊》，有改动）

智识@IdeoBook™

胡凌：什么是数据主权？

Leave a Reply