数据

胡凌:什么是数据主权?

网络杂谈之二十五

本文用“数据主权”(data sovereignty)描述互联网信息巨头们对海量数据的占有和使用,以区别于依托于传统主权理论而衍生出的“互联网主权”“信息主权”(information sovereignty)等概念。如果说后者仍然带有传统国家安全的政治意味,数据主权则是伴随着云计算和大数据挖掘而进入决策者和研究者的视野。它涉及数据的收集、聚合、存储、分析、使用等一系列流程,背后反映了新经济的价值链,反映了数据的商业价值。本文将按照一系列传统范畴辨明数据主权的实质,以及和信息主权之间的显著差别。文中“数据主权者”“互联网企业”等概念将不加区分。

契约

现代国家主权的理论来源之一是社会契约,人民因种种原因订立契约,推出主权者,从而结束自然状态。通过社会契约,主权者执掌对内的最高统治权,确立合法性。数据主权者同样依赖于契约,只不过从政治契约变成了商业契约。按照通行的契约条款,数据主权者通过提供免费服务换取对用户发表的内容和个人数据的永久使用权,并通过不断改善服务(基于对用户偏好的分析预测)获得合法性。这使得数据主权者拥有永远可以使用的互联网信息,而不必担心用户删除账号退出互联网。

侯猛:数据如此分组能否真实反映法学现状——评《中国人文社会科学学术影响力报告》法学部分

【内容摘要】《中国人文社会科学学术影响力报告(2000-2004)》“法学部分”披露的引证数据虽然真实,但由于分组不当,并不能准确反映法学现状。不论是引证分析期刊还是作者来判断中国法学研究的现状,都应当根据中国法学研究的实际情况,多项评价指标综合权衡;通过恰当的分组,如将作者项分组为作者和译者、独立撰稿人和主编等,来保证引证数据有可信的证明能力,这样得出的结论才能较准确反映法学期刊和法学者的真实学术影响力。

【关键词】法学引证 期刊影响因子 作者 主编制 同行评议

2007年南京大学中国社会科学研究评价中心暨CSSCI发布单位,依据CSSCI数据库编写了《中国人文社会科学学术影响力报告(2000-2004)》(中国社会科学出版社2007年版,以下简称《影响力报告》)。或许是出版社出于营销造势的需要,其引起媒体的广泛关注程度,[1]要远远超出《中文核心期刊要目总览》(北京大学出版社2004年版)、《中国人文社会科学核心期刊要览》(社会科学文献出版社2004年版)。从一个法学研究者的身份来阅读《影响力报告》及其法学部分,我发现现有数据虽然真实,但由于分组不当,[2]因而数据并不能有效解释中国法学现状,一些地方甚至违背法学常识。鉴于《影响力报告》已经对法学领域乃至公共领域产生非常大的影响,为了避免进一步误导读者,也是为了给《影响力报告》的修改提出建言,本文试图做一番厘清的工作,定有疏漏和不当之处,请多指教。

运用引证的方法来分析中国法学现状已经不是什么新鲜事。就法学界而言,苏力在2003年就以CSSCI数据为主要文本撰写“从法学著述引证看中国法学”,[3]强调了在法学研究中运用引证的必要性、可能性,并从引证数据分析中国法学不同地域、不同学科的基本格局。尽管时隔5年,引证数据已经不能完全说明中国法学的变化,但该文对引证数据进行分组解释至今仍有相当大的说服力。如果说苏力的分析还局限于中国法学内部的评价的话,成凡则从中国法学对外部学科知识的引证来分析中国法学现状。他认为中国法学在相当程度上自我封闭,对外部学科知识的吸收并不够。[4]本文借鉴上述两位做法,根据《影响力报告》以及CSSCI数据库,通过分析法学期刊和法学者的引证来说明中国法学现状。[5]但首先需要说明的是,引证包括CSSCI数据库本身就存在不少问题。例如,尽管可以排除自我引证,但是却无法有效排除反面引证(negative citations)、互惠引证(recipocal citations)等;此外,还存在着比较独立的可能影响结果评估的干扰效应,例如,“专业效应”、“装饰效应”等。[6]因此,对于学术规范正在建立的中国法学研究而言,引证特别是没有严格界分的引证数据的证明能力是值得怀疑的。