领英爬虫案败诉是隐私保护的倒退吗
   来源:南方周末     2020年04月22日 23:27

美国纽约,学生坐在一张谷歌地图中女生照片旁。此次展览的主题为“公共的隐私”,旨在探索Facebook和Google时代下网络隐私,监视和数据搜集间的界线和灰色地带。(东方IC/图)

(本文首发于2017年10月5日《南方周末》)

2017年8月14日,位于美国加州的北区联邦地方法庭法官发出了初步禁令,要求全球最大的职业社交网站领英(LinkedIn)必须在法庭禁令颁布后24小时内取消对hiQ Lab(一个利用爬虫技术的数据分析公司)数据抓取的技术阻拦措施,撤回两封“勒令停止侵权函”,并不得再以同样理由发出“侵权函”。

hiQ爬数还有理,领英保护会员隐私和数据安全反受挫,这似乎是互联网时代脆弱的个人隐私保护再次倒退,好一个“糊涂”法官,情况真的是这样吗?

法官认为,两者的争议与个人隐私保护关系不大,领英只不过是打着保护个人隐私的旗号涉嫌不正当竞争。这是互联网时代不同公司对数据资源控制权的争夺,两者对个人隐私的尊重不过是五十步与百步之别。

hiQ公司CEO——Mark Weidick(作者供图/图)

恶人先告状?

近几年,硅谷出现了不少数据公司,这些数据公司本身并没有独立的数据,但其依附于掌握大量数据的互联网平台公司,如Facebook、Twitter、LinkedIn、Craigslist等,这些数据公司通过爬虫技术抓取平台数据,对抓取的数据进行再处理并制成数据产品后出售。

如位于芝加哥的数据公司Geofeedia利用Twitter、Facebook、Instagram等社交媒体抓取数据,利用所谓的“人肉搜索”,开发了为警方提供监控游行、抗议等活动的数据支持服务产品,如丹佛警察局就订购了其年服务费为3万美元的数据服务,巴尔的摩、西雅图、洛杉矶、达拉斯等至少13个城市的警方都是其客户。可以说这些公司就是平台公司的寄生公司。

平台公司当然不甘于“自己”的数据被他人获利,于是或者利用技术手段阻止数据被爬(如2016年Geofeedia被曝光后,很快被相关平台切断其数据来源),或者使用法律武器打击依附于其上的数据创业公司,如2009年Facebook诉Power Ventures案, 2015年Craigslist诉3TAPS,法庭也基本支持了这些平台公司的诉求。

领英(LinkedIn),成立于2002年12月,是全球最大的职业社交网站,网站的目的是让注册用户维护他们在商业交往中认识并信任的联系人,俗称“人脉”。用户可以邀请他认识的人成为“关系”(Connections)圈的人,是一家面向商业客户的社交网络。微软公司在2016年中花费262亿美元将其纳入麾下。目前,领英在200个国家有超过5亿注册用户,是一个超级大平台。

5亿用户自然积累了海量的个人信息和数据,对于互联网时代能赚钱的个人信息,正如血腥味能令食肉动物疯狂,数据公司觊觎这些公开的“免费”个人信息可以说毫不令人意外。

hiQ Lab正是这样一家成立于2012年的旧金山初创公司,成立以来,其已获得两轮融资(1450万美元),有23位全职员工(包括7名博士)。hiQ利用爬虫自动从领英网站上收集个人信息,主要为客户提供两大产品,Keeper(分析公司最有可能跳槽的员工)和Skill Mapper(员工技能分析,包括员工知识的深度和广度),其客户包括很多财富500强企业,如CapitalOne、eBay都是其客户。

2017年5月23日,领英向hiQ发出了“勒令停止侵权函”,指责hiQ利用爬虫窃取其数据违反了领英网站与用户的使用协议,声称已使用技术措施阻止其继续违法爬数。但爬数的hiQ 在6月7日倒先以受害者的身份向联邦地区法院提交了“确认之诉”,称其遭受无法弥补之伤害,并同时请求法院颁布临时禁令救济,以迫使双方商议解决之道。仅仅2天后,6月9日,其又撤回了诉状,以为双方磋商创造条件。然双方并无法达成协议,hiQ再向法庭申请禁令救济。

主审法官爱德华·陈希望双方能友好协商,达成允许hiQ继续爬数的协议。但双方观点南辕北辙,领英对hiQ“恶人先告状”的行径更是恼怒,6月24日领英再向其发出“勒令停止侵权函”。

双方各执一词,爱德华法官忧虑个人隐私保护,但hiQ确实面临生死存亡,失去了宿主,寄生类公司将无法存活。法官的初步裁决已不可避免。

隐私保护VS不正当竞争

保护用户的个人隐私是领英最具有道德感召力的诉求,也最容易博得社会的同情和法官的犹豫。但经过法官抽丝剥茧的分析后,认为其个人隐私保护的诉求很牵强。

首先,领英的用户包括不同意公开个人信息、同意在一定范围公开个人信息和同意向公众公开个人信息这么三类情形,hiQ只是抓取了同意向公众公开个人信息的用户的个人资料。按照法官的分析,这些用户并没有“同意公开的个人信息是隐私”的期待。或者说,对于这些用户信息,隐私问题根本就是个伪问题。

其次,领英强调hiQ抓取数据重点分析个人公开信息的变化,并通过这种细微的变化(如之前愿意公开又变为不公开,或反之)分析其就职的可能变化倾向,特别是对那些选择了“不广播变化”的5000万用户,这样的分析侵犯了其个人隐私。但法官认为,领英没有提供确实的证据来支持其观点,5亿用户,包括这5000万用户,只有3宗投诉忧虑有关第三方信息收集的隐私问题,且没有一宗涉及hiQ。

更重要的是,领英还允许其他第三方企业以同样的方式使用用户个人信息数据,且同样没有告知用户。更难以解释的是,领英自身也有类似产品。

法官进一步逼问,hiQ已经以同样的方式抓取数据5年,且至少从2015年10月(领英派人参加hiQ组织的论坛,甚至还获得hiQ颁发的“影响力奖”),领英就已经非常清楚地知悉,为什么一直不予以阻止,为什么不站起来保护用户的个人隐私,hiQ方面则称领英违背了普通法所谓的“允诺禁反言”原则。

法官同意hiQ对此的指控,领英是出于限制竞争,涉嫌违反加州不正当竞争法,也涉嫌违反了联邦反垄断法。6月21日,领英CEO对外宣布要发布新的数据分析服务产品,而这个新产品与hiQ现有的数据服务产品"Skill mapper"功能类似。hiQ认为,领英利用其在职业社交网络市场里的优势地位,试图进入相关数据分析市场,阻止hiQ抓取数据正是为了其获得不公平的优势,是为了限制竞争。

此外,hiQ认为领英的行为违反了反垄断领域所谓的“瓶颈设施原则”,即禁止某一市场具有垄断地位的企业或试图垄断市场的企业阻止其他企业使用其控制的行业关键设施,而用户个人信息当然就是职业数据分析市场的核心资源。

非法侵入VS言论自由

用户的个人信息并非领英的所有权,而是用户所有,这是领英所承认的。但领英认为,hiQ违反了加州的计算机欺诈与滥用法(CFAA),未经授权进入其计算机系统,这也是其所有指控中最为核心的一条。

但法官并不认同领英的指控,并进行了驳斥。首先,从立法背景和立法目的看,加州的计算机欺诈与滥用法(CFAA)是1984年通过的,当时根本没有互联网,主要针对的是对于个人计算机和大型机服务器,且最初是为了保护政府的计算机系统,1986年才扩展至商业计算机系统,其使用和进入有明确的物理空间,其本性是私有的封闭的。而领英系统是互联网的一部分,互联网的本性是开放的公共的。

其次,根据普通法建立的判例,所谓的“未经授权进入”应以系统是否有和绕过密码保护为前提条件,领英用户发布在互联网的信息并没有密码保护,这些信息是公开的,指控其侵入难以成立。法官称犹如商店不能称路人看了商家摆放在橱窗展示的商品或广告为侵权,但进入加锁的商店则是侵权。

领英则称并不反对hiQ进入系统,但反对其利用爬虫技术自动收集数据。法官则认为对于公共空间的公开数据,领英不能从技术上阻挡hiQ抓取数据,但可以设置障碍,如利用验证码技术减慢其自动抓取数据,犹如关门和装门槛的区别。

hiQ则将领英阻止其抓取数据抬高到宪法权利的高度,指控领英违反了加州宪法的言论自由权。根据加州最高法院1979年在著名的Robins 诉Pruneyard商场判例中确定的新的言论自由权标准,在私人所有的公共场所(如商场),个人也拥有同样的言论自由权,从而树立了比联邦宪法更高的标准,也得到了联邦最高法院的确认。hiQ认为,领英阻止hiQ获取数据,也就是阻止其在公共空间(领英网站)读取信息,是侵犯其言论自由权。

领英方面认为爬虫不会说话,只是在抓取数据。但法官认为,收集信息与表达信息具有同等的重要性,从互联网网站收集信息有可能被解释为言论自由的宪法权利。

但法官认为目前还没有任何判例将言论自由权完全扩展到互联网,这种扩展将类似“滑坡谬误”(slippery slope,是一种非形式谬误,即不合理地使用连串的因果关系),对整个互联网产生难以估量的影响,如:互联网作为一个整体还是特定网站是一个公共空间?Facebook是否能够管理内容?显然,法官对此采取了极其谨慎的态度。

公共利益

法庭向哪一方发出禁令予以救济,除了衡量损害对于哪一方更难以弥补和哪一方更具有法律上的支持外,还要考量裁决对于公共利益的影响。

从损害衡量看,法官的禁令对于hiQ是生或死的选择,对于领英的损害则是不确定的(领英认为会损害其与用户之间的信任)。

从法律理据看,hiQ指控的不正当竞争更有道理。

从公共利益看,双方都认为对与自己有利的裁决更有利于公共利益,有利于信息的自由流动。领英认为,有效保护用户的个人隐私将鼓励更多的用户公开自己的信息,反之则会迫使更多的人不再公开信息,因此法庭裁决对于公众有寒蝉效应。

hiQ则认为,任何人都没有单方面的权力限制其他人获取公开信息。若如此,相当于此人拥有可以决定谁可以参加互联网思想市场,个人言论自由的宪法权力将遭到极大的侵害,这将有损公共利益。

法官认为,支持hiQ更有利于信息的自由流动,也就是更有利于公共利益,而领英的所谓隐私保护诉求存在不确定性。

互联网挑战

地方法院只是联邦法院体系里的低级法院,且法官的裁决还只是一个初步禁令,以避免在正式裁决前一方遭受无法挽回的损害(如hiQ称被阻止抓取数据后,已经有10名员工辞职,公司面临立即倒闭的危险,需要法庭立即予以救济),对于很多关键问题并没有做出结论,只是提出了倾向性的意见,况且对于如此重大的案件,财大气粗的领英很有可能会上诉到最高法院。

领英发言人在收到初步禁令后表示,将对这一判决提出上诉。这名发言人表示:“我们对法庭的判决感到失望。这起案件尚未结束。我们将继续争取,帮助用户控制他们提供至领英的信息。”

双方的律师团队也堪称豪华。领英的律师是奥巴马政府的司法部副部长——唐纳德·维瑞利(Donald Verrilli),这位前副部长已参与过100宗以上最高法院的案子,可说是最高法院的常客。

而hiQ虽然只是个创业公司,但很幸运地请到了美国宪法权威、美国宪法学会的联合创始人、1941年出生于上海的哈佛大学著名的法学教授劳伦斯·特赖布,这位教授是奥巴马的法律老师,还是最高法院首席大法官罗伯茨的老师,赢得过30宗最高法院的案件,对于这样一位法律界的大腕,请到他的几率只有1%。但特赖布教授认为“在信息经济时代,如何使用信息同样是言论自由。数据是新的资本”,“今天,社交媒体等同于新的公共空间,今天领英的行为对现代社会的言论自由提出了严峻的挑战”。正是对于互联网时代宪法权力的信仰,促使他加入了这场法律战争,无论最高法院最终如何做出裁决,对于互联网的影响都将是跨时代的。

正如特赖布教授所说,这个案子将对在社交媒体如何行使宪法权力建立一个经久的先例。这才是领英案的意义所在。

(作者为交通与互联网研究专家)

数据 法官 西雅图