“棱镜门”:大数据时代,“隐私”的“钱景”与安全
一项由美国国家安全局(NSA)实施的绝密电子监听项目曝光后,在美国国内和国际社会间掀起轩然大波。此事件被称之为“棱镜门”(代号PRISM),涉及到美国9大互联网服务商与国家安全局之间存在的所谓“数据合作关系”,其造成的影响正在全球网民间持续升温,成为连日来国外媒体评论的焦点。
“隐私”的商业价值
拥挤的公交车上,就职于济南某公司的赵先生在聚精会神地玩着智能手机。与济南众多上班族一样,赵先生每天要在公交上呆一个小时以上。聊天工具、交通地图、交友购物……在智能手机装载的诸多APP应用,在方便赵先生生活的同时,也带来其它的问题。
“手机上这些软件,提醒我必须允许我的通讯录、大概位置、日志被读取。如果我不同意的话,这些软件就无法使用了。” 赵先生一脸无奈地对记者说。
赵先生的这番遭遇,只是大数据时代的一个缩影。海量信息的大数据时代,给用户的信息安全带来了隐患。
而在“棱镜门”爆发之前,几乎所有的企业大佬对大数据时代的商业前景非常看好。
以沃尔玛为例,全世界最大的零售商,它的人数和美国联邦政府的雇员等量齐观,它的收入2010年突破了4000亿美元,超过了很多国家的GDP总值。在一次例行的数据分析之后,研究人员突然发现,跟尿布一起搭配购买最多的商品竟然是啤酒!这种关系令人费解,尿布和啤酒风马牛不相及,这是一个真正的规律吗?
经过跟踪调查,研究人员终于发现事出有因。一些年轻的爸爸经常要到超市去购买婴儿尿布,有30%-40%的爸爸会顺便买点啤酒来犒劳自己,沃尔玛随后对啤酒和尿布进行了捆绑销售,不出意料,销售量双双增加。
这就是对历史数据进行挖掘的结果,反映的是数据层面的规律。沃尔玛是世界上最早应用数据挖掘技术的企业之一,也是数据挖掘技术的集大成者。
数据挖掘是指通过特定的计算机算法对大量的数据进行自动分析,从而揭示数据之间隐藏的关系、模式和趋势,为决策者提供新的知识。数据挖掘,把数据分析的范围从“已知”扩大到了“未知”,从“过去”推向了“将来”,它的发展和成熟,最终推动了“大数据”在各行各业的广泛应用。
正如《纽约时报》2012年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。随着信息管理系统的普及,企业的规模越来越庞大,组织越来越复杂,市场更加多变,竞争更加激烈,信息是否及时准确、决策是否正确合理,对组织的兴衰存亡影响越来越大,一步走错可能全盘皆输。
麻省理工学院斯隆管理学院的经济学教授埃里克·布吕诺尔夫(ErikBrynjolfsson)曾经指出,在商业、经济及其他领域中,决策行为将日益基于数据和分析而作出,而并非基于经验和直觉。“我们的决策能够开始变得更加科学化。”他这样说。
越来越多的企业希望借助数据存储、数据分析等为自身带来更多利益。最典型的一个案例就是,华尔街有炒家利用电脑程序分析当时全球3.4亿微博账户的留言来判断民众情绪,再以1到50为其打分,根据分数高低处理手中的股票。判断原则很简单:如果多数人表现兴奋,那就买入;如果大家的焦虑情绪上升,那就抛售。这一数据分析软件帮助该炒家在2012年第一季度获得了7%的收益率。
当然,消费者也会享受到更方便和更具个性化的服务。网购狂人李雪(化名)每天早上打开邮件,首先映入眼帘的就是各大电子商务网站发出的订阅邮件和个性化推荐的邮件,着实方便了她在网上进行目标性极强的有选择的“扫荡式”购物。这是商家根据对用户的页面停留时间、浏览与购买商品的分类等数据的分析作出的推荐。
另外,还可以通过数据分析来为人们提供健康保障。总部位于美国加州的医疗管理财团Kaiser Permanente,收集并分析所有的临床分析和成本数据,发现了美国默沙东公司的神经和肌肉、骨骼系统药“万络”能够引发心脏病的副作用,最终成功使其退出市场。
谁来掌控属于你的大数据
每个人都期待获得个性化服务。但是,在大数据时代,想要获得个性化服务,就一定会在某种程度上牺牲自己的隐私。
当你在使用电子邮件、社交网络的时候,你大概也会知道你的信息正在被记录下来,你发表的言论或者分享的照片、视频等都决定着互联网运营商即将向你推荐什么样的资源和广告;当你拿着iPhone满世界跑的时候,苹果早已通过定位系统把你的全部信息收罗在自己的数据库里,利用这些信息来构建地图和交通信息等;当你在享受着视频监控带来的安全感的同时,别忘了你也是被监控的一分子,你的一举一动都会暴露在镜头下面;你用手机通话时,运营商不仅知道你打给谁,打了多久,还知道你是在哪里进行的通话。
以前,这些记录几乎不会对普通人造成影响,因为它的数量如此巨大,除非刻意寻找,人们不会注意其中的某些信息。但是,随着大数据技术的不断进步,这一状况正在发生改变。本文之前提到的悬而未决的问题随之而来,造成了很多尴尬的局面。例如,Facebook公司内部的科学家已经利用这些数据进行了大量研究并发表了超过30篇论文,但Facebook顾虑到隐私问题,并未公布原始数据,使得这些论文无法被业界承认并应用在广泛的社会学和心理学领域。同时,外界的研究者苦于没有数据,进行相关研究时远远没有Facebook得心应手。2012年8月,Facebook公司表示正计划向社会学家开放有限的数据访问权限,这又会带来更多争议。此外,谷歌也和美国政府就数据利用问题产生了多次冲突。美国政府以各种理由不断要求谷歌提供用户数据并时常遭到谷歌拒绝。同时,美国政府也对街景等应用进行调查,限制谷歌收集更多数据以制衡谷歌。
微软研究院的高级研究员博伊德(Danah Boyd)曾经表示:“如今,我们社交网络化的社会绝对有制造恐慌的天分。在大数据时代,对隐私泄露的担忧就是强大的紧张和焦虑的源泉。人们普遍认为,最令人焦虑的在于你根本不知道什么时候自己的隐私就无意中被泄露出去。”她认为,这并不是我们希望建立的社会。
人们最担心的,是对这种数据的无限制利用。美国作家艾伯特·拉斯洛·巴拉巴西在其著作《爆发》中指出,人的行为看似随机无序,但实际上是存在某种规律的。社交网络如此发达的今天,大数据把人的行为进行放大分析,从而能够相对准确地预测人的性格和行程。所以,不排除有这样一种可能:在忙完了一天的工作之后,你还没有决定要去哪儿,数据中心却早就先于你准确预测了接下来的目的地。
人们是否存在真正的隐私
当前,数据的数量时刻都在飞速增长。信息分享在全世界范围内越广泛,确保数据安全和保护人们隐私的任务就越难完成。现如今,人与人之间交流产生的流量远远大于文件传输产生的流量,但是,人与人之间的交流可以界定为隐私,属于比较敏感的范畴。由此看来,整个互联网都是隐私的,是不可公开的。但是,现有的互联网结构下,你的所有应用对于服务提供商,其实都是透明的。那么,人们既想要借助互联网的平台与别人交流,又想要自己的空间不被窥探,这是完全不可能的。
巴拉巴西认为,为获得便利,人们未来会接受匿名的隐私泄露。但是,在过去的几年中,计算机专家一再表示,即使是匿名的数据也可以被重新确定,并且归属到具体的个人。例如,如果一笔超市购物记录中的零食全都和你的爱好相符、提供记录的超市正好位于你公司到家里的路上、购物时间刚好是你下班和到家之间的时间,这笔购物就很有可能与你相关,如果单子里刚好有你之前微博上表示感兴趣的商品,那就更有可能了。
曾经,谷歌的一位工程师在解释“为什么不收集与人的名字相关的信息”的时候说道:“我们根本就不需要名字,名字对我们来说完全多余。谷歌记录网民搜索查询、位置和网上行为的大型数据库中就有大量信息,这足以让谷歌间接地了解一个人。” 这意味着人们隐私权的最后一道防线同样脆弱得不堪一击。
那么,如何有效保护用户的信息安全?以通讯录、短信、照片等进行“云备份”或“远程备份”操作为例,最安全且最稳妥的做法是用有效安全的方法对通讯录、短信、照片等实现基于设备唯一标识码(如手机设备唯一码IMEI或MAC地址)对数据进行加密备份。这样,只有用户自己可以进行安全恢复,防止第三方应用私下动手脚。上述情况是手机正常使用的情况下的安全措施和建议。但是,一旦手机丢失,我们可以通过专用预装软件,由用户自主操作和控制,可通过手机防盗防丢失安全期软件,实现丢失锁定、换卡锁定、远程数据销毁、远程数据加密、远程数据回传、失物定位等最大限度保护用户隐私。
拨打电话的应用在功能上需要读取通讯录,这种权限提示属于正常情况。然而,安装某个新闻阅读应用时,出现获取“读取通讯录”权限。一般情况下,这类应用的功能不需要读取通讯录,而它申请获得这个权限可能是为了获取用户个人信息。专家建议,“从个人的角度来说,想要保护自己的隐私不被泄露,需要提高自己的安全素质,养成良好的安全习惯。”
当然,对个体隐私的保护,政府也应当加大立法制度,企业自身也应当设定相关规则实现自我管控。在美国北卡罗来纳州,曾经有人因为雇主看了他在Facebook上的信息而求职失败,求职者对雇主起诉并打赢官司。为此,北卡罗来纳州专门立法规定雇主不得对雇员进行网上监控。Facebook也专门设立了首席隐私官。
不过,政府和企业本身就拥有最多的数据,它们会真正限制自己对数据的应用吗?这将是未来大数据时代头上的一把达摩克利斯之剑。
相关阅读:
|