互联网时代下,通过网站搜集信息和资源是一件极为普遍的事情,通常,网页浏览器会记录用户访问过的网站列表,即网页浏览历史记录。
然而,即便是这样简单的网络行为,都存在着隐秘的风险。在8月举行的usenix 会议上,mozilla 的研究人员展示了他们对 5.2 万名(事先同意)的firefox 用户在两周内的浏览历史数据集进行了分析的结果。
结果显示,48,919 份浏览资料具有可区分性,即 99% 的浏览历史是独一无二的。超过八成用户可通过浏览历史被识别身份。而且,只需要考虑 50个最常用网站就足够。
事实上,在 2012 年就有对用户浏览记录分析用户身份的研究。其中,研究者首先建立了一个测试网站,并使用 css 代码从 6000 个域名列表中识别出参与者访问过的网站。当时的研究结果显示,基于这 6000 个域名,参与的受试者,97%都形成了非常具有独特性的浏览历史,仅此数据就可以用来追踪确认这些参与者。
而时下, mozilla 这一次研究所采用的数据则更精确,mozilla的研究收集了5.2 万名参与者的全部浏览记录,数据包括对 66 万个独特域名的 3500 万次网站访问,也是该领域规模最大的一次研究。
参与者首先和 mozilla 团队分享他们的浏览历史,然后,mozilla 团队开始试验他们是否能从大量数据中重新识别出这些用户。结果显示,99%的浏览记录被发现具有独特性,能与用户“对号入座”。
此外,2012年和2020年的两次研究对比也展示了互联网时代的变化:八年前,对于用户访问量最大的前50个网站,识别用户的准确率为38%,对于500个网站的数据集,准确率为70%;今天,以50个网站为基础的重新识别准确率为50%,以150个网站为基础的重新识别准确率为90%。
伴随着5g技术的发展,人们创造的信息总量也以几何级数进行累积,研究显示,过去几年中人类制造的数据占整个人类历史数据量的95%,换言之,大数据时代已经真正降临。
在互联网时代的后半场,我们的生理信息都将进入传播渠道,成为5g技术下的重要信息资源。而通过用户浏览记录分析用户身份无疑会成为进入传播渠道的另一重要数据,如何规避这一数据信息下的隐私暴露风险,创造更好地保护隐私的路径,依然有待实践探索。但任何技术的狂想始终来自人和人性,人类的智慧是技术的智慧,也是破解技术困境的智慧。
责编ajx
保时捷推出3D打印制造的个性化桶形座椅
环境监测仪器市场采购或将大规模展开
14款入门级32位通用MCU更适合成本敏感型嵌入式应用
浅谈开关电源PCB设计
从模拟与数字信号到艺术与技术的转换关系
简单的网站网页浏览,或将存在未知的网络安全威胁
5G云网融合赋能XR产业新发展
说一下模拟信号与数字信号的区别
魅族Pro7什么时候上市?最新消息:魅族Pro7难产是因为没有骁龙835吗?没有骁龙835还要卖3299?
攀升电脑迎来促销,主机搭载i5-9400F处理器
vivo NEX和 Oppo Find X对比:机械与电子产品的融合,升降式摄像头隐患多多!
山东移动与华为将在5G领域持续深化合作
iPhone 6金属后壳渲染再曝光:独特天线设计
五分钟带你了解物联网与互联网的关系
智能镜面电视将开启一个全新的智能时代
什么是UML
VHF/UHF无线发射芯片RF2516的原理与应用
高通的5G基带的布局 5G手机产业
介绍一款基于go的windows信息收集工具
解答落实工业互联网为什么需要IP化先行