“大数据时代”的数据挖掘
什么是大数据?有什么魔力?
大数据意味着一切都数字化了。我们平时在网上浏览的数据,我们的医疗、交通、购物数据都有记录。这就是大数据的由来。这个时候,我们每个人都成了数据的产生者和贡献者。大数据的魔力在哪里?从某种意义上说,你可能只是安装了一个游戏,并允许它提取你的GPS位置,但这将你是同性恋还是高消费等信息暴露给了研究机构。通过大数据的分析,我们甚至可以在很大的层面上准确的知道你是谁。
你之前提到大数据时代已经到来,所以企业和商家对数据的挖掘也在不断深入。那么什么程度的数据挖掘才不算过度挖掘呢?
事实上,没有办法阻止过度的数据挖掘。任何企业都需要挖掘更多的内容。我们能做的就是通过政府和行业的监管,让侵犯用户隐私,对用户造成恶意伤害的企业受到严惩。要求一个用户用他自己的方式去保护他的隐私是不现实的,也是不公平的。
现在你是分分科技的首席科学家。你能谈谈Dianfen.com是如何挖掘数据的吗?
百分科技聚合了用户在电子商务网站的浏览、购买和收集数据,以及在资讯网站的浏览数据。分析用户自身的偏好,预测用户的意图,然后利用这些偏好和意图为用户做出更精准的信息或购物推荐。
现在很多人一听说数据挖掘就觉得很害怕,害怕自己的隐私被泄露出去。那么有什么办法可以防止他们的个人数据被挖掘呢?
就像我们不能用自己的能力去识别假货假食一样,我们也不需要要求用户保护自己的隐私。因为这种事情其实是无能为力的。比如你带了手机,我们可以通过传感器知道你在哪里。你无法回避这个事实。所以,这就要回到刚才的回答了。我们只能通过惩罚恶意利用个人隐私数据谋取不正当利益的公司来避免这个问题。
恶意利用个人隐私是一种什么样的方式?能举个例子吗?
出卖一个人的手机号,一个人的家庭住址,或者制造一个人的隐私——比如你去了什么网站,买了什么东西,去了什么交友网站,看到了什么图片等等。-通过网络上一些不正当的公开数据为他人所知。这些都是不当使用。
那么有没有一些实用的方法来避免恶意使用你的隐私呢?
表面上看,用户在上网时可以不断清除cookie,可以避免暴露自己的隐私,但实际上很多后台软件还是可以获取你的上网记录的。尤其是一些杀毒软件,可以在某种意义上保护你的隐私,获得更全面的隐私数据。从技术角度来说,用户保护自己的隐私还是很难的,用户体验很差——我们的注意力应该从提高用户的水平转移到要求高的企业。
现在随着智能手机的普及,很多人的手机里都有黑名单,可以添加促销短信和电话,防止骚扰。这是一种隐私保护吗?
如果你觉得一个电话是恶意的,那只能说明它的定位不是很准。我猜可能只是你出现在一个名单上,对方客服一个个打电话过来。但是它确实对你的生活有一些干扰。我们无法完全阻止这些干扰,尽管我们也可以通过许多方法来消除一些垃圾短信。