大数据算法可能会塑造一个更糟糕的互联网世界。
PC时代真正拉开全球普及的帷幕,大概是在世纪之交的2000年。在此之前,虽然影视作品已经深度塑造了许多黑客形象,但人们对计算机的直观认识还很肤浅。真正改变这种现象的动力不仅仅是PC自身性能的发展,还有互联网。PC+互联网奠定了我们这个时代信息高速公路的基石。在他们铺设的信息道路集群上,手机等更轻便的终端不断发展,最终占据了我们的生活,最终演变成了现在的大数据算法浪潮。
每个人都是大数据算法下可识别的节点。
在科技趋势上,艺术领域总是领先于工程实践甚至社会意识。当我们站在2018的时候,突然回头。十年前甚至二十年前的电影,基本上都预言了AI、大数据等各种“先进科技实践现象”的到来。当然,我们现在所接触到的大数据算法的应用,与人们现有的预期还是有很大差距的,处于比较早期的发展阶段,但是它的影响已经开始渗透到我们生活的方方面面。
大数据是将互联网信息的瀑布塑造成可识别形状的过程。
首先,明确我们这里所说的大数据算法,是指互联网信息生产者、接力者等利益相关者利用关键数据信息的统计,建立用户特征分类,描述具有分析价值的用户画像,从而采取差异化方式的一种策略。
对于直接生产者来说,谁买了我的“内容”,谁就统计他们的特点,根据特点卖我的产品。
对于信息中介来说,谁使用了我们的“服务”,谁就会统计他们的信息,基于时间、空间等任何有意义的节点,为不同的用户设计我们提供信息的呈现方式和范围。
大数据算法可能会塑造一个更糟糕的互联网世界。
严格来说,这些策略的诞生并不依赖于互联网。早在市场经济之初,商家就自发地开始了解市场偏好,为不同的用户群体设计策略,这是商品社会建立的基石之一。但在一些后发市场,直到几十年前,创始人自己的南巡经历仍然是提供战略依据的核心要素——看康师傅红烧牛肉面的口味选择。
互联网创造了人类历史上从未有过的数据收集和流通环节,创造了信息检索和归纳的温床。互联网的普及是信息时代的必然事件,基于互联网的大数据算法决策也是互联网自身发展的必然要求。我们要讨论的问题不是这些会不会发生,而是进化过程中如果过于忽视规则引导可能产生的后果。
视而不见会加剧对立。
与冷冰冰的IE不同,谷歌浏览器在连接失败时会显示一个相当可爱的“恐龙”头像,告诉用户如果没有互联网,所有人都会回到落后的中生代。事实上,中生代统治地球的恐龙(非鸟类恐龙)整体目的灭绝,与大数据算法可能带来的弊端非常具有可比性。
Chrome浏览器嘲讽了断网的“中生代”。
现存的高等脊椎动物类群都是从两栖类分化出来的,代表恐龙、鳄鱼等的“蜥脚类”。而代表哺乳动物的“拱合动物”从很小的时候就分道扬镳了。恐龙出现在三叠纪中晚期,依靠呼吸效率优势挺过了三叠纪末的艰难时期。它们在全球高温、潮湿、强海侵时期保持了1.6亿年的主要特征,舒舒服服地生活到6500万年前,随即在环境巨变的惊天动地的K-T大灭绝事件中壮烈牺牲,再也见不到古近纪的太阳。
正是适合蜥脚类动物的低氧、高温、潮湿的气候,使得它们的优势和特点迅速发挥作用,并持续规模化、专业化。在他们之前,二叠纪合轴动物所行使的耐寒性(高代谢能力)并没有进入他们的眼睛(生物选择是不必要的)。漫长而固定的环境固化了它们的特性,“进则出”的生物本性抹杀了它们的分化之路,最终导致了它们的灭亡。
非鸟类恐龙过于特化,受环境影响灭绝(不只是大规模)。
是的,它不仅是生物进化的本能规律,也是智慧生物认识世界的自然规律。
对于文明时代的个体来说,环境的高度稳定和统一显然不是锻炼心智和知识的有利因素。“不经过府县,不进台湾馆”一直是各国机要人员默认的做法。如果有一天某个重要组织的掌舵人换成了一个从小娇生惯养、知识贫乏的年轻人,那很可能会出事,他也会步“恐龙王朝”的后尘。
在互联网发展的初期,确实丰富了普通网民的知识层次,开阔了他们的视野,类似于早期恐龙不得不面对的复杂自然环境。然而,经过几十年的野蛮生长,大数据算法终于成熟了。在构建大数据算法的过程中,每个用户都会毫无察觉地贡献出自己关键的“最爱”特征。
喜欢看球的朋友会发现,他们浏览器和app的推送一直是体育,喜欢金融的永远挑不出金融知识。如果你是一个喜欢辩论的网民,很容易陷入自我确认和攻击他人之间的死循环。如果大数据算法真的能被软件和信息厂商巧妙地有效利用,那么坚持“PC玩游戏比主机好”的用户,可能永远也看不到中立第三方的大部分观点和意见。
大数据会放大台式笔记本果粉和主机“贱民”的对立
大数据算法找到了你的选择,用粘性的“智能”信息流半永久地、潜移默化地把你卡在那个方向,这是我们现在已经开始面对的现实。被不断的丛林包围,其他观点和信息被隐藏。长此以往,用户将成为中生代“自由王国”里舒舒服服漫游的恐龙皇帝,对自己世界之外的事物漠不关心。
每个人都有自己的认知盲区,即使是受过良好教育的大学教授,如果不加以限制,也常常会在简单的认知问题上翻船。“恐龙”和“恐龙”会进一步强化喜好和对立,人与人之间的有效沟通会在很大程度上受阻。
一叶不见泰山,这是大数据算法最有可能的严重后果。
价格歧视导致不公平。
“十年磨一剑,霜刃未试,今日给你看,谁有委屈?”公平自古以来就是人民用户的追求,甚至高于形式上的平等。平等意味着机会的绝对平等。自从人们进入了民族文明时代,大多数人都安于自己的命运。但是公平就不一样了。它代表了资源分配系统中权利和责任之间的对应关系。
世界的互联互通是一把双刃剑。
人不会比爱因斯坦聪明,也不会比比尔·盖茨比富有,但办公室里资历差不多的人,是无法容忍突如其来的财富或意外的利润的。如果真的有一套规则,决定了体制内不同的人应该付出什么,回报什么,并且这套规则得到了广泛的认可,运行了很长时间,那么任何敢于挑战这个规则的决定都是不明智的。
不幸的是,大数据算法是为了挑战现有的模糊(但相对公平)规则而创建的。数据提供商费尽周折,在至强服务器上花费了大量的计算时间,就是为了把自己的用户群分类得更细,把自己的决策模型构建得更真实。如果这些都成功或者部分实现,区别对待这些用户显然是商家最大的追求。
被APP和全世界公认为跟着涨价的土豪是什么体验?
这是价格歧视。在大数据算法普及之前的商品社会,虽然价格歧视也存在,甚至非常明显,但它已经是既定规则的一部分,而且相对透明,广为人知,对社会伦理的挑战也相对有限。禁止衣冠不整者进入高档酒店大堂(礼仪本身就体现了一定的物质、认知和人际资源门槛,从一开始就是人群分类的标志),这是社会上大多数人认同的一种规范。奢侈品不是为主流用户设计的,大家都觉得很正常,这是普遍现象。
大数据算法是价格歧视的有力工具。
但是当大数据和算法开始入侵商业社会的时候,人们会很快感到不适。大数据的厮杀已经开始让相当比例的用户敏锐地察觉到。在相同的初始条件下,APP和web客户端根据后台已有数据自动提供不同的价格、折扣甚至广告引导信息策略。一方面,人们开始感到不公平,这一时期的伦理问题非常严重;另一方面,当大数据算法已经开始深度定制针对不同人群的信息引导方案(引导是误导)时,用户往往会陷入失去参照系的恐惧,这是对市场信心更深层次的伤害。
当酒店预订APP明确说很多房源可以免费退订,退订两次后你就再也看不到类似的选项了,但是你的好友却完全不受限制;当你当地的朋友请你吃两顿大餐的时候,当你发现你点餐APP里推荐的餐厅和菜单都是奢侈而昂贵的时候,你会感到崩溃。
而这只是大数据算法最粗糙模型的初步应用。
鹰眼充满了风险。
在全球范围内,公共摄像头带来的隐私问题一直备受争议。人们普遍担心国家机构以安全的名义设计的各种信息(图像)存储机制会被泄露甚至不当使用。大数据算法普及后,信息收集和筛选的主体开始从主权国家向成熟的商业公司扩散。
2018没有终结者,但人们还是担心天网。
世界上主要国家都采用代议制政体,理论上都是对本国公民负责。人们甚至对自己选择的主权国家都不放心。为什么他们要放心的和有明确用户特征的大数据算法提供者和诱导者在一起?
互联网创造了人类历史上从未有过的庞大数据流,扩大和发展了世界的贸易体系、资源配置体系、知识传播和交流体系,甚至开始侵蚀人们的社交网络。面对海量数据,人的行为和组织形式越来越复杂。在北京和纽约这样的城市,街上的人一般对街上的建筑一无所知。那么,普通人能有多少精力去了解自己熟悉领域之外的复杂社会决策系统呢?
即使是主要国家的政府监管机构,由于其非营利性和非生产性,对技术和商业运作的理解也普遍落后。即使是强大的组织,也往往对商业公司的决策模式和安全状况一无所知。指望社会力量自发监督大数据算法操作系统被正确使用,无疑是痴人说梦。
人们担心主权国家,怎么能相信商业公司的意识?
没错,主流的科技公司和跨国公司都在强调自己的社会责任和公益意识,但无论他们把多少部分的利润用于开展与主业无关的公益事业,都解决不了人们对自己的监督问题。
当一个公司通过你买什么食物,愿意去哪家电影院看来推断你的性格和决策心理时,你保护他的能力就很差了。那么这样一个有组织的公司获得的数据会被用在哪里,会被交易吗?如何管理、尊重和保护这些数据不被滥用?这是一个值得大家探讨的问题。社会问题永远不是某些利益相关者自发的道德所能解决的。开发大数据算法的机构和实践使用大数据算法的公司,无论如何都解决不了任何本质问题。
科技瓶颈需要更高水平的科技发展来解决。
有了这些弊端,我们就不想要大数据了吗?这显然是不可能的,技术的驱动力是人类无法逆转的。正如我们在开头所说,这几乎是不可避免的。要解决这些问题,一方面要有认识和关注的勇气,依靠用户舆论和政府监管来纠正商业公司的错误引导。另一方面,也要着力发展大数据算法。
社会发展的瓶颈只能靠更高水平的发展来解决;科技进步的弊端只能通过更发达的技术手段来遏制。开放积极的态度是我们解决大数据算法问题最重要的武器。