这是反抗许多年轻人隐藏身份的“马甲”。是算法收割的,曾经以个性十足、隐姓埋名特立独行为傲的届年那批人,现在更在意的轻人是怎样隐匿自己在网络上的言行,而原因是反抗只为了逃脱“算法围城”。
但他们何尝不知道,数字生存如同雪泥鸿爪,数字互联时代,想要雁过无痕,谈何容易!
“硬刚”算法的年轻人
不管承不承认,我们每个人都活在算法围城之中。
面对算法围城,普通人有普通人的痛楚,名人有名人的烦恼。
近一年以来,农夫山泉创始人钟睒睒以及农夫山泉频上“热搜”:从产品、环保议题到个人家事,不仅农夫山泉的股价应声滑落,钟睒睒个人也遭受了前所未有的流量“集火”。
忍无可忍的钟睒睒在一场交流活动中隔空喊话字节跳动创始人张一鸣,直言有人利用算法“制造单一叙事和恶意对立”,并称这种“利用科技手段、技术能力造成的恶”比普通人造成的恶要大,“是大恶”。
“他们用算法放大情绪,把复杂的问题简单化,把不同的声音屏蔽掉。”钟睒睒说,这种行为不仅破坏了公平的舆论环境,也让公众陷入片面认知,而受害者往往都是底层民众。
在“网暴”面前,绝大部分人不是钟睒睒。面对各种算法织就的网,钟睒睒可以“隔空喊话”,普通人却只能套上“马甲”。
于是,越来越多的年轻人决定主动出击,试图“反向训练算法”,和平台正面“硬刚”。
“反向驯化”其实见效甚微
“反向训练算法”有没有用?《中国科学报》就此咨询了算法专家。得到的答案,恐怕要给大家浇一盆冷水。
“‘反向驯化大数据’这类做法可能仅仅对一些简单的算法有效果。”中国科学院自动化研究所副研究员、武汉人工智能研究院算法总监吴凌翔说,平台会根据用户大量的历史信息、IP地址、社会关系、手机型号等做算法推荐,如果用户不了解算法机制,很难“反向训练”。
中国传媒大学媒体融合与传播国家重点实验室媒体大数据中心首席科学家沈浩则认为,用户通过主动关闭定位、禁止后台调取通讯录等方式能起到一定的屏蔽作用,但试图通过调整标签、更换人设来“迷惑”算法,可能适得其反,新的“人设”还会出现新的“信息茧房”。
事实上,许多软件都给了用户选择取消“个性化推荐”的功能,但由于这项功能于平台而言太过重要,往往隐藏较深。
而在沈浩看来,取消个性化推荐也不能根治“信息茧房”。
“不推荐、表示‘不感兴趣’也是一种推荐。”沈浩告诉记者,算法是基于用户数据驱动的,每个人都或多或少被“困”在“信息茧房”里,只不过感知程度不同。
北京航空航天大学计算机学院教授王静远直言,自己虽然没有专门研究过用户对抗算法推荐的做法,但他对出现的这种现象并不感到意外。
“这反映了一些算法对用户信息的收集和利用有些过分。”王静远对《中国科学报》说,当平台逼得用户连头像、昵称这些基础信息都要隐藏,说明用户的一切痕迹都有可能被作为特征而提取,“用到极致了”。
“当一切痕迹都在利益驱使下过度商业化时,自然会有反抗。”王静远说。
“旧病未愈,又添新疾”
一边是平台利用算法精准织网,一边是越来越多的人开始觉醒与反抗。野蛮生长的算法乱象,正被社会全方位审视。
近日,中央网信办、工信部、公安部、市场监管总局四部门联合部署开展“清朗·网络平台算法典型问题治理”专项行动,重点整治“信息茧房”、操纵榜单、利益侵害、大数据“杀熟”、算法推荐等典型问题。
但如果回溯大数据兴起之时,“算法治乱”一直都有。
早在2018年,美国脸书首席执行官马克·扎克伯格在美国国会上就数据隐私、虚假信息、监管等数个议题接受讯问。当时人们已经意识到,当用户获得免费或者极低费用的服务时,消费者将被要求提供更多的个人数据,而这些数据被滥用的可能性会显著增加。
我国也在2021年就出台了《关于加强互联网信息服务算法综合治理的指导意见》《互联网信息服务算法推荐管理规定》等规定,明确算法治理的必要性和具体要求。而此次“清朗·网络平台算法典型问题治理”专项行动,力度更大、问题更加聚焦。
曾经,互联网努力为不同人群、不同议题提供平等的交流平台,打造自由对话的多元空间。但随着“流量至上”成了各大平台目标,它们开始借由算法之手不择手段,用户隐私信息得不到保护的问题浮出水面。
近年来,随着大语言模型技术进步、生成式人工智能服务兴起,若人工智能(AI)技术不加规范,会带来许多新问题:AI换脸诈骗、AI造谣、AI偏见歧视、AI语言暴力等。尤其是当生成式人工智能服务的对象是未成年人和老年人时,将会面临更大的风险。
据外媒报道,创办于2021年的Character.AI平台,近期就因开发的“情感陪伴聊天机器人”而官司缠身。今年10月,Character.AI在美国佛罗里达州一名青少年自杀事件中“扮演了某种角色”;12月,美国得克萨斯州一对父母决定起诉它“教唆未成年人杀害家长”,他们称机器人聊天工具让未满18岁的青少年“过度接触了色情、血腥暴力等不良内容”。
能否打开算法“黑箱”?
面对算法“作恶”,钟睒睒呼吁“算法应该明白无误地公之于众”。他认为,没有一种标准是不可以公布的,应该公布并让所有使用者评价其意义。
但公开算法,就能打开“黑箱”、制止乱象吗?
王静远也同意,算法机制问题并不像想象的那样简单。“比如深度学习本身就是一个‘黑箱’,即便开发者也不清楚其中原理。”
事实上,对于算法工程师而言,真正的“黑箱”不在算法原理之中,而在数据与平台机制的设置之中——当用户量增大、数据变多,平台机制逐渐向利益“妥协”,久而久之便产生了“算法乱象”。
“算法始终是算法设计者意志的反映,是平台意志的反映。”北京大学数字治理研究中心主任邱泽奇在接受《中国科学报》采访时说。言外之意,复杂的算法问题背后潜藏的是平台“无形的手”。
就如钟睒睒所遭遇的那样,“当你打开这些平台,看到的总是同样的内容”“很多恶是人为造成的”。
不得不提的是,许多平台型软件在诞生之初,都肩负着改造社会的使命。不可否认,这些软件已经成为人们数字生活中的基础设施,但在巨大的发展惯性下,平台自发性选择了阻力最小、收益最高的方向,轻视乃至忽略了社会价值。在这种嬗变之中,算法的用途逐渐跑偏。
“在算法训练中,目标导向是关键因素。”王静远告诉记者,人工智能算法在设计时,会要求开发者设置一个目标函数,训练算法时会尽最大可能优化这个目标函数。如果算法以提高调度效率为目标,在模型优化过程中就会牺牲其他因素来追求高效;如果以精准的个性化推荐为目标,就不可避免地出现过度收集和利用信息的问题。
信息大爆炸时代,算法的筛选和过滤无疑迎合了为大脑“降本增效”的刚需。然而,当精准“捕捉”用户已无法满足平台的胃口时,杀熟成了平台“向前一步”的试水。王静远提到,平台通过“精准营销”为不同消费水平的顾客推荐不同价位的产品尚情有可原,但通过分析用户经济能力进行“个性化定价”的歧视行为就令人难以接受了,这在技术上能够且应亟须加以规避。
走向共同治理
在访谈中,几位专家不约而同谈到,除了人为滥用算法制造矛盾和对立外,算法更多是在复刻社会的现实问题。
“坦率地讲,算法就是帮你算数。你写了一套程序,它帮你把一些说不清、道不明的规律从数据里‘扒’出来。我的观点是,算法不会作恶。”邱泽奇说,问题的关键是数据和算法的匹配以及算法的调试,“说到底,都是人在忙活”。
他提出,不同的人虽然在使用同一个软件平台,但每人对数据的贡献和得到的反馈,在量和质上都有差异;而当算法应用数据时,便会复刻现实社会的结构,甚至放大现实社会的问题。
基于此,他认为有两条路可以尝试解决算法问题:一是对真实数据进行权重配置,二是调试算法进行纠偏。
“算法是人写的,是可以调整的。在方法意义上,算法是工具。”邱泽奇认为,工具是否适用是可以做交叉检验的,在技术上并不难实现。
他坦承,通往“算法向善”的道路曲折而遥远,需要多方共同努力。
吴凌翔提出了类似建议,她认为算法治理需要搭建一个用户、平台、专家共同参与、共商机制的平台,促进通过对话达成共识。此外,她认为用户反馈机制和参与机制非常重要,这是社会治理的一种体现。
技术层面也有施展空间,以推荐算法为例,吴凌翔说,不仅要提升数据的多样性和丰富度,还可以对算法进行公平性约束、增加敏感性分析,并通过评估监测推荐系统内的不同环节,增加敏感性分析等方式,从技术角度对算法纠偏。
“只有把蛋糕做大,才有蛋糕可分。”邱泽奇认为,治理与发展本就是一场拉锯赛,当前应在促进创新的前提下,通过“问责制”调整利益分配的逻辑和份额,考虑分配的公平性问题,在鼓励创新与促进平等之间寻求平衡。
“对于新生事物,制度建设不宜超前。”邱泽奇强调,新发展也会带来新问题,算法治理无法一蹴而就。“一个简单的警示和预防策略是对伤害的问责。”他强调,随着AI深入发展,算法自身的逻辑网络会越来越复杂,试图就具体问题进行预防是没有止境的。(中国科学报)