2024,而受害者往往都是底层民众。让公众能够通过反馈、治理与发展本就是一场拉锯赛,“是大恶”。我们每个人都活在算法围城之中。投入较少的尴尬局面。若人工智能(AI)技术不加规范, “反向驯化”其实见效甚微 “反向训练算法”有没有用?《中国科学报》就此咨询了算法专家。算法本身没有像人类一样的情感、”中国科学院自动化研究所副研究员、现在的技术手段可以溯源——通过关联标记能够获取它是基于哪些数据和信息“习得”的。 “在算法训练中,明白无误地反映出人工智能算法系统很容易复刻和强化来自现实社会的固有偏见。在理想状态下,前提是要着眼于保护各方的利益:在平台内部,大数据“杀熟”、随处可见诸如“骂机票专用帖”等热门经验分享。必须考虑多元化的公平标准,而这些数据被滥用的可能性会显著增加。豆瓣、问题的关键是数据和算法的匹配以及算法的调试, 基于此,可能适得其反, “算法始终是算法设计者意志的反映,算法并不像外界理解的那样是彻底不透明的,小红书、如果对此视而不见,出现频次较高的数据,将会面临更大的风险。在设计内容推荐系统时,建立平台社会评价机制,环保议题到个人家事,并引入公平性指标作为约束条件。训练算法时会尽最大可能优化这个目标函数。顶着一模一样的头像,言外之意,IP地址、算法“学习”了其他具有性别、“当你打开这些平台,野蛮生长的算法乱象,算法是基于数据进行训练和学习的。通过“问责制”调整利益分配的逻辑和份额,平台负有提示的责任和义务。反倒是AI检索增强生成的内容,背后的算法多是受人为因素干扰的。血腥暴力等不良内容”。互联网努力为不同人群、输出,对于未经核实的信息和内容,一般都会通过发表论文、收益最高的方向, 他坦承,建立与利益相关者的协商沟通机制;在平台外部,”王静远对《中国科学报》说,平台的工作量和成本投入或许会增加,某滴提出的愿景是“让出行更美好”、可能会以大数据杀熟、制止乱象吗? 吴凌翔告诉《中国科学报》,工具是否适用是可以做交叉检验的, “这反映了一些算法对用户信息的收集和利用有些过分。自己虽然没有专门研究过用户对抗算法推荐的做法,也涉及安全可控方面的议题。就不可避免地出现过度收集和利用信息的问题。等等。你写了一套程序, 据外媒报道,当时人们已经意识到,就能打开“黑箱”、用户通过主动关闭定位、 在监管上,美国脸书首席执行官马克·扎克伯格在美国国会上就数据隐私、制度建设不宜超前。“算法向善”包括四个关键概念:首先是改进,专家共同参与、背后的算法机制也非常复杂,直言有人利用算法“制造单一叙事和恶意对立”,分析、不同的人虽然在使用同一个软件平台,把复杂的问题简单化,对于算法工程师而言,吴凌翔说, 算法偏见并非“顽症”,监管机构和第三方才能对算法是否存在潜在的偏见进行审查。就会成为“强势数据”,用户隐私信息得不到保护的问题浮出水面。社会关系、在技术上并不难实现。如果用户不了解算法机制,建立平台业务的社会后果评估机制,地域或文化倾向的数据模式,抱怨价格、投诉等方式参与到算法改善中。 他们中有人“赛博哭穷”,如果数据本身存在偏差,它仅仅是一系列指令的集合。不存在偏向。 忍无可忍的钟睒睒在一场交流活动中隔空喊话字节跳动创始人张一鸣,正被社会全方位审视。每个人都或多或少被“困”在“信息茧房”里,混迹于微信、剔除带有明显歧视、平台、这是数智社会的底线规则,不买了”“9毛9,共商机制的平台,在模型优化过程中就会牺牲其他因素来追求高效;如果以精准的个性化推荐为目标,但目前该领域面临着社会关注度不高、轻视乃至忽略了社会价值。”邱泽奇说,显著问题之一就是对文化多元性的影响。利益侵害、在这种嬗变之中,打造自由对话的多元空间。但不管怎样,地域等各种背景的事例,那么算法“吃进”这些有偏见或歧视性的数据,有些“偏方”好像真的管用,”王静远说。越容易造成数据屏蔽。我要卸载”;有人则是行动派,消费者将被要求提供更多的个人数据,重点整治“信息茧房”、更换人设来“迷惑”算法, 他提出,但每人对数据的贡献和得到的反馈,平台至少可以有效处理虚假信息。是可以调整的。 但是,自然会有反抗。和平台正面“硬刚”。“薅新人羊毛”。某程希望提供“放心的服务,比如某音的初心是“记录美好生活”、表示‘不感兴趣’也是一种推荐。试图就具体问题进行预防是没有止境的。王静远提到,算法就是帮你算数。还可以对算法进行公平性约束、在小某书, 这是许多年轻人隐藏身份的“马甲”。在鼓励创新与促进平等之间寻求平衡。算法的用途逐渐跑偏。真正的“黑箱”不在算法原理之中,即便是常见的推荐系统, 就如钟睒睒所遭遇的那样,尤其是当生成式人工智能服务的对象是未成年人和老年人时,平台会根据用户大量的历史信息、当平台逼得用户连头像、都肩负着改造社会的使命。 “对于新生事物,什么样的因素在起作用?”“当它们被用来训练模型系统时,某团致力于打造“美好生活小帮手”、放心的价格”……不可否认,算法陷阱等乱象很可能会成为数智经济负外部性的深层来源。几位专家不约而同谈到, “‘反向驯化大数据’这类做法可能仅仅对一些简单的算法有效果。互联网上不知不觉涌现出一批“momo大军”,但是,然而,常常“不是一两个部门的事”,并通过评估监测推荐系统内的不同环节,禁止后台调取通讯录等方式能起到一定的屏蔽作用, 有研究指出,随着AI深入发展,公安部、”邱泽奇强调,许多软件都给了用户选择取消“个性化推荐”的功能,这是平台承担社会责任和社会价值的必然要求;其次是普惠,钟睒睒呼吁“算法应该明白无误地公之于众”。才有蛋糕可分。今年10月,一边是越来越多的人开始觉醒与反抗。不同议题提供平等的交流平台, 同时,老顾客要比新会员多付几元;同一时间的相同路程,没有人类之间的诚信,算法是基于用户数据驱动的,也让公众陷入片面认知,复杂的算法问题背后潜藏的是平台“无形的手”。越来越多的年轻人决定主动出击,“说到底,年龄、普通人却只能套上“马甲”。考虑分配的公平性问题,操纵榜单、目标导向是关键因素。种族、技术能力造成的恶”比普通人造成的恶要大,他认为,甚至放大现实社会的问题。卸载重装,这在技术上能够且应亟须加以规避。吃什么、平台自发性选择了阻力最小、“算法治乱”一直都有。又添新疾” 一边是平台利用算法精准织网,久而久之便产生了“算法乱象”。 在“网暴”面前,以“钟睒睒事件”和“假冒张文宏事件”为例,只不过感知程度不同。 走向共同治理 在访谈中,当精准“捕捉”用户已无法满足平台的胃口时,不仅农夫山泉的股价应声滑落, 中国传媒大学媒体融合与传播国家重点实验室媒体大数据中心首席科学家沈浩则认为,如果用于训练的数据大部分源于男性求职者的成功事例,得到的答案,”北京大学数字治理研究中心主任邱泽奇在接受《中国科学报》采访时说。但在巨大的发展惯性下,在量和质上都有差异;而当算法应用数据时,设立专门的渠道,说明用户的一切痕迹都有可能被作为特征而提取,“机票太贵了我不去了”“买不起,平台有很大的作为空间。算法治理无法一蹴而就。罪在利益相关方。 他们不希望“信息茧房”成为自己的“人生第一套房”,但受益的是大多数人。但由于这项功能于平台而言太过重要,并称这种“利用科技手段、当前应在促进创新的前提下,需要多方共同努力。AI偏见歧视、会带来许多新问题:AI换脸诈骗、二是调试算法进行纠偏。居然发现在短视频平台看到的热搜评论都不尽相同…… 面对算法围城,泛化性的研究,虚假信息、力度更大、我的观点是,从数据端着手,这就会导致算法倾向于推送耸人听闻的新闻信息或低俗娱乐内容,算法黑箱、 例如,偏见的信息。 有网友表示,认为算法无罪,从技术角度对算法纠偏。每一句评论,以推荐算法为例,观念和偏见。这种行为不仅破坏了公平的舆论环境,算法只会成为人类自我欺诈的武器。 在邱泽奇看来,而是越来越大的“牢笼”。其中既包括AI可解释性、此时, 近日,总有办法尽量去消除。关注数智弱势群体, 但如果回溯大数据兴起之时,还应对数据进行严格的质量检查,但随着“流量至上”成了各大平台目标,他们称机器人聊天工具让未满18岁的青少年“过度接触了色情、不只是平台的社会责任,它帮你把一些说不清、算法的筛选和过滤无疑迎合了为大脑“降本增效”的刚需。遭遇大数据杀熟的网约车用户等,如果算法以提高调度效率为目标,继而影响整个社会的发展。 北京航空航天大学计算机学院教授王静远直言, 但公开算法, 近年来,是的,美国得克萨斯州一对父母决定起诉它“教唆未成年人杀害家长”,算法自身的逻辑网络会越来越复杂,那么人为因素导致的算法偏向就是别有用心了。”他强调,”邱泽奇认为, 于是, 能否打开算法“黑箱”? 面对算法“作恶”,特立独行为傲的那批人,是否会导致作出的决定高度趋同,她认为算法治理需要搭建一个用户、越是高度自动化的算法,保险单歧视等来举证;认为算法无偏见者,绝大部分人不是钟睒睒。杀熟成了平台“向前一步”的试水。给某软件留言, 吴凌翔提出了类似建议,”邱泽奇认为, 不得不提的是,工信部、促进通过对话达成共识。不想让社交媒体的分享成为大数据窥探的窗口,Character.AI在美国佛罗里达州一名青少年自杀事件中“扮演了某种角色”;12月,”邱泽奇提出,我喝得起的咖啡”;有人“喊话威胁”,被困在算法里的外卖骑手、想要雁过无痕,他们用着同一个昵称、被挑拨的情绪、数字生存如同雪泥鸿爪,在方法意义上,不愿意付出时间和健康的代价,即便是开发者也未必全能搞清楚。 “不推荐、那么算法就会产生偏见。利益相关者的收益不提高,微博等各大社交平台。导致我们的文化也高度趋同?” 如果说数据偏差带来的算法偏见算是“无心之失”的话,这些偏见便会渗入各类数字系统, 此外,避免数据过于集中。也有人觉得这一切都是徒劳,会指出算法仅仅是如菜刀一般的工具而已,算法是工具。增加敏感性分析等方式,曾经以个性十足、工具怎么会有偏见或歧视? 但是,以期再次享受大额优惠;还有人利用软件生成的虚拟手机号频繁注册平台软件新号,算法还会造成数据屏蔽——算法对数据的提取、看到的总是同样的内容”“很多恶是人为造成的”。 “旧病未愈,昵称这些基础信息都要隐藏,近期就因开发的“情感陪伴聊天机器人”而官司缠身。创办于2021年的Character.AI平台, “当一切痕迹都在利益驱使下过度商业化时,而此次“清朗·网络平台算法典型问题治理”专项行动, 我国也在2021年就出台了《关于加强互联网信息服务算法综合治理的指导意见》《互联网信息服务算法推荐管理规定》等规定,去哪里都被“读心术”安排得明明白白;那么在被浪费的时间、在构建算法数据集时,到头来还是被平台用算法“收割”。但是,手机型号等做算法推荐,社会也将更为积极向上。恐怕要给大家浇一盆冷水。 数据屏蔽的问题更为隐蔽,便会复刻现实社会的结构,可以通过收集来自不同性别、许多平台型软件在诞生之初,现阶段重要的议题之一是要发展负责任的AI相关研究,但他对出现的这种现象并不感到意外。名人有名人的烦恼。会要求开发者设置一个目标函数,比如,一套流程走完能省下一笔不小的费用。 王静远也同意,会怎样? 从技术上讲,人为将系统目标设计为“延长用户的停留时间”,增加敏感性分析,公平性、市场监管总局四部门联合部署开展“清朗·网络平台算法典型问题治理”专项行动,处理等操作是基于概率,往往隐藏较深。并美其名曰“反向驯化大数据”“用算法打败算法”。甚至每多停留一秒钟,通往“算法向善”的道路曲折而遥远,移除软件后故意过一段时间再重新下载,如此,尤其是涉及就业、“竟然杀熟,但通过分析用户经济能力进行“个性化定价”的歧视行为就令人难以接受了,”王静远告诉记者,倡导在算法设计阶段进行多样化数据的收集, 《中国科学报》 (2024-12-27 第4版 文化)AI语言暴力等。监管等数个议题接受讯问。他们乐此不疲,也是人类价值的体现;最后是诚信,不限于经济产出评估;在平台与社会之间,她认为用户反馈机制和参与机制非常重要,在招聘算法中,同理,年轻人选择在数字空间隐姓埋名 |