首页 > 知识技巧 > 知识技巧 > 致幻的AI Overviews,谷歌再次翻了车

致幻的AI Overviews,谷歌再次翻了车

发布时间:2024-05-28 22:45:18来源: 15210273549

继将马斯克画成黑人后,谷歌再次翻了车。(虎嗅注:今年2月份,谷歌的Gemini在推出文生图功能几周的时间内,被用户发现该平台刻意拒绝生成白人形象。对此谷歌方面表示加快改进,暂停人物图片的生成功能。)

此次谷歌又犯了前科。在5月15日推出这一AI搜索引擎功能后,有不少用户在使用过程中发现谷歌的AI Overviews会“胡言乱语”,对搜索的问题给出有违常识的、荒谬的解决方案。比如,兔子曾经作为密尔沃基鹰队的后卫在NBA打过球、金毛犬可以生下奶牛、建议人们每天至少吃一块小石头……

此外,谷歌的人工智能搜索系统有时会难以解决基本的数学问题和方程式。例如,询问2000年美元的相对价值,会返回一个荒谬的答案,即“2000 年至 2023 年期间价格累计上涨 -43.49%”(根据谷歌自己引用的通胀计算器,当时价格实际上涨了77% );又或是认为2024年10月至2025年1月之间有 738,523 天。

AI Overviews是谷歌在5月15日的I/O大会上高调推出的新型AI搜索引擎,由Gemini大模型驱动,展示在谷歌搜索的页面顶部,可总结提炼用户查询内容的概要。在I/O大会上,谷歌称该功能将“重新定义搜索体验”。由于这一功能的推出,一些专家甚至将这一天称为 Google 搜索的“零日”。 2023年5月推出的Search Generative Experience是AI Overviews的测试版。CEO 桑达尔・皮查伊曾表示,在测试版推出后谷歌已经处理了超过 10 亿次查询。

之所以会犯这样的错误,最直接原因是Reddit网站网友评论的错误数据。谷歌的大模型以Reddit上的帖子作为学习资料,在数据清洗与训练环节出现纰漏,因而出现了“大模型致幻”。

事实上,谷歌这样“满纸荒唐言”并非个例。

谷歌之外,OpenAI、Perplexity、You.com等无一幸免,均出现过不同程度的失误。为了增强对话的拟真性和数据的全面性,这些AI搜索功能都将Reddit等社交平台作为模型训练的数据库,甚至奥特曼本身便是Reddit的投资人。

但Reddit等社区上的发言良莠不齐,显然AI在内容真实性和可靠度方面的判断力还未成熟。在常规的搜索中,这些来自随机互联网用户的恶作剧帖子可能不会成为人们点击网络链接列表时看到的首个答案。但有了AI Overviews后,这些恶作剧帖子就被整合到结果页面顶部显示的权威数据摘要中。

本质上,AI Overviews此次出现的问题是人工智能幻觉的一种新变体,当生成式人工智能模型提供虚假或误导性信息并将其呈现为事实时,就会出现幻觉。幻觉是由有缺陷的训练数据、算法错误或对上下文的误解造成的。

HITCon安全会议上的相关研究成果显示,仅仅需要“污染”不到0.7%的数据集,就能有效规避防御机制,导致大模型输出的内容准确性大幅下降。当大模型被投喂的数据集含有误导性信息时,其给出的结果必然同样失真。

对此,纽约大学的AI专家和神经科学荣誉教授加里・马库斯(Gary Marcus)曾表示,AI模型天生无法对自己的工作进行理性检查,而这正是这个行业的致命伤。

而谷歌发言人梅根・法恩斯沃斯则表示,“用户展示的事例都是不常见的查询,并不代表大多数人的经历,我们也看到了一些被篡改或我们无法复现的例子”“绝大多数 AI 概览查询都产生了高质量信息,并提供了深入挖掘网络的链接”。谷歌将使用有问题答案的“孤立例子”来完善其系统。

知识技巧更多>>

越野老炮再进化,车长4790mm,配副驾大屏,全时四驱+前后差速锁 新一代“蛙王”,依旧提供weissach套件,预计保留4.0升自吸引擎 专为年轻人打造,四门轿跑车身设计,搭载1.5T轻混,加速4.9s 国产硬派SUV,车长5078mm,非承载车身+超级四驱,最小离地213mm 德系实力派,车长4735mm,配2.0T+7挡湿式双离合,加速6.5s油耗7L 法拉利超级旗舰,蝶翼式车门,V6混动+F1赛车技术,剑指迈凯伦W1 领克打造的轿跑,车长4697mm,265马力、加速5.7s,还有弹射起步 特立独行的国产车,皮卡造型打造,增程/纯电双动力,还有CDC悬架 宝马的“王牌”,配V8插电混动,727马力/1000牛·米,极速306km/h 别克的巅峰之作,配后排独立空间、星空幻影车顶,还有32寸大彩电 比亚迪全新大型SUV,腾势N9官图发布,车长5.3米,年内正式亮相 2025款大众速腾正式上市,配置升级,价格不变,两种动力 看完对比:零跑全新C01是真豪华!PK深蓝L07,坐实C级身份 一汽奔腾新款SUV曝光,全新设计风格,车长4450mm,搭载华为动力 本田全新SUV曝光,回归硬派越野定位,搭载3.5L动力,11月亮相 一个偏科技,一个偏家用,极越01焕新款和极氪7X到底有什么区别? 9月破7.5万辆,比亚迪“大小秦”销量一路狂飙,打破合资品牌垄断 新款启辰大V混动版曝光,换装新前脸,车长4620mm,纯电续航110km 死磕BYD,埃安新车曝光,长超4.2米,轴距2750mm,搭100千瓦电机 超4.8米,风阻0.208,续航650km,15万配激光雷达,还看小鹏MONA M03 玩的就是极限!“上刀山、下火海”BJ60雷霆电池的安全真要惊呆了 想买车的看过来 懂车帝30款热门车碰撞测试结果出炉 或是30万内最被叫好的燃油SUV?试驾北京现代第五代胜达 长安福特10月销量环比下滑,声称不卷价格的陈晓波何时“熬出头”? 方程豹 豹8全程护航神十八航天英雄安全回家 竞争宋Pro,超4.7米插混SUV,首搭EM-i,3.75L油耗,加92号油 真我 GT7 Pro入网:最大24GB内存、实体拍照按键 真我GT7 Pro再预热,首发苍穹通信系统2.0 ROG游戏手机9 FE曝光,或有独特设计加持 3749元起,新款苹果Mac mini发布,可选M4、M4 Pro