主页 › 阅读 › 热点 › AI搜索花式翻车，谷歌居然又栽在了数据清洗上

AI搜索花式翻车，谷歌居然又栽在了数据清洗上

三易生活发布于 5月前

46 0

此前在5月15日举行的I/O开发者大会上，谷歌CEO纳德拉向外界正式介绍了AI搜索功能AI Overviews（AI概览）。在谷歌Gemini大模型de 驱动下，AI Overviews能够在谷歌搜索的页面顶部总结提炼用户查询内容的概要。在许多业内人士看来，AI Overviews无疑是谷歌搜索引擎上线25年以来最大的一次革新，以至于谷歌方面敢于宣称该功能将重新定义搜索体验。

但遗憾的是，抢先体验了AI Overviews的美国用户对于“重新定义搜索体验”持不同意见。例如The Verge的记者Kylie Robison就在文章中讽刺了AI Overviews的翻车。她在文中举了一个例子，就是当用户查询如何将芝士和披萨饼胚粘在一起的时候，AI Overviews的回答是，“加点胶水”。尽管胶水确实可以解决粘连问题，但这极有可能是Gemini出现了“幻觉”(Hallucination)所导致的结果。

AI大模型会出现“幻觉”，这如今几乎是人尽皆知的事情，谷歌公司发言人Meghann Farnsworth似乎也是按照Gemini因“幻觉”翻车来解释的。他表示，“这些错误来自通常非常罕见的查询，不能代表大多数人的体验”。但神通广大的网友很快给出了AI Overviews会回答“在披萨上涂胶水”的理由，因为这个回答实际上来源于一个名为“fucksmith”的Reddit用户在11年前发的帖子。

AI Overviews会采纳Reddit用户的帖子来作为回答并不奇怪，因为谷歌与Reddit在AI搜索上是有合作的。

AI Overviews的前身是Search Generative Experience（SGE），它是谷歌推出的一种实验性版本的搜索引擎。在美国谷歌选择了Reddit作为合作伙伴，为用户提供更精准、及时的搜索解答。其实使用Reddit的数据并不奇怪，可问题是谷歌为什么会采信这种明显出现常识错误的数据。

所以最有可能的解释，是谷歌在数据清洗上出现了纰漏，以至于让“有毒”的数据进入了Gemini的数据集。如果事实果真如此，那么在某种意义上就证明了谷歌为了在AI赛道追赶OpenAI，已经急功近利到走火入魔的地步。因为在此之前，谷歌在大模型的数据清洗上已经翻车过一次。

去年年末、也就是Gemini上线不久后，就有国内网友发现用中文向Gemini Pro提问时，Gemini Pro会直接表示自己是百度的文心一言。紧接着在更多的网友提问下，Gemini Pro一会认为自己是小爱同学，一会又承认自己是悟道大模型开发团队北京智源做的。

对此，当时业内人士的主流观点，是谷歌在训练数据上大概率使用了百度文心一言的输出结果，以此来蒸馏自家的Gemini Pro。要知道，OpenAI已经证实了大模型的“幻觉”问题和数据质量息息相关，数据投毒攻击（Data Poisoning Attack）也已经是一个AI领域不可回避的问题。

根据研究人员在HITCon安全会议上的演讲显示，只需要“污染”不到0.7%数据就可以完全绕过防御，进而全面降低大模型输出内容的准确率。用谎言去验证谎言得到的一定是谎言，如果数据集中的参数本身就有问题，那么得到的回答自然就会是错漏百出。因此数据清洗一直以来都是AI厂商最为重要的工作之一，几乎所有的大模型都会加入数个纠错和屏蔽措施，避免数据库遭受有毒信息的污染。

更为关键的是，谷歌可是做搜索引擎起家的，而搜索引擎的核心技术就包括了数据清洗，将爬虫抓取的数据中存在的缺失值、异常值(离群点)、重复值去除，就都是数据清洗的一部分。结果他们在AI业务上却接二连三地因为数据清洗问题翻车，这显然不是个正常的现象。

反常背后必然有原因，在许多海外网友看来，谷歌从AI赛道领跑者的位置滑落，进而不得不追赶OpenAI的现实，可能导致了他们变得如此急躁。

过去一年间，AI初创企业Perplexity就被视为是谷歌的挑战者，而这家公司被投资者看中的原因也很简单，因为它做的是AI搜索。并且就在此次I/O开发者大会举行前，OpenAI也被曝出将要做AI搜索来挑战谷歌，因此AI Overviews更像是谷歌对于Perplexity和OpenAI的回击。或者说在此次I/O开发者大会上，谷歌无论如何都得展现出自己对AI搜索的态度，即便没有AI Overviews、也得有AI abstract。

只不过急功近利必然是有代价的，用户使用搜索引擎是希望寻求答案，可AI Overviews给出的答案却是偏颇的，这无疑就是在动摇大众对于谷歌搜索的信任。作为这家公司最为核心的产品，谷歌搜索应该是稳健的，但现在谷歌却把一个实验性质的功能直接推向数以十亿计的用户，这不是急功近利又是什么？

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

AI搜索花式翻车，谷歌居然又栽在了数据清洗上

友情提示

创业开公司，4亿英镑卖掉公司当CEO，跨界拿诺贝尔奖！48岁天才刚刚达成惊人成就，“阿尔法狗”也出自他手

人社局回应：禁止使用苹果手机，鼓励使用华为手机！

俄罗斯已经彻底封禁YouTube，无论是网页版还是客户端都无法连接

美国对战科技巨头首胜！谷歌被裁定非法垄断

美国法院裁定谷歌非法垄断网络搜索市场

美国联邦法官裁定谷歌非法垄断网络搜索市场

男子离职后把程序全部删除掉了，网友；做事情要这么绝吗？？

北京大姐，在农村买了一千平米的大院子，赶上拆迁为何高兴不起来

赖清德狂言放话：台湾“寸土不让”姿态鲜明不惜一战？

小伙将“200发鞭炮”炸老鼠洞，3秒后老鼠仓惶而逃，场面太震惊了

女孩被同事刁难董事长父亲得知霸气撑腰

六哥郑耀先反复试探北京领导的身份

载有大学生客车高速起火医院回应

本次债务置换5年节约利息6000亿

马斯克与特朗普的双人舞，是从龙之臣，还是功高震主？

车主开门杀致骑车人死亡法院判了

中国建设银行原副行长章更生被查

普京表示俄罗斯站在中国一边