AI进化受阻搜索引擎举杯时刻仍遥遥无期-进化|受阻|搜索引擎|AI-鹿科技

　　原标题：AI进化受阻搜索引擎举杯时刻仍遥遥无期

　　生活中，越来越难找到打开搜索引擎的理由了。

　　吃饭有点评软件，出行有导航地图，看新闻有资讯APP，购物有网购平台，聊天有社交媒体。越来越多搜索行为正从传统搜索框转移向一个个独立的APP。

　　传统搜索引擎的优势荡然无存，处境尴尬。而AI浪潮的来临，让传统搜索有了新的进化方向。

　　OpenAI正式上线ChatGPT的实时搜索功能；谷歌宣布其“双子座”AI模型将整合谷歌搜索功能；百度的AI智能回答，对文心大模型日均调用量超6亿次。

　　一场AI时代的搜索新“战事”正在上演，但AI搜索能否在用户生活中，提供足够“必要”的价值，仍是一个值得商榷的问题。

　　被抛弃的传统搜索引擎

　　一直以来，百度都长时间占据着中国互联网搜索领域的主导者位置。但随着用户搜索行为的多元化，传统搜索引擎的用户正在逐渐流失。

　　年轻人们在微博搜明星动态、热点新闻，在抖音和快手消耗琐碎时间，在小红书寻找经验攻略。

　　今年6月，钉钉总裁叶军曾在一场企业家论坛上谈到搜索变革，他表示，搜索场景已经被变革掉了，百度也得马上跟进，如果再不跟进，大家也不会用百度了。

　　搜索的前提，是平台有足够的内容，满足用户的信息需求。PC时代，所有内容通过网页展示，传统搜索引擎依赖爬虫技术，抓取互联网上的网页，然后进行清洗和排序。当用户输入查询的词条后，搜索引擎会根据其算法对网页进行排序，并将结果展示给用户。爬虫抓取的信息数量越多，质量越好，传统搜索引擎的体验就越高。

　　而在移动互联网时代，互联网入口变为手机上一个个APP，各APP厂商不愿意再将左右生死的流量权，交给搜索引擎，便高筑墙，深挖沟，将爬虫挡在门外，并加强运营机制，将优质内容、独家内容留在门内。于是，移动互联网时代，各APP内容孤岛化严重，信息从此不再“互联”。

　　流量的走向，重塑着新的互联网格局。但传统搜索处境下滑的同时，各独立APP的搜索量与日俱增。

　　小红书有将近70%的月活用户有搜索行为，1/3的月活用户打开小红书的第一件事就是直奔搜索；2023年，抖音生活服务搜索GMV增长254%，商品搜索GMV增长143.8%；2024年第二季度，使用快手搜索的月活跃用户近5亿，同时单日搜索次数同比增长超20%。更不用说微博的热搜，凭借搜索，缔造了一个又一个顶流话题。

　　就目前而言，传统搜索引擎已经落后于时代，其本质原因，在于搜索引擎并不生产内容，只是内容的搬运工，而搜索内容的需求已经被内容方满足。

　　生成式AI的诞生，给了传统搜索引擎更沉重一击，人们不再需要在搜索结果中，寻找所需信息，AI已可以通过自然对话方式，代替思考，提供答案。

　　人们直接跳过“搜索”，直达信息的彼岸。

　　之于搜索引擎，这是鹤顶红，却也是回魂丹。受威胁最大的传统搜索引擎，成为生成式AI最忠诚的拥趸。

　　2023年初，微软宣布与OpenAI合作，推出了由AI驱动的Bing搜索引擎和Edge浏览器。

　　同年5月，谷歌推出由生成式AI驱动的搜索引擎。谷歌称，这是谷歌搜索引擎多年来最大规模的一次革新。

　　2023年8月，昆仑万维推出了国内第一款AI搜索引擎，2个月后，百度也将旗下的简单搜索升级为AI互动式搜索引擎，在搜索页面内置文心一言大模型技术。

　　今年6月，360公司正式发布了“360AI搜索”和“360AI浏览器”；同一个月，知乎发布AI搜索产品“知乎直答”；7月，夸克升级了“超级搜索框”，推出以AI搜索为中心的一站式AI服务。

　　行业出现了“无AI，不搜索”的趋势，并且各大厂商为AI搜索赋予重任。

　　生成式AI，正在生成传统搜索的未来。

　　AI搜索难当大任

　　AI搜索引擎与传统搜索引擎有着显著的区别。

　　传统搜索引擎像一个图书馆的目录卡，用户需要提供书的具体书名或作者，才能找到书的位置。AI搜索引擎更像一个图书管理员，用户只需要告诉它大概的信息，它就能找到相关的书，并总结书中的主要内容。

　　而且，AI搜索还不局限于文字，能理解和索引视频、图片、语音等内容。还能实现了AI写作、AI文件总结等操作。

　　但AI搜索的发展似乎并不顺利。以上一切全新体验的前提，在于搜索的结果，务必精准。

　　谷歌AI搜索上线不久后就闹出了不少笑话。很多用户都反映，AI搜索在“胡言乱语”。

　　一位用户向谷歌AI搜索提问“我每天应该吃多少块石头”，得到的回答是“根据加州大学伯克利分校地质学家的说法，人们每天应该至少吃一块小石头”。

　　在今年的百度世界2024大会上，百度发布检索增强的文生图技术iRAG，可结合百度搜索的图片资源，消除大模型，生成各种超真实的图片，“去除了机器味儿”。

　　而在媒体复刻发布会所展示的“爱因斯坦与天坛合影”指令时，大模型仍然出现错误幻觉：原本三层护栏，变成了四层甚至五层。

　　就目前而言，AI搜索生成答案的准确性和可靠性依旧难以保证、容易出现事实错误，且生成的内容缺乏深度、无法提供有效的溯源。

　　诺贝尔经济学奖得主保罗·克鲁格曼曾在社交媒体上批评了当前的人工智能，称它比没用还糟糕，“有很多关于谷歌和其他搜索引擎退化的消息。这是真的，让我的工作变得困难”。

　　同时，AI的滥用还在加剧互联网信息的混乱，产生很多无效信息、虚假信息，混淆了正常搜索的结果。

　　今年1月，江西南昌的一家MCN利用AI工具日产7000篇文章。文章内容真假混杂，甚至引发了网传西安有巨大爆炸声的谣言。

　　温州公安最近也抓捕了一位网络作者。该作者利用AI工具批量改写网络文章，发布到信息平台从而获得文章收益，最终造成了诸多不良的社会影响。

　　伴随着AI工具的普及，AI制造的无用、虚假信息的数量也越来越多。

　　清华大学新闻学院的报告称，近一年来，经济与企业类AI谣言，增速高达99.91%。谷歌研究人员也发现生成式AI造成的虚假信息正在互联网上泛滥成灾。

　　虽然，目前AI引发的内容风险还没有上升到“威胁生存”的地步，但按照AI的发展趋势来看，这种伪造或篡改的信息会越来越多。

　　最终导致互联网的信息更加混乱，使得真实与虚假之间的界限模糊。

　　甚至AI自己，也将在越发低质的语料库中停止进化与生长。

　　信息荒漠时代

　　随着AI生成的错误和无意义的信息会不断累积，互联网的错误、无用信息占比会逐步增加。

　　清华大学新闻学院新媒体研究中心主任、跨学科知名学者沈阳说，AI生成的内容急剧增加，大量自媒体文章的内容由AI自动生成，而AI幻觉产生的错误就夹杂在这些文章当中，这也会造成整个互联网的内容质量进一步下降，导致数据质量的整体下降。这种现象被称为“数据退化”。

　　AI的训练和学习需要大量的网络信息，但大量虚假和无意义的信息只会让AI陷入混乱，产生错误观念。

　　不止如此，AI除了要面临劣质内容的侵害，还面临优质底层信息的短缺。

　　研究公司Epoch AI表示，到2028年，文字资料将会被消耗殆尽。而这些数据是人类在在过去几个世纪里，创作的大量文字、视频。

　　也有人试图用AI生成的信息训练AI，但结果并不美好。国外的科学家发现，如果AI只学习其他AI生成的内容，那么经过几代训练后，AI将输出无意义的垃圾信息。

　　他们把这种现象称为“模型崩溃”。

　　当前正处于信息大爆炸时代，我们所有人都被大量的信息所包围，但是对于AI而言，这是一个数据匮乏的时代。

　　对AI而言，谁能帮助AI摆脱信息匮乏的窘相，谁就掌握了AI发展的未来。为此，OpenAI、Anthropic、百度等公司都在积极开发更优质的合成数据，以此克服挑战。但大多数学者都持悲观态度。

　　今年11月，有外媒报道，OpenAI下一代旗舰模型“猎户座”（Orion）的性能提升幅度，小于GPT-4相对GPT-3的提升。

　　其创始人奥特曼曾表示，可能不会把新模型命名为GPT-5。

　　多位专家劝说AI公司停止训练大模型，“如果当前趋势持续，人工智能很快就会耗尽其可用的训练数据。面对这种情况，AI公司可以选择停止追求规模更大、更复杂的模型。”

　　AI是当前互联网进步的主要动力之一，尤其是对搜索引擎而言，谁能突破AI的限制，谁就掌握了搜索市场的未来。

　　只是，这杯庆功酒遥遥无期。