谷歌Gemini 3终于在凌晨正式揭幕。
在背负了整整一年“起大早赶晚集”的质疑后,周二,谷歌正式发布了其年度重磅模型Gemini 3。与以往小修小补式的迭代不同,这次更新被视作谷歌对OpenAI和Anthropic最猛烈的一次反击。据知情人士透露,Gemini 3的发布甚至在OpenAI和Anthropic内部引发了不小的“焦虑”,竞争对手的员工们私下推测,如果谷歌在自动编程和图像生成上实现超越,他们的先发优势可能将荡然无存。
投资机构JonesTrading首席市场策略师米克·奥罗克(Mike O’Rourke)一针见血地指出:“凭借谷歌在搜索领域的庞大体量和先发优势,它极有可能夺回市场份额,迫使OpenAI及其背后的微软陷入被动。”
当谷歌将Gemini 3直接植入拥有数十亿用户的搜索框时,这种分发能力具有毁灭性的打击力。反观OpenAI,虽然目前仍是流量霸主,但面对甲骨文和微软开出的高昂算力账单,其商业模式的容错空间远低于谷歌。
1. 硬核亮点:不只更聪明,还能“生成界面”(Generative UI)
Gemini 3的核心技术亮点大致可以归结为一点:试图打破文本对话框的限制。
——生成式UI (Generative UI): 这是本次更新最大的亮点。以前你问AI旅游攻略,它只给你文字;现在Gemini 3能直接生成一个交互式界面。当你查询某个历史或艺术问题时,它能混合图形和文本,甚至实时构建微型应用程序。这不仅是回答问题,更是在“生成体验”。
——Antigravity编程工具: 这是谷歌面向开发者领域投放的一枚重磅炸弹。这个“智能体优先”的编码环境,能让AI自动完成软件编写、测试和部署。
——告别“马屁精”:谷歌特意强调,Gemini 3减少了“阿谀奉承(sycophancy)”。现在的原则是“告诉你真相,而不是你想听到的话。”这意味着Gemini 3在面对错误前提时,会有更强的批判性思维,而不是一味迎合用户。
——准确率和智能度提升: 谷歌称Gemini 3是其最智能的模型,能帮助用户将任何想法变成现实。在标准基准测试中,Gemini 3的信息准确率达到了72%。虽然数字在绝对值上看似不高,但在生成式AI领域无疑稳居前列。
2. 大V亲测:Gemini三年练成“博士级”智能
沃顿商学院教授、AI领域意见领袖伊桑·莫利克(Ethan Mollick)刚刚对Gemini 3进行了一番深度测评。
这一次,他没有堆砌枯燥的基准测试分数,而是用一个跨越三年的对比测试,展示了AI令人咋舌的进化速度:那个曾经只会陪你聊天的AI,现在已经变成了能独立干活的“数字同事”。
——从“描述”到“创造”
三年前ChatGPT发布前夕,莫利克曾向早期GPT-3输入一个荒诞的提示词:“写一个关于糖果驱动的超光速飞船逃离水獭的故事”。那时候,AI只能勉强写出一段连贯文字或一首蹩脚诗。
今天,面对同样的提示词,莫利克对Gemini 3提出了更高的要求:“用实际行动展示AI进步了多少。”
结果,Gemini 3直接编写并生成了一个可交互、可试玩的网页游戏。在游戏里,你需要真正驾驶那艘糖果飞船去躲避水獭的追击。