谷歌Gemini 3终于在凌晨正式发布。经过一年的“早起晚下”的质疑后,谷歌于周二正式推出了其成功的年度机型 Gemini 3。与之前的小修复不同,这次更新被视为谷歌对 OpenAI 和 Anthropic 最猛烈的反击。据知情人士透露,Gemini 3 的发布也在 OpenAI 和 Anthropic 内部引起了很多“担忧”。竞争对手的员工私下推测,如果谷歌在自动编程和图像生成方面取得进步,竞争对手的先发优势就会消失。投资公司 Jones Trading 的首席市场策略师 Mike O’Rourke 敏锐地指出:“谷歌在搜索领域的巨大规模和先发优势使其很有可能重新夺回市场份额,并将 OpenAI 和微软推向其身后。”如果 Google 将 Gemini 3 直接嵌入到数十亿人使用的搜索框中,这种分发功能将是毁灭性的。f 用户。与此同时,虽然OpenAI仍保持流量领先地位,但它面临着甲骨文和微软开出的高额算力账单,其商业模式出错的空间也比谷歌小得多。 1、亮点:不仅更智能,还能生成“生成式UI”。 Gemini 3的技术亮点可以概括为一件事:克服文本对话框的限制。 ——生成式UI:这是本次更新的亮点。以前,当你向 AI 请求旅行指南时,它只提供文字。 Gemini 3现在可以直接生成交互界面。它还可以将图形和文本结合起来,通过查询历史问题或艺术来创建实时微应用。这是一个问题,不仅仅是回答问题,更是创造体验。 ——反重力编程工具:这是谷歌为开发者推出的一款重磅产品。这种代理优先的编码环境允许AI自动完成软件创建、测试、和部署。 ——告别“势利”:谷歌特别强调Gemini 3将减少“势利”。我们目前的原则是:“说实话,而不是你想听的话。”这意味着Gemini 3在面对错误假设时拥有更强的批判性思维,而不是盲目地回应用户。 ——提高精度和智能:谷歌称Gemini 3为其最智能的型号,可帮助用户将任何想法变为现实。在标准基准测试中,Gemini 3 的信息准确率达到了 72%。虽然这个数字可能不是绝对高,但绝对处于生成人工智能领域的前列。 2、大V亲自测试:双子座3年达到“博士级”智力。沃顿商学院教授、AI 领域思想领袖 Ethan Mollick 刚刚测试了 Gemini 3,并对其进行了全面评价。这一次,它没有拿无聊的基准分数来衡量,而是用三年的基准测试来展示人工智能在人工智能领域的令人难以置信的速度。正在不断发展。曾经只会聊天的AI现在是可以独立工作的数字同事。 ——从“描述”到“创造” 三年前,ChatGPT 推出前夕,Molik 在 GPT-3 的早期版本中引入了一条荒谬的信息:“写一个关于一艘由糖果驱动的超轻型宇宙飞船从水獭手中逃脱的故事。”当时,人工智能几乎无法写出连贯的句子或糟糕的诗歌。今天,面对同样直接的话,莫里克对Gemini 3提出了更高的要求。“用实际行动来展示AI已经走了多远。”于是,Gemini 3创建并直接生成了一个互动的、可能的网页游戏。游戏中,你必须驾驶糖果船,避免被水獭追赶。莫里克感叹道:“2022年,AI只会写字,但到2025年,AI已经能够自己编写引擎代码、设计界面、驾驶宇宙飞船了。” – 与Gemini 3一起发布的反重力万能助手是反重力d开发工具。很多人认为这只是针对程序员的,但在莫里克看来,它更像是一个通用的“代理工作台”。其核心理念是计算机上所做的一切本质上都是代码。由于人工智能可以处理代码,因此它可以处理从处理 Excel 到创建 PPT 和分析本地文件的所有事情。莫里克先生向Antigravity授予了他计算机上包含上述所有文章的文件夹的访问权限,并命令:“帮我将所有有关人工智能的预测整理成漂亮的页面,并在互联网上搜索以验证我所说的哪些是真的,哪些是假的。” Gemini 3 表现得像一个值得信赖的员工。阅读文件并制定计划。生成计划后也会停在主节点,等待 Molik 的批准。一旦获得批准,它就会自行搜索互联网、编写代码、生成网页,甚至控制测试浏览器。 Molik 注意到我们与人工智能交互的方式发生了根本性的变化。而不是用复杂的词语来“引导”在对话中,他们使用自然语言来“指导”队友的工作。这种控制感和理解感是迈向智能代理时代的重要一步。 ——写一篇“博士级别”的文章 为了测试Gemini 3智能的极限,莫里克也给出了确凿的证明。这是一组十年前的科研文件,格式混乱,甚至包含损坏的数据。指示是:“澄清这个数据结构”和“写一篇包含深刻理论论证的原创文章,例如将提交给学术期刊的文章。”就像课程中教授对学生的要求一样,非常模糊。结果,Gemini 3不仅修复了数据,还提出了独特的研究假设,创建了一套自然语言处理(NLP)算法来衡量众筹项目的“独特性”指标,并完成了统计分析。 。最后,他们提交了一份14页的文件。的c当然,Gemini 3也有其缺陷。与任何新的博士生一样,一些统计方法需要重新审视,一些理论推导有点激进。然而,莫利克建议修改后,立即有意义并得到显着改善。莫里克总结道:“如果你将‘博士级智力’定义为工作能力以及合格研究生的能力,那么是的。” 3、评测炸弹:Gemini 3“真香”? ——数据狂人:智商爆表,权威评级机构Artificial Analysis却给出了好坏参半但总体乐观的结论: · 智商超群:在智商测试中,Gemini 3 Pro Preview获得了73分的高分,而同类机型的平均分仅为42分。这不仅是对领导层的毁灭性打击,也是毁灭性的打击。 · 极速响应:Gemini 3每秒生成128个代币,处理复杂任务“游刃有余”,远超业界平均(56 个令牌/秒)。 · 钱包提醒:强大的代价是高昂的。输入价格适中,但输出价格很高:每百万代币 12 美元(平均 8.40 美元)。另外,这是一个健谈的模型。该测试生成了 9200 万个代币,是平均水平(2700 万个)的三倍多。总之,Gemini 3很聪明,反应灵敏,但废话十足,字字句句都贵。 @aniruddhadak 表示“基准结果”令人惊讶。 “您可以将其称为智能代理编码工作流程的新基础。” @deredleritt3r 还表示,Gemini 3 我们谈论数据,认为它们在计算操作中形成了绝对毁灭性的趋势。 ——经验丰富:没有AI味道,好处压倒随着Gemini 3和Antigravity的使用逐渐公开,许多科技博主开始亲自尝试并留下评论。早期评论者 @aditabrm 对 Gemini 3 的优点和局限性进行了详细评估,称其“令人印象深刻”并分享了发布当天进行详细审查。行业观察家@aagarwal1012认为Google Gemini 3显着提高了同类产品的标准。科技播客@SciTechera用照片凸显了Google Gemini 3上市后相对于竞争对手的绝对优势。对于每天与 AI 打交道的铁杆游戏玩家 @Matt Shumer 来说,Gemini 3 已经成为他的“日常驾驶者”。他们的评论更加情绪化,更关注生产力。 ·写作的进化:创意写作终于变得更加“人性化”,正在告别看似虚假的“人工智能味”。双子座3的文笔逻辑连贯,节奏自然,人物也比较干练直接,没有礼貌性的开场问候来弥补字数。 · 前端杀手:这是最大的惊喜。 @Matt Shumer 直言其 UI 功能“非常好”,设计细节、微交互、响应式设计往往只需一处即可完成一次。设计能力的范围显着提高。 ——冷男:不是所有人都会买。回到产品本身,谷歌自豪地宣称Gemini 3的信息准确率达到72%。对于大型模型来说,这是一个令人惊讶的数字,但对于一些用户来说,初创公司 Oumi 联合创始人 Manos Koukouumidis 直言不讳地说。蓝。“如果你们服务员来拯救我们,为我们完成任务,目前的水平还远远不够。” 与搜索引擎的紧密结合,让双子座3能够检索信息并进行验证,但“假象”依然存在。用户期望100%的可靠性,而72%意味着你在几乎30%的时间里仍然在“认真地胡说八道”。 Gemini 3正式发布后不久,就有用户在社交平台上发帖。一些用户感觉,在体验Gemini 3预览版时,可能还不如2.5 Pro。例如,如果将两者进行比较以产生“自行车上的鹈鹕”图像,则没有明显的差异对前者有利。 @Matt Shumer 还提到了反重力的二元性。 Google 的新 IDE 虽然功能强大,但需要“保姆级”的人类注意力来检测模型遗漏的错误。 4.看情况:OpenAI很少沉默,朋友和企业家们迫切“聚集在一起”评估模型的牢固性。话虽如此,看看对方在做什么。硅谷观察家约翰·库根用这个更有趣的视角来解读Gemini 3。——Anthropic正在寻找支持者,谷歌出手的同时,Anthropic正在迅速逼近微软,算力合作伙伴关系达到300亿美元,还有英伟达和微软的巨额投资。这种“互相拥抱、寻求温暖”的防御姿态,印证了谷歌带来的压迫感。沉默 此前喜欢在谷歌会议前“封锁”的OpenAI,这次显得格外安静,只透露了一个群聊。Sam Altman 很快对 Google 的 X 平台表示祝贺。首席执行官桑达尔·皮查伊也做出了回应。 ——考虑xAI的值得注意点。马斯克领导下的 xAI 选择了一种简单粗暴的方法。他们在发布会前后拼命在 X 平台上发布 Grok 广告,让人怀疑他们是想窃取 Google 的注意力。 5、结论:科技狂欢背后仍需保持冷静。麦肯锡的数据显示,到2030年,整个AI行业预计将花费近7万亿美元建设数据中心和超级计算机,这是一个天文数字。对于Gemini 3的推出,Creative Strategies研究所首席分析师Ben Bajarin非常平静:“我们需要真正有能力、高质量的用例来获得可观的收入流。但我们还没有做到这一点。”目前,人工智能主要用于传统的搜索查询和程序设计。明助理。投资者开始怀疑 Anthropic、OpenAI 甚至谷歌是否真的能产生足够的收入来支付这项数十亿美元的基础设施投资。谷歌DeepMind首席执行官Demis Hassabis对此表现得很平静。他在Gemini 3发布前接受采访时表示,虽然私募股权市场可能存在泡沫,但谷歌拥有真正的收入来源。该公司云业务的季度收入增长了三分之一,达到 150 亿美元。他形容谷歌目前的处境“陷入困境”,并希望最终取得胜利。 (辰辰)