Heart of the Machine 发行商 OpenAI 仍在跑分,谷歌已经渗透到应用层。北京时间周四午夜,谷歌发布了高速、低成本的“Gemini 3 Flash”机型,作为今年大型机型领域的最新作品。该模型基于上个月推出的 Gemini 3,显然是为了抢走 OpenAI 的风头。同时,谷歌计划让Gemini 3 Flash成为Gemini应用和AI搜索模式的默认机型。这个新的 Flash 模型是在 Google 发布 Gemini 2.5 Flash 六个月后推出的,它提供了显着的性能改进。基准测试显示,Gemini 3 Flash相比之前的机型有了明显的提升,在某些指标上达到了Gemini 3 Pro、GPT-5.2等尖端机型的水平。从智能/成本角度来看,它是世界上最经济的型号。例如,在 Humanity’s Last Exam 基准测试中,在评估模型在各个专业的综合能力时,Gemini 3 Flash 在没有工具的情况下获得了 33.7% 的分数。相比之下,Gemini 3 Pro 得分为 37.5%,Gemini 2.5 Flash 得分为 11%,最近发布的 GPT-5.2 得分为 34.5%。与此同时,谷歌正在向全球数百万用户推出这一新模型,覆盖以下渠道: 开发者:通过Gemini API、Google AI Studio中的Gemini CLI,以及新的Google Antigravity代理开发平台 所有用户:通过Gemini应用程序和搜索中的AI模式 企业用户:Vertex AI和Gemini Enterprise Gemini 3 Flash发布后,大家很快测试使用并发现了这个AI。回答问题的响应速度基本在1秒。没有duda,它的速度和搜索引擎一样快。而且他回答问题比以前更详细,知识也非常全面和精确。它似乎默认连接到互联网。网友猜测谷歌可能会Se Gemini 3 Flash 作为搜索引擎的替代品或逐渐将其转移到移动设备上。无论哪种方式,新模型都预示着人工智能模型的新时代。 Gemini 3 Flash:大规模的尖端智能 Gemini 3 Flash 证明速度和规模不一定以牺牲智能为代价。博士水平的知识和推理的多重基准。在 GPQA 钻石 (90.4%) 和 Humanity’s Last Exam (33.7%,无工具) 中,Gemini 3 Flash 展示了与更大的尖端型号相媲美的尖端性能,并且在多个基准测试中显着优于之前更强大的 2.5 代型号 Gemini 2.5 Pro。同时,在MMMU Pro多模态推理基准测试上,Gemini 3 Flash以81.2%的高分达到了当前state-of-the-art水平,性能与Gemini 3 Pro不相上下。从基准测试中可以看出,Gemini 3 Flash的性能表现十分扎实,各项指标均优于Gemini 2.5 Pro方面,并且在 ARC-AGI-2 和 SWE-Bench Verified 测试中也优于 Gemini 3 Pro。这个优化的模型(小 3-4 倍)现在超越了 6 个月前的“最先进”模型。除了尖端的多模式和推理功能外,Gemini 3 Flash 还具有极高的效率,在质量、成本和速度方面突破了 Pareto 前沿。当思维运行在最高层次时,Gemini 3 Flash可以动态调整你的思维深度。当我们面对更复杂的使用场景时,推理需要很长时间。在处理日常领域时,您可以以更好的表现实现您的目标。同时,对于典型的企业流量,平均使用的令牌数量比 Gemini 2.5 Pro 减少约 30%。这使得 Gemini 3 flash 能够更高效、以更低的成本完成日常任务,同时保持准确性。杰夫·迪恩 (Jeff Dean) 表示:“我们再次打破了效率与智能之间的帕累托边界Gemini 3 Flash 的主要优势在于其最大本机速度,它延续并改进了开发人员和消费者多年来喜爱的 Flash 系列功能。根据 Artificial Analysis 基准测试结果,Gemini 3 Flash 的性能优于 Gemini 2.5 Pro,速度提高了 3 倍,而成本却仅为其一小部分。在价格方面,Gemini 3 Flash 成本: 输入:每百万代币 0.50 美元 输出:每百万代币 3 美元 音频输入:每百万代币 1 美元 Gemini 3 Flash 比 Gemini 2.5 Pro 更快、更高效。对于开发人员来说,Gemini 3 智能闪存专为高频迭代开发而设计,同时保持低延迟,并通过快速、高并发的工作流程快速解决问题。在评估代码代理的功能时,Gemini 3 Flash得分为78%,不仅优于2.5系列机型,还优于Gemini 3 Pro。这使得Gemini 3 Flash能够提高性能、速度,并使其在效率和成本之间达到理想的平衡。 Gemini 3 Flash 在推理能力、工具使用和多模态能力方面的卓越表现,使其成为想要执行更复杂的视频分析、数据提取和可视化问答(Visual Q&A)的开发人员的理想选择。这也意味着它可以支持更智能的应用场景,比如游戏助手、A/B测试实验等需要快速响应和深度推理能力的场景。 Gemini 3 Flash 可在手部追踪投掷益智游戏中实现多模式推理,并提供近乎实时的 AI 辅助。 Gemini 3 Flash 允许您近乎实时地创建新的负载指示器设计并对其进行 A/B 测试,从而简化了从设计到代码的流程。反馈采用 Gemini 3 Flash 的公司给予了压倒性的积极评价。包括 JetBrains、Bridgewater Associates 和 Figma 在内的多家公司已开始使用此模型来推动业务转型,并发现其在推理速度、效率和推理能力方面的性能可与大型模型相媲美。 Gemini 3 Flash现已通过Vertex AI和Gemini Enterprise正式向企业客户提供。 Cursor负责开发经验的副总裁表示,该公司的工程师发现Gemini 3 Flash在Cursor的调试模式下工作得非常好。该模型在解决问题和识别错误根本原因方面显示出速度和准确性方面的优势。注意:Gemini 3 Flash 在全球范围内发售。 Gemini 3 Flash 已成为 Gemini 应用程序的默认型号,取代 2.5 Flash。这意味着全球的Gemini用户都可以免费体验Gemi。 NI 3将大大提高您日常工作的效率。双子座 3 佛罗里达sh优秀的多模态逻辑功能让您更快地看到、听到和理解各种信息。例如,您可以要求 Gemini 理解视频和图像,并在短短几秒钟内将它们转化为实用的、可执行的计划。或者使用语音从头开始快速创建有用的应用程序,无需任何编程知识。只需随时随地向 Gemini 发出语音命令,即可在几分钟内将人们零散的想法转化为功能齐全的应用程序。写下您的想法,并使用 Gemini 3 Flash 在几分钟内将其转变为工作原型。 Gemini 3 Flash也正在推出,谷歌希望它能成为全球用户使用的搜索功能AI模式的默认机型。基于Gemini 3 Pro的推理能力,Gemini 3 Flash搭载的AI模式可以更有效地理解问题的细微差别。考虑查询的各个方面,实时检索信息以及来自世界各地的有用链接eb 以易于理解的方式提供全面的答案。最终结果有效地将研究和实际行动结合起来,产生一致的分析和具体建议。最后,一切都以搜索速度完成。当解决需要考虑多种因素的复杂目标(例如计划快速旅行或快速学习复杂的教育概念)时,此功能特别有用。谷歌表示,Gemini 3 Flash 现在可以通过 Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 进行预览。您还可以通过 Gemini CLI 和 Android Studio 等其他开发人员工具访问新模型。此外,Gemini 应用程序和搜索的人工智能模式已开始向所有用户推出。参考链接:https://blog.google/products/gemini/gemini-3-flash/ 文中视频链接:https://mp.weixin.qq.com/s/a47cr-7HwZ78gsFRaszEIg 特别说明:以上内容(包括图片和视频,如有)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由用户上传并发布。网易号是一个仅提供信息存储服务的社交媒体平台的用户。