Gemini 3来了：忘掉聊天，一句话生成一个世界

Gemini3太强了。

11月18日，在所有人的期待中，Google的最新AI模型Gemini3正式发布。这次，一切都回到了Google的节奏。

彻底屠榜

这是一个几乎“屠榜”了所有评测集的模型，而且，请注意，是一个通用模型在细分评测上碾压了诸多“推理模型”、“多模态模型”等细分领域模型。

根据Google的介绍，Gemini 3 是一个有原生多模态、强大推理和Agent能力的模型。在硅星人参加的发布前小范围沟通会上，Gemini的团队强调这个模型的这些能力“不是分开的，是都在一处，都在一个模型里，你可以同时用这些能力”。

今天用来评测模型各种能力的榜单，被Gemini3刷到了离谱的新高。

在多模态能力上，它的理解和推理都达到新高度：

Gemini 3 Pro以81%的MMMU-Pro分数和87.6%的Video-MMMU分数直接刷新了这个多模态推理的记录。

案例介绍：Gemini 3.0的视觉能力融入了推理，能主动解决不一致符号带来的歧义问题，对手写旧表格的 OCR 识别能力甚至优于受过训练的学生。

可能Gemini 3才真正第一次称得上是一个有多模态推理能力的模型。

Google展示了一个很有趣的用法：做一个等离子体流在托卡马克里的可视化展现，同时用一首诗来捕捉核聚变的美。

本文转自：凤凰网科技

原文地址： https://tech.ifeng.com/c/8oNfrFDcgfJ

搜索一下