
Gemini3太强了。
11月18日,在所有人的期待中,Google的最新AI模型Gemini3正式发布。这次,一切都回到了Google的节奏。
彻底屠榜
这是一个几乎“屠榜”了所有评测集的模型,而且,请注意,是一个通用模型在细分评测上碾压了诸多“推理模型”、“多模态模型”等细分领域模型。

根据Google的介绍,Gemini 3 是一个有原生多模态、强大推理和Agent能力的模型。在硅星人参加的发布前小范围沟通会上,Gemini的团队强调这个模型的这些能力“不是分开的,是都在一处,都在一个模型里,你可以同时用这些能力”。
今天用来评测模型各种能力的榜单,被Gemini3刷到了离谱的新高。
在多模态能力上,它的理解和推理都达到新高度:
Gemini 3 Pro以81%的MMMU-Pro分数和87.6%的Video-MMMU分数直接刷新了这个多模态推理的记录。

案例介绍:Gemini 3.0的视觉能力融入了推理,能主动解决不一致符号带来的歧义问题,对手写旧表格的 OCR 识别能力甚至优于受过训练的学生。
可能Gemini 3才真正第一次称得上是一个有多模态推理能力的模型。
Google展示了一个很有趣的用法:做一个等离子体流在托卡马克里的可视化展现,同时用一首诗来捕捉核聚变的美。
本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8oNfrFDcgfJ

评论一下吧
取消回复