资讯
根据 Chatbot Arena 官方消息,Meta 首次提交 LMArena 的 Llama-4-Maverick-03-26-Experimental是一个 ... 由于各种原因,LM Arena 从未被视为衡量 AI 模型性能的最可靠指标。尽管如此,针对基准测试调整模型不仅具有误导性,还使得开发者难以准确预测该模型在不同场景下的表现。
近日,Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名,这一剧烈波动引发了开发者们的广泛质疑,认为 Meta 可能通过提交 特供 版本以刷榜。事情的起因要追溯到4月6日,Meta 发布了其 最新 的大模型 Llama4,包括 Scout、Maverick 和 Behemoth 三个版本。其中,Llama-4-Maverick ...
14 天on MSN
近期,LMArena更新了大型语言模型的排名,引发了一场关于meta最新发布的开源大模型Llama-4-Maverick真实性能的广泛讨论。此前,Llama-4-Maverick在LMArena的Chatbot Arena ...
IT之家 4 月 14 日消息,LMArena 更新了 Meta 最新发布的开源大模型 Llama-4-Maverick 的排名,其从此前的第 2 名直线下降至第 32 名。这证实了此前开发者对 Meta 为刷榜向 LMArena 提供“特供版”Llama 4 大模型的质疑。
近日,谷歌云平台宣布,其Vertex AI Model Garden正式引入Meta最新一代开源大模型Llama4,这一消息迅速在全球科技圈掀起热潮。据悉,Llama4系列中的Scout和Maverick两款模型现已集成至Vertex AI,并通过完全托管的“模型即服务”(Model-as-a-Service,MaaS)API端点向开发者开放 ...
科技巨头Meta上周六(5日)推出了新AI模型Llama 4,包括较小型的Scout版本和标准版Maverick,并预览了号称「迄今最强大」的 Llama 4 Behemoth,但其后遭AI开发社区的强烈质疑。 Meta生成式AI负责人Ahmad Al-Dahle对此发声明,承认模型「在不同服务中表现出参差不齐的质量」 ...
由于DeepSeek等竞品引发压力,Meta推出新一代AI模型集合Llama 4。目前,Llama 4拥有Scout和Maverick两个版本,均以开源形式发布。Meta在声明中表示 ...
2025年AI行业的必打战役变了。 2024年最火的AI应用类型是ChatBot(聊天机器人),彼时的主要参赛玩家是Kimi、豆包和元宝,到春节前后DeepSeek也加入战局。
Chatbot Arena 由加州大学伯克利分校 ... 但她并不负责生成式 AI 团队,而是领导 Meta Fundamental AI Research(FAIR)研究部门,与 Llama 4 项目并无直接关联。
2025年4月5日,Meta以「开源AI民主化」为口号发布Llama 4系列模型,宣称其采用混合专家架构(MoE)、4000亿参数规模,并在多项基准测试中超越DeepSeek等竞品。然而,这场被扎克伯格称为「AI里程碑」的发布会,仅48小时后便因内部员工爆料演变为重大信任危机。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果