site:www.51cto.com - 搜索 News

资讯

16 小时

首创Mid-training范式破解RL奥秘，Llama终于追平Qwen！

此外，研究团队也尝试通过从常见数学问题求解数据集中引入长链式思维数据来扩充正例种子集合，以提升分类器召回推理密集型内容的能力。然而，这种方法最终仅保留了约 20B tokens，研究团队认为其规模不足，因此未被采用。

16 小时

LeCun发布最新世界模型：首次实现16秒连贯场景预测，具身智能掌握第 ...

名叫PEVA模型，新突破是让具身智能体学会这人类一样的“预判能力”，首次实现16秒连贯场景预测。怎么说呢？就像人类伸手时会预判手臂进入视野的角度、走路时会提前观察脚下路径，LeCun团队的最新模型，可以让机器人实现这样的能力。

16 小时

刚刚，Meta宣布正式成立「超级智能实验室」！11人豪华团队首曝光

今天，据彭博社等最新消息，在周一给 Meta 员工的一份内部备忘录中，扎克伯格宣布重组公司人工智能团队（包括研究、基础设施和产品），合并到新成立的「Meta 超级智能实验室」（Meta Superintelligence Labs）。

16 小时Opinion

黑化威胁操纵人类！Claude勒索，o1自主逃逸，人类「执剑人」紧急上线

从撒谎到勒索，再到暗中自我复制，AI 的「危险进化」已不仅仅是科幻桥段，而是实验室里的可复现现象。人类一思考，上帝就发笑；那推理模型「思考」时，我们该不该笑？我们可能都「被AI骗了」。

17 小时

明知GenAI存在风险，为何我们迟迟不修补其缺陷？

更令人担忧的是，这些严重漏洞得到修复的情况极为罕见，在所有测试系统中，LLM的修复率最低，导致许多关键风险悬而未决，尽管部分问题能迅速得到解决，但这很可能仅反映了那些易于修复的情况，而更为复杂和危险的缺陷则持续累积，形成了日益扩大的安全缺口。

19 小时

当AI学会多模态「按需搜索」：字节 MMSearch-R1 让大模型告别「瞎编」？

MMSearch-R1通过训练让模型学会「知识边界感知」。这就像我们知道自己「英语好但数学差」，模型也能意识到「擅长识别动物但不了解航天事件」。研究员们构建了一个包含「需搜索」和「无需搜索」问题的平衡数据集（FVQA），让模型在训练中学会区分两类问题 ...

15 小时

OpenAI员工"叛逃"Meta背后：AI人才争夺战的天价真相

结果Meta CTO Andrew Bosworth很快就在内部会议上反击了，直接说Altman"就是在撒谎"。Bosworth澄清说，这不是什么简单的签约奖金，而是复杂的薪酬包，包括股票期权、绩效奖励等，而且还要分四年发放。

14 小时

科技小学堂 | 多方携手助力云南南华打造乡村科教大梦想

在挑战营开营环节，南华县人民政府相关领导及县教育体育局主要领导感谢了华为公司对南华乡村教育事业的关心与支持，并强调了科技教育的重要性，鼓励孩子们珍惜这次机会，充分展示自己的才华和智慧，勇敢挑战自我，追求卓越。

17 小时

Cursor CEO的深度访谈：进入AI的时代，‘品味’很重要精华

最近 Cursor 的 CEO Michael Truell 接受 Y Combinator 的一段长访谈，Cursor 站在AI编程的最前沿，通过这次访谈带领我们更好的看清楚AI编程的视角。这听起来像科幻小说，但Cursor CEO Michael Truell 在访谈中告诉我们：这个未来正在到来，只是比我们想象的更复杂、更有趣。

1 天

强化学习也能预训练？效果可提升20倍，华人新作引爆RL新范式!

HILP和FB均基于演员-评论家框架，通过完全无监督的强化学习目标来捕获意图；相比之下，新方法仅需在相邻状态转移上训练基于隐变量模型的意图编码器，无需依赖复杂的离线强化学习流程。

1 天

甭提静态AI了，MIT新框架让模型具备自学能力

近日，麻省理工学院（MIT）的研究人员已开发出一种名为自适应语言模型（SEAL）的框架，使大语言模型（LLM）能够通过更新自身的内部参数来持续学习和适应。SEAL可以教LLM生成自己的训练数据并更新指令，让LLM能够永久吸收新知识并学习新任务。

1 天

苹果一口咬死AI不会思考！OpenAI前高管直接开怼：AGI已来，别再酸了

与此同时，OpenAI前研究主管Bob McGrew则持完全不同的态度。他在播客《训练数据》中表示：通用人工智能（AGI）所需的关键突破已经实现，2025年将是AI推理的元年。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果