资讯

南海战鹰中队长赵凌云携祖传虎座鼓玉佩护疆,战机迫降孤礁。渡江战役老兵赵铁柱于病榻撕蕲春艾草纸疗伤,血书唤醒军民共魂。当敌舰围岛,三代军魂以楚剧绝活为盾,百童317.3Hz清唱震碎战争阴云。全剧十支曲牌、七项绝活构筑钢铁长城,科技如盐化于非遗江水。
鹭羽 发自 凹非寺 一个冒号,竟然让大模型集体翻车? 明明应该被拦下来的虚假回答,结果LLM通通开绿灯。 该发现来自一篇名叫“一个token就能欺骗LLM”的论文。 不仅如此,除了冒号、空格这类符号,还有诸如此类的推理开头语:“Thought ...
这项由上海AI实验室的徐方志博士、西安交通大学的严航教授等研究团队共同完成的突破性研究,发表于2025年4月的arXiv预印本平台。对这项创新研究感兴趣的读者可以通过arXiv:2504.08672v1访问完整论文,或访问即将开放的代码仓库https://github.com/xufangzhi/Genius。
日前,月之暗面正式发布新一代MoE架构基础模型Kimi K2,并同步开源。据了解,Kimi K2总参数达1T、激活参数为32B,同时也是月之暗面发布、并开源的首个万亿参数模型。
在去年全球最受瞩目的著作之一《勇敢新语 Brave New Words》中,可汗学院创始人萨尔曼·可汗说: ...
在 PersonQA 基准测试中, o3 会在 33% 的问答中出现幻觉 ,几乎是o1( 16% )的 2 倍, o4-mini 的幻觉率更是高达 48% ,远高于此前发布的推理模型。
Nestled in Chongqing's tech-driven Liangjiang New Area, the school has pioneered AI integration since its founding in 2019, evolving from a small cohort of nearly 200 students exposed to coding to a ...
卡内基梅隆大学发布了他们的一项最新研究,他们对20多个开源推理模型进行了后训练,涵盖数学推理、科学问答、代码生成、指令遵循等多个维度,最终发现,数学能力优异的模型,在其他任务上表现平平,甚至还不如未加强数学推理能力的原始模型 ...