资讯
在英语考试之外, 数学竞赛 ,尤其是像 袋鼠数学(Math Kangaroo)这样的国际赛事,正成为越来越多家庭教育中的“流量密码”。哈佛、MIT、牛剑等名校不仅看重语言成绩,更喜欢那些拥有逻辑思维、建模能力和国际竞赛经历 的学生。
研究团队最终选择了一个14B(140亿)参数的模型规模。这个选择颇有深意——它既足够大,能够表达复杂的数学推理过程,又不会大到无法在消费级GPU上高效运行。就像选择一个既能装下所有必需工具又便于携带的工具箱一样,这个规模在性能和实用性之间找到了最佳平 ...
16 小时
一点资讯 on MSN只因一个“:”,大模型全军覆没鹭羽 发自 凹非寺 一个冒号,竟然让大模型集体翻车? 明明应该被拦下来的虚假回答,结果LLM通通开绿灯。 该发现来自一篇名叫“一个token就能欺骗LLM”的论文。 不仅如此,除了冒号、空格这类符号,还有诸如此类的推理开头语:“Thought ...
剑桥A level最新 furrher math/mechanics力学/pure math/probabilty&statistics电子资料, 力学系列: 教材含答案+practice book+worked solution解题步骤 全套3本. further math 系列: 教材含答案+worked solution 全套2本 pure math系列: 教材2本含答案+practice ...
datawhalechina / math-for-ai Public Notifications You must be signed in to change notification settings Fork 17 Star 117 ...
21 小时
科技行者 on MSN突破传统边界:上海AI实验室提出首个完全无监督的大模型推理自我 ...这项由上海AI实验室的徐方志博士、西安交通大学的严航教授等研究团队共同完成的突破性研究,发表于2025年4月的arXiv预印本平台。对这项创新研究感兴趣的读者可以通过arXiv:2504.08672v1访问完整论文,或访问即将开放的代码仓库https://github.com/xufangzhi/Genius。
论坛的一大亮点是两大国际数学实验室中国首发。由菲数中国与西班牙国家数学科学委员会(ICMAT)联合发起的两大国际高水平数学实验室将首次在中国揭牌,普陀区人民政府将共同参与见证。实验室聚焦数学与智能融合的基础研究,致力于打造国际科研合作新平台。
日前,月之暗面正式发布新一代MoE架构基础模型Kimi K2,并同步开源。据了解,Kimi K2总参数达1T、激活参数为32B,同时也是月之暗面发布、并开源的首个万亿参数模型。
在 PersonQA 基准测试中, o3 会在 33% 的问答中出现幻觉 ,几乎是o1( 16% )的 2 倍, o4-mini 的幻觉率更是高达 48% ,远高于此前发布的推理模型。
2025年7月11日,成立仅两年的中国AI初创公司——月之暗面(Moonshot AI),正式宣布将其自主研发的Kimi K2大模型在开源社区全面开放。此举不仅标志着全球首个可商用的万亿参数级大语言模型(LLM) 面世,更因其独特的Agentic ...
Nestled in Chongqing's tech-driven Liangjiang New Area, the school has pioneered AI integration since its founding in 2019, evolving from a small cohort of nearly 200 students exposed to coding to a ...
该研究系统性评测了 LLMs 反思技术的失败,发现这种现象在多个 LLMs、多种任务上广泛存在,甚至先进的推理模型(ChatGPT o4-mini-high)在基本事实问题(「Is Earth ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果