资讯
20 小时
科技行者 on MSN让小模型也能自己制造"老师":印度理工学院如何用强化学习让AI自我 ...这项研究由印度理工学院卡拉格普尔分校的Aniruddha Roy、Pretam Ray、Abhilash Nandy、Somak Aditya和Pawan Goyal团队共同完成,发表于2025年5月10日的arXiv预印本平台(论文编号:arXiv ...
十轮网科技资讯 on MSN1 天
你的AI同事上线中!打造更有温度的智慧职场当你打开计算机,第一个“同事”跳出来的不再是消息通知,而是语气亲切、主动询问“今天项目进度还顺利吗?”的AI助理,这种景象正迅速成为新常态。OpenAI模型与行为政策(Model & Behavior Policy)负责主管Joanne Jang最近指出,用户已不把生成式AI视为冰冷的自动化工具,而是能并肩作战、值得信赖的合作伙伴。
这款AI性能拉满、配置几近“堆满”的中大型智能电动SUV,打破了外界的预期。毕竟在发布前一段时间,小鹏几乎把所有聚光灯都打在了“高成本”标签上:自研图灵芯片、与华为联合打造的AR-HUD,以及将72B大模型蒸馏上车的VLA+VLM模型。
成立半年,Genesis AI完成超7亿元人民币的种子轮融资。 近日,美国具身智能创企Genesis AI宣布完成1.05亿美元(约合7.52亿元人民币)的种子轮融资,由美国顶级风投机构Khosla ...
Beijing's Economic-Technological Development Area, known as E-Town, plans to become a regional hub for artificial ...
"A laboratory result from the National Institute of Public Health showed on July 3 that the boy was positive for H5N1 virus," the statement said. "The patient has the symptoms of fever, cough, and ...
这应该是是硅谷具身智能赛道至今最大规模的种子轮融资,超过了此前该赛道明星创企 Physical Intelligence 的记录 。同时参与投资的还有谷歌前董事长 Eric Schmidt、欧洲科技大亨 Xavier Niel、法国中央银行 ...
7 天
科技行者 on MSN沙特32B医疗AI突破:Gazal-R1凭借双阶段训练击败12倍大模型这项突破性研究来自沙特阿拉伯利雅得TachyHealth公司的团队,由首席医学官Amr Fawzy博士、研究工程师Ahmed M. Adly和数据科学产品经理Mostafa ...
19 天
科技行者 on MSN让AI模型自己找出弱点并主动改进:微软打造的"自我反思"训练新方法这项由微软联合加州大学洛杉矶分校、中科院人工智能学院和清华大学共同开展的研究发表于2025年6月,研究论文可通过arXiv:2506.08989v1获取。想象一下,如果你是一名学生,每次考试后都能精准地知道自己在哪些知识点上掌握得不够好,然后专门针对这些薄弱环节进行强化练习,你的成绩是不是会提升得特别快?微软的研究团队就给大型语言模型(AI)开发了这样一套" ...
根据论文的展示,我认为它应该是属于 off-policy 的一种方法,因为它利用到了“old”对应的历史数据,正是由于GRPO我才开始接触到RL的相关知识,因此对这个问题不知道我这样理解是否正确? 2: GRPO训练时,我发现在同样的GPU上,用同样的数据集和超参数配置。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果