资讯

2020 年,OpenAI 研究员 Alec Radford ...
本文由中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队共同完成。第一作者郑晨宇是中国人民大学高瓴人工智能学院二年级博士生,主要研究方向为基础模型的优化、泛化和可扩展性理论,导师为李崇轩副教授,论文为其在字节跳动Seed实习期间完成。第二作者张新雨是字节跳动研究员,主要研究方向为视觉生成模型。李崇 ...
大利 SISSA Medialab 与瑞士 EPFL(洛桑联邦理工学院)联合研究,首次从理论角度验证:「Transformers」神经网路在训练过程中会出现如同物理相变的转折点,初期阶段以「位置」为依据理解语句,当训练资料量足够後,模型会突然切换到以 ...
针对这一问题,清华大学、北京通研院、北理工与北航的研究团队联合提出了一种 统一空间理解与主动探索的新型模型 。该方法使智能体能够在动态探索过程中逐步构建对环境的认知,从而实现更高效的空间感知与自主导航,为智能体在物理世界中的任务执行奠定了基础。
这项由天工AI(Skywork AI, Kunlun Inc.)的费正聪、李德邦、邱迪等十位研究人员共同完成的研究发表于2025年4月,论文题为《SkyReels-A2: Compose Anything in Video Diffusion Transformers》。有兴趣深入了解技术细节的读者可以通过项目主页SkyReels-A2.github.io或代码仓库https://github.c ...
用AI来研究大脑(AI for Neuro):在实验上,AI技术可以帮助科学家自动化数据分析、提取神经和行为特征;在理论上,人工神经网络能模拟人脑中神经元的活动规律与认知过程,从而验证、甚至提出新的神经科学理论。
随着训练时间的增加,EBT的思考能力持续提升,性能提升幅度从4%-8%逐步增长到10%-14%。这种渐进式的能力提升,意味着EBT模型在长期训练中的稳定性和适应性,为实际应用提供了保障。研究人员的扩展实验显示,EBT在不更换分词器的情况下,成为首个在 ...
2025年6月30日,华为正式宣布开源盘古7B参数的稠密模型、盘古Pro MoE 72B混合专家模型和基于昇腾的模型推理技术。随后一项由@HonestAGI 发布于GitHub的针对盘古大模型的研究引发业界热议,该研究的作者认为,华为推 ...
在美国总统特朗普“关税大棒”的重压下,生产大富翁(Monopoly)、变形金刚(Transformers)的全球玩具巨头孩之宝(Hasbro)警告称,今年晚些时候,美国玩具价格可能会上涨,尤其是更高关税未来如果生效的话。
孩之宝成立于1923年,生产著名的玩具和游戏,包括培乐多彩泥、变形金刚、糖果乐园和龙与地下城。 尽管孩之宝尚未因关税问题涨价,但Cocks预计, 该公司产品的整体涨价即将到来,很可能就在秋季。
BEIJING, July 12 (Xinhua) -- China has achieved a major breakthrough in clean energy technology with the rollout of the world's most powerful direct-drive floating wind turbine.