transformers - 搜索 News

资讯

6 小时

2020 年，OpenAI 研究员 Alec Radford ...

人民大学&字节Seed：利用μP实现Diffusion Transformers高效扩展

本文由中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队共同完成。第一作者郑晨宇是中国人民大学高瓴人工智能学院二年级博士生，主要研究方向为基础模型的优化、泛化和可扩展性理论，导师为李崇轩副教授，论文为其在字节跳动Seed实习期间完成。第二作者张新雨是字节跳动研究员，主要研究方向为视觉生成模型。李崇 ...

CTIMES7 天

AI「相变」新证据 Transformers从词序推理突变为语意理解

大利 SISSA Medialab 与瑞士 EPFL（洛桑联邦理工学院）联合研究，首次从理论角度验证：「Transformers」神经网路在训练过程中会出现如同物理相变的转折点，初期阶段以「位置」为依据理解语句，当训练资料量足够後，模型会突然切换到以 ...

1 天

ICCV 2025满分论文：一个模型实现空间理解与主动探索大统一

针对这一问题，清华大学、北京通研院、北理工与北航的研究团队联合提出了一种统一空间理解与主动探索的新型模型。该方法使智能体能够在动态探索过程中逐步构建对环境的认知，从而实现更高效的空间感知与自主导航，为智能体在物理世界中的任务执行奠定了基础。

科技行者 on MSN1 天

AI视频生成新突破：天工AI让你用几张照片就能拍出好莱坞大片

这项由天工AI（Skywork AI, Kunlun Inc.）的费正聪、李德邦、邱迪等十位研究人员共同完成的研究发表于2025年4月，论文题为《SkyReels-A2: Compose Anything in Video Diffusion Transformers》。有兴趣深入了解技术细节的读者可以通过项目主页SkyReels-A2.github.io或代码仓库https://github.c ...

腾讯网16 小时

智能之镜：NeuroAI如何反映大脑与人工智能的未来

用AI来研究大脑（AI for Neuro）：在实验上，AI技术可以帮助科学家自动化数据分析、提取神经和行为特征；在理论上，人工神经网络能模拟人脑中神经元的活动规律与认知过程，从而验证、甚至提出新的神经科学理论。

7 天

新一代EBT架构：基于能量的Transformer全面超越现有模型35%

随着训练时间的增加，EBT的思考能力持续提升，性能提升幅度从4%-8%逐步增长到10%-14%。这种渐进式的能力提升，意味着EBT模型在长期训练中的稳定性和适应性，为实际应用提供了保障。研究人员的扩展实验显示，EBT在不更换分词器的情况下，成为首个在 ...

芯智讯 on MSN9 天

华为盘古大模型“抄袭”阿里Qwen？官方回应

2025年6月30日，华为正式宣布开源盘古7B参数的稠密模型、盘古Pro MoE 72B混合专家模型和基于昇腾的模型推理技术。随后一项由@HonestAGI 发布于GitHub的针对盘古大模型的研究引发业界热议，该研究的作者认为，华为推 ...

5 天

美国变形金刚，要涨价了

在美国总统特朗普“关税大棒”的重压下，生产大富翁（Monopoly）、变形金刚（Transformers）的全球玩具巨头孩之宝（Hasbro）警告称，今年晚些时候，美国玩具价格可能会上涨，尤其是更高关税未来如果生效的话。

5 天

特朗普“关税大棒”重压下，美国的变形金刚都要涨价了！

孩之宝成立于1923年，生产著名的玩具和游戏，包括培乐多彩泥、变形金刚、糖果乐园和龙与地下城。尽管孩之宝尚未因关税问题涨价，但Cocks预计，该公司产品的整体涨价即将到来，很可能就在秋季。

China.org.cn3 天

China Focus: World's most powerful direct-drive floating wind turbine unveiled in China

BEIJING, July 12 (Xinhua) -- China has achieved a major breakthrough in clean energy technology with the rollout of the world's most powerful direct-drive floating wind turbine.

一些您可能无法访问的结果已被隐去。

显示无法访问的结果