近日,有消息称腾讯公司正加速推进大型模型应用的步伐,并在硬件方面采取了重大举措。据悉,腾讯近期已从英伟达处订购了一批新型芯片,这一订单直接导致了英伟达H20芯片在短期内出现了供应紧张的情况。
当美国科技企业家彼得·蒂尔(Peter Thiel)的书《从0到1》(Zero to One)2015年在中国出版时,它击中了许多中国人心中的一种不安全感。Thiel认为, 虽然中国在新兴技术的扩展和商用方面做得很出色,但真正的创新却不如美国 ...
在过去的三个月里,中国大模型创业公司DeepSeek和AI应用创业公司Manus如同一股狂潮,激荡着全球AI市场,快速改变着硅谷、阿里巴巴等巨头们的既定发展路径。根据DeepSeek的研究,投入2048张英伟达H800芯片以及558万美元的训练成本,他们研发的DeepSeek-V3已与OpenAI的明星模型GPT-4o相媲美,令人赞叹不已。
官方介绍,QwQ-32B 模型仅有 320 亿参数,然而其性能却能与拥有 6710 亿参数的满血版 DeepSeek R1 相媲美。尽管阿里云尚未发布完整的技术报告,但官方数据足以展现其强大实力。在编程竞赛(LiveCodeBench)和美国数学竞赛 ...
Hace poco, la empresa china de inteligencia artificial (IA) DeepSeek causó sensación en el mundo con el lanzamiento de su ...
随着 AI 技术的飞速发展,越来越多的应用和工具开始尝试将 AI 任务带到移动端。然而,尽管许多智能应用可以运行在手机上,通常都需要依赖云端计算,导 ...
2024年底我在推特上看到这么一条推文,时间是恰逢DeepSeek声名鹊起的时刻,但这个博主并没有一味的提DeepSeek,而是是说中国的AI军团不只是DeepSeek,还有一大堆的干将。 比如在Huggingface上第二大下载量的Qwen,属于阿里云;最好的视频生成模型,属于快手的可灵,还有与AI结合最好的无人机品牌大疆DJI,最好的语音AI科大讯飞iFlyTek等等,其实大家不太清楚,中国的 ...
由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型,2025年1月下旬,英伟达(NVIDIA)等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法,可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号(Spu ...
印尼数据中心市场近年快速扩张,已经成为东南亚最受瞩目的新兴数据中心枢纽之一。截至2024年,印尼国内已有约78处运营中的多租户数据中心,未来还将新增至少19个在建或规划中的数据中心项目。这一发展将使全国产能在近期内实现翻倍:目前总装机IT电力容量约为 ...
Qwen 团队是中国电商巨头阿里巴巴的一个部门,专注于开发其不断扩展的开源 Qwen 大语言模型(LLM)系列。该团队推出了 QwQ-32B,这是一种新的 320 亿参数推理模型,旨在通过强化学习(RL)提高复杂问题解决任务的性能。
by Wu YangyuThe AI application boom has finally arrived.On the evening of March 5, a new AI agent called Manus launched, and within just 24 hours, it became the hottest topic in China’s AI community.F ...
消息面上,3月6日,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B,并成功登顶全球最大的AI开源社区Hugging Face大模型榜单。据了解,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,并突 ...