大游中国股份有限公司-BG大游官方网站-DNA存储纠错编码技术专家

大模型“瘦身”与算力“调度术”:云巨头的新战场

作者:小编 日期:Jan.02.2026 点击数:  

  

大模型“瘦身”与算力“调度术”:云巨头的新战场(图1)

  这两天,云计算圈的热点,不再是单纯比拼谁的模型参数更多、谁的口号更响,而是悄然转向了两个更“务实”的技术方向:如何让庞大的AI模型变得更“轻快”省钱,以及如何让遍布全国的算力资源“听话”地协同工作。这背后,是AI从技术演示走向规模化商业应用的必然拐点。

  就在前几天,阿里云在2025云栖大会上抛出了一项让技术圈瞩目的发布:下一代基础模型架构Qwen3-Next。这项技术的核心突破在于“效率”。传统大模型动辄千亿、万亿参数,每一次推理都消耗着惊人的算力与成本。而Qwen3-Next架构通过采用混合注意力机制、高稀疏度MoE(混合专家)结构、多token预测(MTP)机制等核心技术,实现了惊人的效率提升。

  最直观的数据是:一个总参数达800亿(80B)的Qwen3-Next模型,在推理时仅需激活30亿(3B)参数,其性能即可媲美其上一代旗舰版235B的密集模型。这意味着什么?好比一辆巨型卡车,现在只需要启动一个小型发动机,就能跑出原来大排量发动机的速度。带来的直接好处是,模型训练成本较之前的密集模型大幅降低超过90%,长文本推理的吞吐量也提升了10倍以上。这为AI应用的大规模、低成本铺开扫清了一大障碍。

  关联A股公司:这种在模型架构底层进行创新,追求极致性能功耗比的技术路线,与国内一些专注于AI算力芯片、模型压缩与加速技术的公司战略高度相关。例如,专注于AI处理器设计的寒武纪、在云端AI芯片及计算平台有所布局的海光信息,以及提供AI服务器和算力解决方案的浪潮信息、中科曙光,都将从模型效率提升带来的底层算力需求变化中寻找到新的市场机会。

  如果说模型“瘦身”解决的是单点效率问题,那么算力的智能调度与融合,解决的则是全局资源优化难题。这个领域,电信运营商出身的云服务商展现出了独特的网络基因优势。

  中国电信近期升级发布的 “息壤2.0”算力互联调度平台,正是这一趋势的代表。它的目标直指AI规模化落地的核心痛点——算力资源分散、异构、适配难。息壤平台通过自研的可扩展调度框架与动态注册调度算法,致力于实现 “资源无关”、“框架无关”和“工具无关” 。简单说,就是试图打造一个算力领域的“超级调度中心”,无论客户的数据和任务在哪里,需要哪种芯片(国产或国际)和训练框架,都能被智能地匹配到最合适的算力资源上,并快速交付。

  更硬核的是,为了满足金融、智算等对时延极端敏感业务的需求,中国电信建成了全球首条跨境商用空芯光纤(东莞—深圳—香港),将光信号传输速度提升30%,并结合自研的超低时延技术,将粤港交易所互访时延降至1毫秒以内。这为跨地域的算力高效协同奠定了物理基础。

  关联A股公司:算力调度与网络基础设施的升级,直接利好通信设备、光通信及数据中心基础设施供应商。例如,全球领先的光通信设备商中兴通讯、烽火通信,光纤光缆龙头长飞光纤、亨通光电,以及提供数据中心温控、电源等关键基础设施的英维克、科华数据等公司,都将受益于算力网络建设带来的确定性需求。

  模型和算力之上,承载一切的操作系统也在为AI而变。近日,openEuler社区发布了首个支持超节点的操作系统版本——openEuler 24.03 LTS SP3。这标志着操作系统的核心诉求,正从优化单机性能转向管理超节点异构协同。

  所谓“超节点”,可以理解为将多个物理服务器甚至整个数据中心视为一个更庞大的、可统一调度的计算资源池。AI创新业务,尤其是大规模分布式训练和推理,对跨节点、跨异构芯片(如CPU、GPU、NPU)的协同计算提出了极高要求。openEuler的这一升级,正是为了加速释放超节点异构算力,掌控AI时代的效率天花板。华为作为社区核心成员,也表示将贡献超节点操作系统插件及多项关键AI技术。

  关联A股公司:国产操作系统的生态发展与AI原生演进,为相关软件和生态伙伴带来机遇。除了主导社区的华为(其鲲鹏生态涉及众多合作伙伴),国产操作系统厂商麒麟信安、统信软件(诚迈科技参股)等,也将在拥抱AI原生、适配超节点和异构算力的浪潮中,巩固和扩大自己的市场地位。

  AI的爆发,尤其是多模态和自动驾驶等场景,催生了海量非结构化数据(图片、视频、点云)的存取与处理需求,这对存储系统构成了前所未有的挑战。腾讯云在第三季度财报中特别指出,其云存储产品收入显著增长,得益于头部汽车制造商和互联网公司对AI存储的需求。

  腾讯云的应对之策是构建全链路AI存储底座。其对象存储COS作为海量数据湖,满足EB级扩容需求。而针对训练时的高并发、低延迟需求,其数据加速器GooseFS通过“分级缓存”技术,将热数据缓存到近计算端,提供亚毫秒级时延和Tbps级别吞吐能力,将训练数据加载性能提升最高达6倍。同时,其数据万象(CI)服务提供智能检索、内容审核等能力,完善AIGC内容的生产与治理链路。

  关联A股公司:AI驱动下的高性能存储和数据处理需求,利好存储硬件及软件解决方案提供商。例如,专注于企业级SSD和存储模组的江波龙、佰维存储,提供分布式存储系统的同有科技,以及大数据基础软件平台厂商星环科技等。

  综合近两日的技术动向来看,云计算领域的竞争焦点已发生深刻转变。各家巨头不再仅仅满足于发布参数更大的模型,而是将更多资源投入到让模型更高效(Qwen3-Next)、让算力更协同(息壤2.0)、让基础软件更适配(openEuler超节点OS)、让数据流动更顺畅(腾讯云AI存储方案) 这些关乎实际落地成本和效率的关键环节。

  这标志着AI云计算进入了“精打细算”的深水区。未来的胜出者,不仅是拥有最强算力资源的“地主”,更是那些能通过顶尖的系统软件和调度技术,将每一份算力、每一字节数据、每一次模型推理的效能发挥到极致的最强“管家”。这场围绕效率与协同的底层技术竞赛,才刚刚拉开序幕,而产业链上的每一环,从芯片、服务器、光网络到操作系统、存储和软件,都蕴含着新的机遇。

  据新华社消息,美国企业家埃隆·马斯克2025年12月31日在社交媒体上表示,其脑机接口公司“神经连接”将于2026年开始对脑机接口设备进行“大规模生产”,并转向“更加精简和几乎完全自动化的外科手术流程”。马斯克说,该设备的电极丝将直接穿过硬脑膜,而无需将其切除,此举意义重大。

  12月30日,长江日报记者从华中科技大学同济医学院附属同济医院老年医学科张存泰教授处了解到,俗称“坏胆固醇”的低密度脂蛋白胆固醇升高引发的动脉粥样硬化,是导致心脑血管意外的罪魁祸首。

  在商业贷款方面,2025年5月,LPR进行过一次调整,1年期LPR为3.0%,5年期以上LPR为3.5%,均较上一期下降10个基点。

  人们常常认为档案是真实历史的记录,实则不然,档案中也存在互相矛盾的地方,甚至是虚构的成分。是以,档案不仅“记录”历史,有时也会“遮蔽”历史。

  【来源:福建发布】寒潮来袭小雪、雨夹雪将抵福建❄️❄️❄️福建省气象台发布寒潮警报受强冷空气影响全省气温从今天起将明显下降未来几天最低气温过程降幅可达5-12℃内陆部分和其余局部县市将出现寒潮天气3日(周六)清晨天气最冷届时西部、北部地区最低气温将跌破冰点低至-4-0℃,有结冰中

  江苏女子称奶奶去世公司不批假还被逼离职,公司法人:上班摸鱼,害群之马;目前女子已经申请劳动仲裁

  2025年7月,江苏常熟,李女士在社交平台发帖称,今年7月奶奶去世,公司不给批假,还逼迫她自离职,她认为自己遭到了“违法开除”。

  巴山石工号子可分为三大类:开山号子、拗石号子、抬工号子。表现形式多为一人领唱、其余应和,极少数采用分组齐唱。歌词以七言、五言句式为主,多为借用其他民歌歌词,偶尔也由抬工即兴创作,且衬词丰富。

  密密麻麻,浙江姑娘体内取出2斤!这习惯已持续近20年……医生:被塞满了

  来到了浙江大学医学院附属第一医院。她已经腹胀了三四个月。此前在浙大一院消化内科曾多次利用胃镜取出胃里的毛发结石,但经过消化内科季峰主任医师评估,由于胃石体积过大,想要在内镜下取出,需要短期内进行多次胃镜操作,可能会因为反复摩擦对食管黏膜造成一定的损伤,而且治疗周期会被拉长、风险也会增加。

  北京时间1月1日,CBA官网更新了2025-2026赛季CBA联赛外籍球员注册信息,新疆广汇俱乐部取消了外援威廉-理查德森的注册,四川锦城俱乐部新增注册了沙莫里-庞兹。威廉-理查德森本赛季代表新疆仅出战5场比赛,场均只有2.2分1.6助攻。目前,新疆队中只剩下三名外援。BG大游