腾讯再开源两款最新大模型 开闭源之争又起波澜
股市策划师
2025-09-22 23:00:37
0

K图 00700_0

  11月5日,腾讯混元宣布开源两款最新的大模型产品,分别是MoE架构的大语言模型“Hunyuan-Large(混元Large)”,以及3D生成大模型“Hunyuan3D-1.0”,两者都支持企业开发者精调和部署,同时上线HuggingFace和Github等技术社区,供开发者免费商用。

  在腾讯口中,混元Large是目前开源领域参数规模最大、效果最好的MoE模型,而混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型,这两个模型均为腾讯自研,在架构、算法、数据等方面有所创新。

  谈及外界关注的开闭源之争,腾讯机器学习平台总监康战辉表示,腾讯不急于为了开源而开源,本次开源的模型都是自己内部业务已经在用的模型。

  但腾讯方面也强调,未来将继续加大开源力度,坚持自主可控,同时还将开源部分大模型工程框架(AnglePTM和AngleHCF),试图让行业开发者和企业能以更低成本使用这些开源大模型。

  坚持MoE架构,押宝合成数据

  据腾讯介绍,混元Large模型总参数量为389B,激活参数量52B。它采用的MoE(Mixture of Experts)混合专家模型是目前国内外主流的大模型结构。

  今年年初,混元大模型在国内率先采用MoE架构,性能比上一代Dense模型提升50%。随后腾讯连续推出基于MoE架构的多模态理解大模型以及基础模型“混元turbo”。

  在模型训练层面,腾讯混元Large构建了覆盖数十个类目的中英文合成数据。合成数据也是今年行业比较流行的概念,主要解决自然数据越来越不够用的问题。

  康战辉表示,全球目前拥有的自然数据可能会在2026年被全部用完,在未来的大模型训练过程中,合成数据的占比会越来越高,所以高质量的合成数据非常关键,腾讯混元在这方面有一定优势。

  混元Large模型想要对外展现的另一个重点是它的长文能力。其基于公开数据构建了一套覆盖长文阅读理解、多文档摘要总结和长文逻辑推理领域的数据集企鹅卷轴(PenguinScrolls),用来解决长文领域测评数据集缺乏、方法不够客观等问题。这套企鹅卷轴评测集也将同步对外开放。

  目前,混元Large模型的长文能力已经在“腾讯元宝”上应用,最大支持256K上下文,相当于一本《三国演义》的内容长度。

  本次腾讯推出的另一款开源模型——Hunyuan3D-1.0则瞄准现有的3D生成模型在生成速度和泛化能力上存在不足的问题,强调泛化能力和可控性,能重建大到建筑、小到工具、花草的各类尺度物体,帮助开发者自动化生产3D资产。

  腾讯混元3D生成大模型的首批开源模型包含轻量版和标准版,其中轻量版据称10秒就能生成高质量3D资产,包含模型权重、推理代码、模型算法等完整模型,可供开发者、研究者等各类用户免费使用。

  目前,3D生成相关技术已经在腾讯内部大量业务中应用,包括UGC 3D创作、商品素材合成、游戏3D资产生成等场景。

  持续不断的开闭源之争

  今年4月份,百度创始人李彦宏在公开场合表示,开源模型会越来越落后。没多久,阿里云首席技术官周靖人隔空回应称,开源对全球技术和生态的贡献毋庸置疑,已经没有再讨论的必要。

  这番针锋相对的言论引发了国内大模型行业关于开源和闭源孰优孰劣的激烈讨论。

  从国内现状来看,阿里和腾讯等云大厂更倾向于开源模型路线,而月之暗面和智谱AI等创业公司选择的是闭源路线。

  开闭源之争,看似是技术路线存在分歧,背后更重要的是对商业价值的考量。

  对于头部大厂而言,大模型的训练成本投入在可接受范围之内,商业模式的重心放在云服务层面,希望通过拓展大模型客户的方式,来提升自家云服务的订单量和市场份额。创业公司绝大部分研发投入来自于外部融资,自然对大模型本身的盈利能力有较高的需求。

  闭源大模型目前主要依靠API(应用程序编程接口)调用来向开发者收费,在C端(消费级业务)则主要依靠会员费来变现,Kimi和豆包都是如此。

  虽然业内关于开闭源的讨论持续不断,但从目前市面上的产品表现来看,李彦宏当初预言的那句“开源模型会越来越落后”尚未成真。康战辉更是宣称,Hunyuan-Large大模型要比目前业内所有同行的开源模型效果更好。

  根据腾讯方面给出的公开测评结果,混元Large在CMMLU、MMLU、CEval、MATH等多学科综合评测集以及中英文NLP任务、代码和数学等维度,都超过了Llama3.1、Mixtral等主流开源大模型。

  康战辉还表示,腾讯的开源大模型不但要在中文领域领先,希望在英文领域也能保持领先,未来还将发布更多开源模型产品。

  腾讯是否能实现上述目标仍是一个问号,但可以预见的是,在未来很长一段时间内,国产大模型行业都将处于开源和闭源共存的模式,彼此之间的竞争只会越来越激烈。

相关内容

腾讯再开源两款最新大模型 ...
  11月5日,腾讯混元宣布开源两款最新的大模型产品,分别是MoE...
2025-09-22 23:00:37
突传重磅!刚刚拜登签署一项...
  拜登,又有大动作!  当地时间1月14日,美国总统拜登签署了一...
2025-08-20 15:00:36
带着账上2600亿!宁德时...
  宁德时代(300750.SZ)昨日深夜公告拟发行境外上市外资股...
2025-07-31 23:38:42
5月25日香港银行同业人民...
资料更新于香港时间: 2021/05/25 09:00:035月2...
2025-06-30 23:11:08
刘擎严飞:现代人都是异乡客...
学了那么多知识,离真实世界却越来越远?走过那么多风景,仍找不到那个...
2025-06-28 23:25:55
国际油价1日上涨
  新华社纽约5月1日电国际油价1日上涨。  截至当天收盘,纽约商...
2025-06-20 23:11:32

热门资讯

挖掘银发旅游列车更大潜力 近日,商务部、文化和旅游部、国铁集团等九部门联合发布《关于增开银发旅游列车 促进服务消费发展的行动计...
欧洲央行维持利率政策 留意未来...   【欧洲央行维持主要再融资利率、存款机制利率和边际借贷利率不变,符合市场预期。】这一决定显示欧洲央...
从出行“大数据”看“跨界联动”...   426.8万人次!5月1日,长三角铁路单日旅客发送量再创历史新高,距离上一个“单日最高峰”(4月...
ST股业绩预告百态:有的自救成... 新一轮退市潮启动。今年是退市新规实施的第4年,在强退市背景下,问题上市公司加速出清。2020年底,退...
3月4日基金净值:博时富璟纯债... 本站消息,3月4日,博时富璟纯债一年定开债最新单位净值为1.0246元,累计净值为1.0728元,较...
股票行情快报:京东方B(200... 本站消息,截至2024年3月14日收盘,京东方B(200725)报收于2.53元,下跌1.17%,换...
期货配资公司推荐:谨慎选择,稳... 期货配资公司推荐:谨慎选择,稳健获利元描述: 寻找可靠的期货配资公司?本文深入分析期货配...
,对于现在的赛力斯来说,华为才...  ,对于现在的赛力斯来说,华为才是最大的心患,问界失去它啥都没了提到问界,大家第一时间会联想到谁?...
实盘股票配资:高杠杆下的财富游... 实盘股票配资:高杠杆下的财富游戏,你准备好了吗?元描述: 深入探讨实盘股票配资的风险与机遇...
陕鼓动力(601369SH)发... 智通财经APP讯,陕鼓动力(601369.SH)发布2024年半年度报告,报告期内公司实现营业收入5...