
开云体育(中国)官方网站Ling-1T 沿用 Ling 2.0 架构-开云(中国)kaiyun体育网址-登录入口
新闻
IT之家 10 月 9 日音信,当天,蚂集中团发布万亿参数的通用言语模子 Ling-1T。Ling-1T 是蚂蚁百灵大模子 Ling 2.0 系列的第一款旗舰模子,亦然蚂蚁百灵团队迄今为止推出的范围最大、智力最强的非想考大模子。 测评夸耀,在有限输出 Token 条目下,Ling-1T 于多项复杂推理基准中得到 SOTA 发达,展示出在高效想考与精确推理之间的不凡均衡。另外,在代码生成、软件树立、竞赛数学、专科数学、逻辑推理等多项高难度基准测试上,Ling-1T 均得到朝上收成,多名标的位居开
详情

IT之家 10 月 9 日音信,当天,蚂集中团发布万亿参数的通用言语模子 Ling-1T。Ling-1T 是蚂蚁百灵大模子 Ling 2.0 系列的第一款旗舰模子,亦然蚂蚁百灵团队迄今为止推出的范围最大、智力最强的非想考大模子。
测评夸耀,在有限输出 Token 条目下,Ling-1T 于多项复杂推理基准中得到 SOTA 发达,展示出在高效想考与精确推理之间的不凡均衡。另外,在代码生成、软件树立、竞赛数学、专科数学、逻辑推理等多项高难度基准测试上,Ling-1T 均得到朝上收成,多名标的位居开源模子的榜首。
以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25)为例,Ling-1T 以平均 4000+ Token 的破钞达到了 70.42% 的准确率,优于 Gemini-2.5-Pro(平均 5000+ Token,准确率 70.10%)。Ling-1T 用更少的 Token 终澄澈更高的准确率,展现出在推理精度和想考效果轮廓智力上的上风。
据蚂蚁百灵团队显现,Ling-1T 沿用 Ling 2.0 架构,在 20T+tokens 高质料、高推理浓度的语料上完成预锤真金不怕火,相沿最高 128K 高下文窗口,通过“中锤真金不怕火 + 后锤真金不怕火”的演进式想维链(Evo-CoT)极大栽种模子高效想考和精确推奢睿力。
蚂蚁百灵团队还显现,在万亿级旗舰模子的研发经过中,屡次不雅察到:扩大模子范围与强化推奢睿力,经常会带来突如其来的跨领域泛化发达。举例,在智能体器具调用任务 BFCL V3 上,Ling-1T 虽未在中锤真金不怕火阶段引入大都操作轨迹,仅通过一丝教唆微调,即可达到约 70% 的调用准确率,展现出不凡的推理迁徙与泛化智力。Ling-1T 能精确并吞复杂当然言语教唆,自主完成轮廓性任务:将婉曲的逻辑问题飘舞为功能完备的可视化组件,为多端环境生成高兼容性前端代码,或笔据指定格调与口吻创作营销案牍、体裁续篇及多语种文本。团队以为,这些智力组成了通用智能体的要道基础。
蚂蚁百灵团队称,尽管 Ling-1T 在高效推理、跨领域泛化与锤真金不怕火效果方面得到显赫进展,但仍存在以下局限:
attention 架构仍基于 GQA
在超长高下文和复杂推理任务中发达踏实,但推理资本偏高。后续将引入搀和细心力架构,以栽种锤真金不怕火推理效果、镌汰算力支拨。
智能体智力仍需强化
现时版块在多轮交互、永久回想和复杂器具使用等方面仍有限,近期将捏续栽种器具并吞与使用智力,增强模子的主动性与泛化智力。
教唆解任与身份分解问题
部分场景下仍可能出现教唆实行偏差或变装期侮。后续将通过强化式身份对皆与安全微调改革模子一致性。
将来版块将不竭在架构、推理与对皆层面迭代,股东 Ling 系列迈向更高水平的通用智能。
IT之家附开源仓库和体验页面:
HuggingFace:https://huggingface.co/inclusionAI/Ling-1T
ModelScope:https://modelscope.cn/models/inclusionAI/Ling-1T
GitHub:https://github.com/inclusionAI/Ling-V2
Ling chat(国内用户):https://ling.tbox.cn/chat
ZenMux(国际树立者开云体育(中国)官方网站,提供 Chat 测试与 API 等智力):https://zenmux.ai/inclusionai/ling-1t
告白声明:文内含有的对外跳转联贯(包括不限于超联贯、二维码、口令等时势),用于传递更多信息,苟且甄选时间,戒指仅供参考,IT之家所有著作均包含本声明。 ]article_adlist--> 声明:新浪网独家稿件,未经授权阻遏转载。 -->