关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家1632人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北约或取消峰会 避免与特朗普冲突出现"戏剧性场面"

环球网资讯 浏览 1829

张婉婷晒宋宁峰带娃出游,网友:不离了?

今古深日报 浏览 529

反转才不是「惊蛰无声」的最大看点

吐槽电影院 浏览 1415

中方代表团成员当面质问荷兰国防大臣

每日经济新闻 浏览 28

伊朗"蚊子舰队"披露:藏身洞穴时速185公里 可发射导弹

扬子晚报 浏览 2273

特朗普涉俄乌冲突再次表态:有时候必须让他们打到底

鲁中晨报 浏览 9523

美团紧急发文

大象新闻 浏览 2313

姚顺雨“露脸”,和唐杰杨植麟探讨AGI之路

字母榜 浏览 1824

交通标志设置不合理致5814次"被违章" 当地:重新设置

封面新闻 浏览 10811

周迅线下被偶遇,身材娇小鼻子宽大老气

翰飞观事 浏览 1718

海牛:从未拖欠兰克尔·泽薪酬

体坛周报 浏览 2172

美国政府联手苹果、微软、OpenAI等公司,招募1000名工程师打造"科技力量"

华尔街见闻官方 浏览 2100

蔚来ES9压轴登场,“9系”五强争霸:谁是中国豪华新能源的终极答案?|汽车观察

封面新闻 浏览 838

最高降价30万!宝马中国回应:并非打价格战

界面新闻 浏览 1862

美媒:美方提出的28点新计划已缩减为19点

极目新闻 浏览 8506

美航母调往中东 特朗普:拭目以待

扬子晚报 浏览 1843

被控与电诈集团有关,泰国财政部副部长辞职

环球网资讯 浏览 2535

E句话| 女星放弃抢救病危丈夫,儿子当场质问?

仙女事件簿 浏览 1673

美团、京东外卖、淘宝闪购集体声明:自愿执行

中新经纬 浏览 1939

全运会女足综述:王霜制胜湖北2-1进4强 张琳艳世界波北京1-3上海

我爱英超 浏览 2253

鹈鹕114-104战胜公牛,锡安复出得18+6,墨菲20+10

懂球帝 浏览 2036
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1