关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家1628人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女喜人也太难了,但也太棒了!

时尚COSMO 浏览 2140

赖清德声称打造所谓"台湾之盾"防空系统 国台办回应

界面新闻 浏览 2707

预售权益价10.69万元起 东风日产N6将上市

网易汽车 浏览 2194

百亿龙头股董事长获刑,已上诉!IPO关键期行贿官员,过程曝光

深蓝财经 浏览 2391

以总理办公室:内塔尼亚胡28日将启程访美

上观新闻 浏览 2008

4年8000万美元?解析火箭续约伊森前景:最终达成可能性较大

罗说NBA 浏览 2618

票房破26亿,只是个开始!谢霆锋、王宝强、吴京要掀起一波新高潮

皮皮电影 浏览 1742

40余名高二学生被强收7500元网课费 两地教育局调查

大风新闻 浏览 9298

高市早苗曾叫嚣台湾有事日本必入

极目新闻 浏览 2483

带队英超客胜曼城和利物浦,阿莫林是近五个赛季唯一一人

懂球帝 浏览 2589

官方:法国后卫泰奥-佩勒纳尔加盟梅州客家,穿5号球衣

懂球帝 浏览 1687

"杭州湾X5"来了 40万级性能插混极氪8X官宣

网易汽车 浏览 1861

专家:演习5个区域形成"三面围岛"之势 传递明确信号

环球时报 浏览 6981

中老年女人穿对衣才优雅!试试这3个穿搭法则,不扮嫩不油腻

静儿时尚达人 浏览 1872

Vogue这一夜太抓马了

细语 浏览 2602

入职要姓“鼠”?三只松鼠工作人员回应

第一财经资讯 浏览 2251

腾讯 AI 实现肺癌基因突变预测,精度最高 99%

IT之家 浏览 2710

《向往》口碑翻车!官方以嘉宾清闲为豪?

萌神木木 浏览 2584

母亲被父亲刺28刀死亡 11岁儿子因给父亲开门深深自责

都市报道 浏览 7181

特朗普避谈伊朗怎样算违反停火 坚称"他们想达成协议"

极目新闻 浏览 1558

女子被堂妹邀请合伙做生意发现不对劲:我可是你姐姐啊

1818黄金眼 浏览 1523
这里是统计代码下面
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1