商汤公布AI大模型多行业进展,大装置构建“触手可及”的AGI基础设施_环球今日报

6月2日,商汤科技展示了多项以大装置赋能大模型的最新实践成果,包括气象预测、自动驾驶、遥感、游戏以及大语言模型等众多领域,并与中国信息通信研究院联合预发布《新型AI智算基础设施白皮书》,将从多个层面解析新型AI基础设施的发展特征和建设需求,以适应生产范式的重大转变,支撑AI发展进入2.0阶段。

商汤大模型在多个行业“施展拳脚”

大模型和大算力的融合创新,正在掀起生产范式的重大转变,推动科学研究和产业应用迈向智能计算驱动的通用人工智能(AGI)时代。而在技术快速迭代的发展初期阶段,如何构建新一代的基础设施,降低应用门槛、缩短研发周期、提高创新效率,成为政府和产业上下游需要共同解决的新挑战。


【资料图】

在这样的背景下,商汤科技前瞻打造了软硬结合的AGI基础设施大装置SenseCore,并在此基础上构建了“商汤日日新SenseNova”大模型体系,推进自身AGI发展战略的同时,也为行业提供大模型算法服务、训练和推理优化以及数据服务。

在大装置的赋能下,商汤在大模型领域实现了飞速发展。今年3月开源的商汤多模态多任务通用大模型“书生(INTERN)2.5”,为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

今年4月亮相的商汤全球中期气象预报AI大模型“风乌”,首次实现在高分辨率上对核心大气变量进行超过10天的有效预报。得益于对高分辨率全球大气数据建模,“风乌”还可以模拟台风等极端气象,准确预测台风轨迹。

商汤构建的业界首个感知决策一体化的端到端自动驾驶解决方案UniAD,使车道线的预测准确率提升了30%,预测运动位移的误差降低了近40%,规划误差降低了近30%。

商汤中文语言大模型应用平台“商汤商量SenseChat”在4月初发布后一个多月时间里,在多语言能力叠加表格生成处理能力、历史知识和归纳能力、多轮对话和长文本理解能力等多方面获得显著提升。

商汤AI代码助手通过快速迭代实现了619%的推理效率提升,意味着可以在相同算力资源下支持6倍的用户数量,大大降低使用成本。

强大算力打造AGI时代基础设施

在极短时间内实现多个具有突破意义的大模型成果,正是源于商汤大装置SenseCore提供的高效率、低成本、规模化的AI基础设施与服务,赋能人工智能生产新范式。

据悉,目前,商汤AI大装置SenseCore拥有5000 Petaflops算力,可支持20个千亿参数超大模型同时训练,并提供自动化数据标注、大模型推理部署、大模型并行训练、大模型增量训练以及开发者效率提升等多种大模型服务。

6月2日下午,在商汤临港超算中心,记者见到了一排排闪烁着灯光的机柜。就是在这些机柜里面,一台台服务器正不眠不休地运行着,形成了商汤强大的算力。

商汤科技董事长兼CEO徐立表示:“在AGI时代,模型的能力可以用算力来衡量。我们以商汤大装置SenseCore打造AGI时代的基础设施,在模型的迭代速度及处理问题的能力上日日更新,不断解锁AGI的更多可能。”

商汤科技联合创始人、大装置事业群总裁杨帆也表示,算力基础设施在产业链中是一个承上启下的核心环节,人工智能未来大的技术趋势,就是模型及服务,“相信将来大模型一定会成为整个人工智能支撑产业数字化、数字产业化的核心工具性能力,商汤也会把自己的大模型能力开放给整个行业和生态伙伴,去帮助他们更好地推动智能化进程。”

据了解,截至今年5月,商汤大装置已累计服务超40个核心客户,其中大模型客户10家以上,涵盖智能驾驶、生物制药、芯片设计、智慧商业、高校科研等前沿领域,并已在超过20个落地场景中实现大模型交付。

关键词: