商汤科技发布“日日新SenseNova”大模型体系

4月10日,在商汤科技SenseTime技术交流日活动上,商汤科技介绍了其以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,并公布了在该战略下的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。


(相关资料图)

商汤科技董事长兼CEO徐立表示:“将大模型体系命名为‘日日新SenseNova’,是希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”

亚洲目前最大智能计算平台之一

活动上,商汤不仅展示了“日日新SenseNova”大模型体系下的语言大模型,还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,并公布了商汤依托AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。

当前,业界训练大模型对大算力的需求非常旺盛,但真正好用的基础设施十分稀缺。在商汤历时五年建设的AI大装置上,共有27000块GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型。

徐立表示:“在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。”

“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。”商汤科技联合创始人、首席科学家王晓刚说。

持续推进大模型体系建设

据介绍,“日日新SenseNova”提供了多种灵活的API接口和服务,包括图片生成、自然语言生成、视觉感知通用任务与标注服务。用户可根据实际应用需求,调用“日日新SenseNova”大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。

“日日新SenseNova”也已为商汤的自身业务带来了诸多突破。例如在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。

自然语言是人机沟通的关键手段,“日日新SenseNova”也推出了商汤最新研发的语言大模型“商量SenseChat”。作为千亿级参数的自然语言处理模型,活动现场,“商量SenseChat”展示了多轮对话和超长文本的理解能力。

商汤也展示了语言大模型支持的几项创新应用,包括:编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息。

商汤表示,将持续推进“日日新SenseNova”大模型体系的建设,期待在数据量上、参数结构上以及能处理的问题上,可以日复一日提高。

关键词: