什么是盘古大模型服务
盘古大模型服务简介
盘古大模型服务以“模型能力+开发平台”为核心架构,整体涵盖盘古系列大模型与ModelArts Studio 大模型开发平台两大板块,形成从模型供给到全流程开发的完整服务闭环,具体内容如下:
一、盘古系列大模型:多维度覆盖场景需求
盘古系列大模型围绕 “基础能力支撑 - 行业场景适配 - 专业需求落地 - 外部补充拓展” 的逻辑,构建了多层次模型矩阵,满足不同领域的应用需求:
- 盘古基础大模型:核心能力底座
作为整个模型体系的基础支撑,盘古基础大模型提供五大核心基础能力模型,为上层模型开发与应用提供底层技术保障,具体包括:
- NLP(自然语言处理)模型:支撑文本理解、生成、翻译等语言类任务;
- 多模态模型:实现文本、图像、音频等多类型信息的融合处理;
- CV(计算机视觉)模型:覆盖图像识别、检测、分割等视觉类应用;
- 预测模型:提供趋势预测、数据研判等分析能力;
- 科学计算模型:助力物理、化学、工程等领域的科学问题求解。
- 盘古行业大模型:垂直领域定制化方案
基于盘古基础大模型的核心能力,结合各行业的业务特性与数据特征,打造行业定制化大模型,已覆盖多个关键领域,包括金融、政务、油气、矿山、电力、制造、交通、医学等,可直接适配行业场景中的核心业务需求,降低企业应用门槛。
- 盘古专业大模型:聚焦特定场景落地
针对细分场景的专业化需求,提供专项模型支持,目前主要面向 RAG(检索增强生成)场景,提供两类核心模型:
- 搜索规划模型:优化检索流程中的需求解析与搜索路径规划;
- 向量 & 重排模型:提升检索结果的准确性与相关性排序效果,强化 RAG 场景的输出质量。
- 盘古 AIKits 图像搜索大模型:细分领域专项工具
聚焦服装行业的特定需求,提供专业化图像搜索能力,可支持服装款式识别、相似款检索等场景,助力服装企业实现商品高效匹配与管理。
- 三方大模型:拓展能力边界
为进一步丰富模型选择、满足多样化场景需求,引入外部优质模型资源,目前已涵盖 DeepSeek、通义千问系列模型,与盘古自有模型形成互补,覆盖更多细分应用场景。
二、ModelArts Studio 大模型开发平台:全流程开发支撑
ModelArts Studio 定位为 “一站式大模型工具链平台”,以 “支持百模千态” 为目标,构建了数据、模型、Agent 三引擎驱动的开发体系,为大模型的全生命周期开发提供工具支撑,具体工具链如下:
- 数据工程工具链:保障训练数据质量
数据是大模型训练的核心基础,该工具链围绕 “数据全流程管理” 设计,具备七大核心功能:数据获取、数据清洗、数据合成、数据标注、数据评估、数据配比、数据发布与管理。
通过自动化质量检测与数据清洗能力,可对原始数据进行优化,确保数据的质量与一致性;同时支持多格式数据的高效收集与处理,满足不同训练、评测任务的需求,并提供强大的数据存储与管理能力,为大模型训练提供稳定、高质量的数据支撑。
- 模型开发工具链:核心开发全流程覆盖
作为盘古大模型服务的核心组件,该工具链提供 “从模型创建到部署” 的一站式解决方案,涵盖五大关键功能:模型训练、模型压缩、模型部署、模型评测、模型推理。
依托高效的推理性能优化技术与跨平台迁移工具,可保障模型在不同硬件环境、应用场景中的高效运行,降低模型开发与落地的技术难度。
- Agent 开发工具链:加速智能应用落地
该工具链是盘古大模型平台的关键模块,聚焦智能 Agent 应用的开发需求,提供两大核心能力:
- 提示词工程支持:提供提示词设计与管理工具,可优化大模型的输入提示,提升输出结果的准确性与相关性;
- 可视化编排能力:通过可视化工具简化 Agent 应用的开发流程,加速大模型在复杂业务场景中的应用落地,满足企业多样化的业务需求。
盘古大模型与ModelArts Studio大模型开发平台关系
盘古大模型通过ModelArts Studio大模型开发平台承载,用户在平台上可以使用自己的数据增训和微调模型,可对训练的模型进行压缩、评测、部署,也可以在平台上创建自己的Agent应用。