检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
M3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优,按需计费模式能大幅降低客户的业务成本。 适用计费项 AI原生应用引擎的以下计费项支持按需计费。 表1 适用计费项 计费项 说明 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持。
必填项,选择系统中已提前创建的部门。 关联服务 必填项,选择系统中已提前创建并发布的服务。 团队LOGO 必填项,单击系统默认图片上的“点击修改”,可选择本地图片自定义LOGO图片。 团队简介(可选) 非必填项,团队空间的功能描述或其他备注信息。 单击“创建”。 在“我的团队”区域可查看到创建的团队的卡片。
选择“我的模板”页签,单击“新建屏幕模板分组”。 输入屏幕模板分组名称。 填写屏幕模板分组的名称,根据规划自定义。建议您按照一定的命名规则填写屏幕模板分组名称,方便您快速识别和查找。 屏幕模板分组名称需要满足以下要求:可输入1~64个字符,可包括中文、字母、数字及下划线。 屏幕模板分组名称满足唯一性,不可重复。
我的卡片”。 在“我的卡片”界面,单击页面左上角的“新建卡片分类”。 输入卡片分类名称。 建议您按照一定的命名规则填写卡片分类名称,方便您快速识别和查找。卡片分类名称由1~64个字符组成,包括中文、字母、数字及下划线,需满足唯一性且不可重复。 输入完成后按Enter键,卡片分类新建成功。
必填。在数据分析系统中使用的模型标识符,通常是一个短字符串或缩写,用于标识一个特定的模型。 只能包含英文字母、数字和下划线,且以英文字母开头,长度不超过20个字符。 模型显示名 必填。在数据分析系统中显示的模型名称,通常是一个更易于理解和识别的字符串。 数据表 必填。数据表用于存储和管理数据。 该参数值来源于“通用数据接入”页面配置的数据名称。
类,以便模型可以更好地理解和使用这些数据。例如,在自动驾驶的应用中,云数据可以被标注为包含建筑物、其他小物体、交通工具等信息,以便模型可以识别和理解这些对象。在辅助数据标注的方法中,通过训练模型,可以实现标注结果,从而提高数据的质量和准确性。 前提条件 需要具备AI原生应用引擎管
访问密钥ID(Access Key ID),华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。 SK 秘密访问密钥(Secret Access Key),华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保
SQL变更功能可以帮助业务(主要是开发和运维)简化现网的SQL变更流程。帮助运维在做现网数据库变更时更好地发现SQL语句的相关风险,将高中低风险项识别出来,避免人工执行过程中产生的相关误操作;帮助开发简化现网上线SQL变更的流程,促进开发人员在版本开发的过程中提前将相关风险的语句进行筛选和甄别。
在“基础信息”页面,配置如表1所示参数。 表1 添加工具参数说明 参数名称 参数说明 工具LOGO 单击系统默认图片上的“点击修改”,可选择系统预置图片作为工具LOGO,也可单击“上传LOGO”,上传本地图片作为工具LOGO,上传图片支持支持JPG、JPEG、PNG和BMP,最大10MB。 工具名称 自定义工具名
卡片的描述信息。由1~400个字符组成,包含中文、字母、数字及下划线。 卡片封面 可选项。 单击左侧方框中的,上传本地准备好的封面图。推荐图片比例为4:3。 配置完成后,单击“确定”。 在“提示”对话框中单击“确认”:可以在此页面继续新建卡片。 在“提示”对话框中单击“取消”:系统自动返回“配置看板
在“上传文档”对话框,选择“交付方式”为“在线文档”,单击“创建文档”,进入文档编辑页面进行内容写作,文档内容将实时自动保存,创建在线文档成功。 如需更换文档交付方式,先删除此在线文档。删除文档后其全部内容将被清空,且内容将无法恢复,请谨慎操作。 (可选)如需更新在线文档,具体操作如下: 返回“
微调任务执行完成后,单击“操作”列的“发布”,发布模型。 步骤三:部署模型 部署模型是将模型部署为在线服务,通过创建部署服务实现,创建成功后,可以对在线服务可以进行预测和调用。本文需要为基座模型(原模型)和微调后的新模型分别创建模型服务。由于在线运行需消耗资源,请确保账户未欠费。 在AI原生应用引擎的左侧导航栏选择“模型中心
访问密钥ID(Access Key ID),华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。 SK 秘密访问密钥(Secret Access Key),华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保
检索规划包含“Query拆解”、“Query改写”、“意图识别”三个执行动作,执行动作参数配置说明如表2所示。 Query拆解:配置适当的模型将原始查询内容拆解为更简单、易理解的请求。 Query改写:配置适当的模型对原始查询内容进行改写、优化,使得原始请求更准确。 意图识别:配置适当的模型对原始内容进行意图判断。
is_response_verify 否 Boolean 是否开启返回体内容审核(默认不开启)。 有文本内容,则对文本进行内容审核; 有图片内容,则会对图片进行内容审核。 响应参数 状态码: 200 表7 响应Body参数 参数 参数类型 描述 id String 文本对话唯一标识符。
支持将平台资产中心预置的部分模型作为微调前基础模型,也可以选择微调后的新模型作为基础模型再次进行微调。 前提条件 已订购大模型微调服务API在线调用-SFT局部调优,订购方法请参见购买AI原生应用引擎按需计费资源。 已具备格式为“对话文本”的微调数据集,具体请参考创建微调数据集或收藏预置微调数据集。
义屏幕构建。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请的操作请参见权限管理。 已创建我的卡片,具体请参见使用在线构建方式新建卡片、使用模板构建方式新建卡片、使用离线构建方式新建卡片。 新建屏幕模板 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心。
如果创建Agent时,使用配置变量的方式实现了记忆能力,在使用Agent时会自动识别对话与变量匹配的内容,自动更新变量取值,选择页面右上角的“记忆 > 变量”,可以查看变量使用效果。 如果创建Agent时,开启了“片段记忆”,在使用Agent时会自动识别并保留用户个性化信息,选择页面右上角的“记忆 > 片段记忆”,可以查看片段记忆使用效果。
I,但是该模型能力有限,只能作为问答模型,不能作为思考模型。首次使用该模型服务API需要订购免费的“ChatGLM3-6B大模型服务API在线调用”资源,订购后即可进行体验,订购操作请参见购买AppStage。 平台预置了开源模型Qwen系列、DeepSeek系列等,请参考将已有
如果创建Agent时,使用配置变量的方式实现了记忆能力,在Agent体验时会自动识别对话与变量匹配的内容,自动更新变量取值,选择页面右上角的“记忆 > 变量”,可以查看变量使用效果。 如果创建Agent时开启了“片段记忆”,在Agent体验时会自动识别并保留用户个性化信息,选择页面右上角的“记忆 > 片段记忆”,可以查看片段记忆使用效果。