检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
描述 必填项。 自定义卡片的描述信息。 封面图 卡片的封面图。 自动截图:单击“截屏”,自动获取画布中的图片。 上传封面:单击“添加图片”,在弹出界面,单击,选择本地准备好的图片,裁剪出符合要求的尺寸后,单击。 在界面右上方单击“保存”,系统自动弹出“保存”页面,确认卡片信息,单击“保存”。
在“基础信息”页面,配置如表1所示参数。 表1 添加工具参数说明 参数名称 参数说明 工具LOGO 单击系统默认图片上的“点击修改”,可选择系统预置图片作为工具LOGO,也可单击“上传LOGO”,上传本地图片作为工具LOGO,上传图片支持支持JPG、JPEG、PNG和BMP,最大10MB。 工具名称 自定义工具名
在“上传文档”对话框,选择“交付方式”为“在线文档”,单击“创建文档”,进入文档编辑页面进行内容写作,文档内容将实时自动保存,创建在线文档成功。 如需更换文档交付方式,先删除此在线文档。删除文档后其全部内容将被清空,且内容将无法恢复,请谨慎操作。 (可选)如需更新在线文档,具体操作如下: 返回“
卡片的描述信息。由1~400个字符组成,包含中文、字母、数字及下划线。 卡片封面 可选项。 单击左侧方框中的,上传本地准备好的封面图。推荐图片比例为4:3。 配置完成后,单击“确定”。 在“提示”对话框中单击“确认”:可以在此页面继续新建卡片。 在“提示”对话框中单击“取消”:系统自动返回“配置看板
embeddings List[float] 向量,一个浮点数列表。 object str 当前为embedding。 Images 将用户输入的文本转化成图片。 接口调用:ModelRouter.images.generate 参数说明: 表8 参数说明 参数名称 参数类型 是否必选 参数描述 prompt
微调任务执行完成后,单击“操作”列的“发布”,发布模型。 步骤三:部署模型 部署模型是将模型部署为在线服务,通过创建部署服务实现,创建成功后,可以对在线服务可以进行预测和调用。本文需要为基座模型(原模型)和微调后的新模型分别创建模型服务。由于在线运行需消耗资源,请确保账户未欠费。 在AI原生应用引擎的左侧导航栏选择“模型中心
2.进入AI原生应用引擎,在左侧导航栏选择“知识中心 > 知识库”,可从页面知识库ID栏获取。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization
is_response_verify 否 Boolean 参数解释: 是否开启返回体内容审核(默认不开启)。 有文本内容,则对文本进行内容审核; 有图片内容,则会对图片进行内容审核。 约束限制: 不涉及。 取值范围: true或false 默认取值: false。 响应参数 状态码: 200 表7
本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
配置离线数据模型基础信息,参数说明如表1所示。 表1 基础信息 参数 说明 模型名称 必填。数据模型的名称,用来区分不同的数据模型。 只能包含英文字母、数字和下划线,且以英文字母开头,长度不超过20个字符。 模型显示名 必填。数据可视化所显示的模型名称。 任务类型 指定配置的任务类型。 周期任务 说明:
I,但是该模型能力有限,只能作为问答模型,不能作为思考模型。首次使用该模型服务API需要订购免费的“ChatGLM3-6B大模型服务API在线调用”资源,订购后即可进行体验,订购操作请参见购买AppStage。 平台接入的第三方模型服务 开源模型Qwen系列、DeepSeek系列等。
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
M3-6B服务、大模型调优服务API在线调用。 套餐包单价+按需计费(ChatGLM3-6B服务、大模型调优服务API在线调用) 知识库容量:50GB 智能应用运行时引擎(20实例):2个 ChatGLM3-6B服务、大模型调优服务API在线调用根据实际输入和输出tokens总量计费,计费规则请参考按需计费
代码仓管理是开发中心集成代码托管(CodeArts Repo)服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 本章节介绍如何使用开发中心集成的CodeArts
代码仓管理是开发中心集成代码托管CodeArts Repo服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 关于代码仓管理的常见问题请参见代码托管(CodeArts
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
AppStage开发中心知识库是面向开发团队的知识管理系统,支持知识全生命周期管理,帮助您完成智能、安全的知识作业,提供层级式的目录树、多人在线协同编辑等功能。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。
我的Agent”,选择“我创建的”页签,选择列表操作列的“更多 > 修改”,在浏览器地址栏查看id。 约束限制: 不涉及。 取值范围: 由英文字母和数字组成,长度为32个字符。 默认取值: 不涉及。 attachment-code 是 String 参数解释: 附件码。此处请填写固定值:ai-file-box。
更倾向于生成较少见的单词。 内容安全监测配置 当“输出方式”为“非流式”时,显示此参数。 选择是否打开开关,开启后,可对返回内容中的文本和图片进行安全监测。 调测文本向量化类型模型 请输入文本,可参照以下示例输入文本。 示例1:那是个快乐的人 示例2: ["那是个快乐的人", "那是个高兴的人"
对处于保留期的按需计费资源执行任何操作。 保留期到期后,如果您仍未支付账户欠款,那么ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优将无法再使用。 图1 按需计费AI原生应用引擎资源生命周期 华为云根据客户等级定义了不同客户的宽限期和保留期时长。