检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
必填项,选择系统中已提前创建的部门。 关联服务 必填项,选择系统中已提前创建并发布的服务。 团队LOGO 必填项,单击系统默认图片上的“点击修改”,可选择本地图片自定义LOGO图片。 团队简介(可选) 非必填项,团队空间的功能描述或其他备注信息。 单击“创建”。 在“我的团队”区域可查看到创建的团队的卡片。
Source名称。 SDK种子节点IP SDK种子节点IP信息。 实例种子节点IP 实例种子节点IP信息。 全表扫描 选择是否开启全表扫描。 在线压测 选择是否开启在线压测。 慢查询阈值 超过慢查询阈值的记录为慢sql,默认值为2000。 请求路由优化 是否开启请求路由优化。开启
Source名称。 SDK种子节点IP SDK种子节点IP信息。 实例种子节点IP 实例种子节点IP信息。 全表扫描 选择是否开启全表扫描。 在线压测 选择是否开启在线压测。 慢查询阈值 超过慢查询阈值的记录为慢sql,默认值为2000。 请求路由优化 是否开启请求路由优化。开启
描述 必填项。 自定义卡片的描述信息。 封面图 卡片的封面图。 自动截图:单击“截屏”,自动获取画布中的图片。 上传封面:单击“添加图片”,在弹出界面,单击,选择本地准备好的图片,裁剪出符合要求的尺寸后,单击。 在界面右上方单击“保存”,系统自动弹出“保存”页面,确认卡片信息,单击“保存”。
在“基础信息”页面,配置如表1所示参数。 表1 添加工具参数说明 参数名称 参数说明 工具LOGO 单击系统默认图片上的“点击修改”,可选择系统预置图片作为工具LOGO,也可单击“上传LOGO”,上传本地图片作为工具LOGO,上传图片支持支持JPG、JPEG、PNG和BMP,最大10MB。 工具名称 自定义工具名
卡片的描述信息。由1~400个字符组成,包含中文、字母、数字及下划线。 卡片封面 可选项。 单击左侧方框中的,上传本地准备好的封面图。推荐图片比例为4:3。 配置完成后,单击“确定”。 在“提示”对话框中单击“确认”:可以在此页面继续新建卡片。 在“提示”对话框中单击“取消”:系统自动返回“配置看板
embeddings List[float] 向量,一个浮点数列表。 object str 当前为embedding。 Images 将用户输入的文本转化成图片。 接口调用:ModelRouter.images.generate 参数说明: 表8 参数说明 参数名称 参数类型 是否必选 参数描述 prompt
在“上传文档”对话框,选择“交付方式”为“在线文档”,单击“创建文档”,进入文档编辑页面进行内容写作,文档内容将实时自动保存,创建在线文档成功。 如需更换文档交付方式,先删除此在线文档。删除文档后其全部内容将被清空,且内容将无法恢复,请谨慎操作。 (可选)如需更新在线文档,具体操作如下: 返回“
微调任务执行完成后,单击“操作”列的“发布”,发布模型。 步骤三:部署模型 部署模型是将模型部署为在线服务,通过创建部署服务实现,创建成功后,可以对在线服务可以进行预测和调用。本文需要为基座模型(原模型)和微调后的新模型分别创建模型服务。由于在线运行需消耗资源,请确保账户未欠费。 在AI原生应用引擎的左侧导航栏选择“模型中心
unt/s。 在线会话数量 该指标用于统计当前在线的session个数,该值为实时值,单位:Count。 活跃会话数量 该指标用于统计当前所有活跃工作状态下会话个数,该值为实时值,单位:Count。 在线会话率 该指标用于统计CN(分布式)/主DN(主备版)上的在线会话比例,该值为实时值,单位:%。
unt/s。 在线会话数量 该指标用于统计当前在线的session个数,该值为实时值,单位:Count。 活跃会话数量 该指标用于统计当前所有活跃工作状态下会话个数,该值为实时值,单位:Count。 在线会话率 该指标用于统计CN(分布式)/主DN(主备版)上的在线会话比例,该值为实时值,单位:%。
2.进入AI原生应用引擎,在左侧导航栏选择“知识中心 > 知识库”,可从页面知识库ID栏获取。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization
is_response_verify 否 Boolean 参数解释: 是否开启返回体内容审核(默认不开启)。 有文本内容,则对文本进行内容审核; 有图片内容,则会对图片进行内容审核。 约束限制: 不涉及。 取值范围: true或false 默认取值: false。 响应参数 状态码: 200 表7
纳管主机后运维中心默认不会纳管主机密码,不会对密码进行定时管理和修改。如需纳管主机密码请参见设置主机安全配置。 主机分配后会自动触发OS扫描任务,为主机绑定账号,如果OS扫描失败,可参考OS发现手动触发。 如果纳管主机所属的公有云账号和所在Region没有规划特权账号,纳管时会自动创建特权账号并
调用记录ID。 取值范围: 只由英文字母、数字以及“-”组成,且长度为36个字符。 version Number 参数解释: 工具的版本号。 取值范围: 正整数。 connector_id String 参数解释: 工具ID。 取值范围: 只由英文字母、数字以及“-”组成,且长度为36个字符。
I,但是该模型能力有限,只能作为问答模型,不能作为思考模型。首次使用该模型服务API需要订购免费的“ChatGLM3-6B大模型服务API在线调用”资源,订购后即可进行体验,订购操作请参见购买AppStage。 平台接入的第三方模型服务 开源模型Qwen系列、DeepSeek系列等。
我的Agent”,选择“我创建的”页签,选择列表操作列的“更多 > 修改”,在浏览器地址栏查看id。 约束限制: 不涉及。 取值范围: 由英文字母和数字组成,长度为32个字符。 默认取值: 不涉及。 attachment-code 是 String 参数解释: 附件码。此处请填写固定值:ai-file-box。
知识检索流ID。进入AI原生应用引擎,在左侧导航栏选择“知识中心 > 知识检索流”,在流列表中复制检索流ID。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
M3-6B服务、大模型调优服务API在线调用。 套餐包单价+按需计费(ChatGLM3-6B服务、大模型调优服务API在线调用) 知识库容量:50GB 智能应用运行时引擎(20实例):2个 ChatGLM3-6B服务、大模型调优服务API在线调用根据实际输入和输出tokens总量计费,计费规则请参考按需计费