检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
知识检索流ID。进入AI原生应用引擎,在左侧导航栏选择“知识中心 > 知识检索流”,在流列表中复制检索流ID。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization
流ID,进入AI原生应用引擎,在左侧导航栏选择“Agent编排中心 > 我的工作流”,在流列表中复制流ID。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization
生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。 按需计费资源 对于按需计费模式的资源,例如按需计费的大模型微调服务API在线调用-SFT局部调优,如果不再使用这些资源且需停止计费,请删除相应资源。 退订包年包月资源以停止计费 登录AppStage控制台,默认进入AppStage控制台“总览”页。
知识库”,选择页面右上角的“... > 知识数据集”,在数据集列表中,单击数据集名称,进入详情页即可获取数据集id。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization
PromptTemplate 负责提示语模板的构建和初始化等。 4 KnowledgeRetriever 提供了知识库检索的能力,可以检索开发者的知识库,提取相关的信息。 5 ApplicationCenter 提供了开发者调用部署在平台的应用的能力。 父主题: AI原生应用引擎SDK API
chunk_config:表示如何对文本进行切分。 extraction_config:表明要对切片做提取操作,切片提取出的字段可以在索引配置中使用。 index_config:索引配置,其中retrieval_configs配置完整切片内容,以及提取出的字段内容,在知识库检索时如何使用。 记录下接口返回的内容,该内容为知识数据集id。
基于数仓配置图表 配置warehouse类型数据源后,可以基于数仓中创建的指标或视图配置图表,本章节介绍如何配置数仓图表。 前提条件 已创建指标或创建视图。 已新增业务报表页面。 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 配置数仓图表 进入报表开发页面。
业务写账号(增删改查),默认权限为SELECT、INSERT、DELETE、UPDATE。 业务读账号(只读),默认权限为SELECT。 账号名称 自定义账号名称。 以英文字母开头,只能输入大小写字母、数字、“_”,长度1~16。 显示账号密码 开启后,账号创建完成后,会显示账号密码。 账号插件 TaurusDB和RDS
业务写账号(增删改查),默认权限为SELECT、INSERT、DELETE、UPDATE。 业务读账号(只读),默认权限为SELECT。 账号名称 自定义账号名称。 以英文字母开头,只能输入大小写字母、数字、“_”,长度1~16。 显示账号密码 开启后,账号创建完成后,会显示账号密码。 账号插件 TaurusDB和RDS
知识库”,选择页面右上角的“... > 知识数据集”,在数据集列表中,单击数据集名称,进入详情页即可获取数据集id。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization
平台提供了对应的模型服务API,但是该模型能力有限,只能作为问答模型,不能作为思考模型,首次使用该模型服务API需要订购免费的“ChatGLM3-6B大模型服务API在线调用”资源,订购后即可进行调测/体验、调用,订购操作请参见购买AppStage。 开源模型bge-reranker-large、bge-large-zh-v1
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
输入的指标英文名称作为开放名称。 在多指标group by场景,查询的返回结果中,使用开放名称作为指标的属性值;报表开发过程中使用该属性来提取查询结果。 指标类型 选择指标类型。 RequestCount:请求量。 DelayTime:时延。 SuccessRate:成功率。 FailureRate:失败率。
义屏幕构建。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请的操作请参见权限管理。 已创建我的卡片,具体请参见使用在线构建方式新建卡片、使用模板构建方式新建卡片、使用离线构建方式新建卡片。 新建屏幕模板 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心。
代码仓管理是开发中心集成代码托管(CodeArts Repo)服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 本章节介绍如何使用开发中心集成的CodeArts
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
代码仓管理是开发中心集成代码托管CodeArts Repo服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 关于代码仓管理的常见问题请参见代码托管(CodeArts
输入的指标英文名称作为开放名称。 在多指标group by场景,查询的返回结果中,使用开放名称作为指标的属性值;报表开发过程中使用该属性来提取查询结果。 指标类型 选择指标类型。 RequestCount:请求量。 DelayTime:时延。 SuccessRate:成功率。 FailureRate:失败率。
仅适用于使用“上传卡片”方式新建的卡片。 编辑卡片 卡片形式:在需要编辑的卡片上,单击“编辑”。 列表形式:在对应的“操作”列下,单击“编辑”。 适用于使用“在线构建”、“模板构建”方式新建的卡片。 查看卡片详情 卡片形式:单击“更多 > 详情”,可以查看卡片详情。 列表形式:在对应的“版本号”列下,单击版本号。
本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。