检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
名称由1~60个中文、英文、数字及合法字符组成。 设置组织的域名。 域名是指网址 (如www.example.com) 中“www.”之后的内容,以及电子邮件地址 (如《用户名》@example.com)中“@”符号之后的内容。 域名设置后组织管理员为组织创建成员时,创建的成员账号默认带有域名后缀,如设置的组织域名为abc
AppStage开发中心知识库是面向开发团队的知识管理系统,支持知识全生命周期管理,帮助您完成智能、安全的知识作业,提供层级式的目录树、多人在线协同编辑等功能。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。
名称由1~60个中文、英文、数字及合法字符组成。 设置组织的域名。 域名是指网址 (如www.example.com) 中“www.”之后的内容,以及电子邮件地址 (如《用户名》@example.com)中“@”符号之后的内容。 域名设置后组织管理员为组织创建成员时,创建的成员账号默认带有域名后缀,如设置的组织域名为abc
接收报文丢包率:该指标用于监控周期内统计接收报文中丢失报文数量与全部接收报文比值。 发送报文错误率:该指标用于监控周期内统计发送报文中错误报文数量与全部发送报文比值。 发送报文丢包率:该指标用于监控周期内统计发送报文中丢失报文数量与全部发送报文比值。 连接数使用率 该指标用于统计当前已用的TaurusDB连接数占最大连接数的百分比。
接收报文丢包率:该指标用于监控周期内统计接收报文中丢失报文数量与全部接收报文比值。 发送报文错误率:该指标用于监控周期内统计发送报文中错误报文数量与全部发送报文比值。 发送报文丢包率:该指标用于监控周期内统计发送报文中丢失报文数量与全部发送报文比值。 连接数使用率 该指标用于统计当前已用的TaurusDB连接数占最大连接数的百分比。
某微服务有多个业务来接入,为了认证接入业务的身份,微服务会给业务分配不同的认证凭据,用于认证。为了把认证凭据授权给业务A、B、C,需要将认证凭据明文发送给业务A、B、C的开发人员,从而两边持有相同的认证凭据。本章介绍如何通过管理台查询认证凭据。 查询认证凭据 进入AppStage运维中心。
某微服务有多个业务来接入,为了认证接入业务的身份,微服务会给业务分配不同的认证凭据,用于认证。为了把认证凭据授权给业务A、B、C,需要将认证凭据明文发送给业务A、B、C的开发人员,从而两边持有相同的认证凭据。本章介绍如何通过管理台查询认证凭据。 查询认证凭据 进入AppStage运维中心。
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于文本对话接口,如果调用后返回状态码为“200”,则表示请求成功。 响应消息头 对应请求消息头,响
创建告警修复规则 告警修复是设置特定的命中条件,告警在发送通知之前将会进行预置的修复脚本,修复操作,自动帮助您修复简单的告警。 告警修复的触发场景如下: 告警上报时,满足现存的告警修复规则。 告警进入系统时满足告警屏蔽的规则,根据告警屏蔽规则的配置决定是否执行告警修复。 告警列表中对告警进行清除操作。
仅适用于使用“上传卡片”方式新建的卡片。 编辑卡片 卡片形式:在需要编辑的卡片上,单击“编辑”。 列表形式:在对应的“操作”列下,单击“编辑”。 说明: 适用于使用“在线构建”、“模板构建”方式新建的卡片。 查看卡片详情 卡片形式:单击“更多 > 详情”,可以查看卡片详情。 列表形式:在对应的“版本号”列下,单击版本号。
计费项说明 适用的计费模式 计费公式 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持。 按需计费 千tokens * 每千tokens单价 大模型微调服务API在线调用-SFT局部调优 根据实际输入和输出tokens总量计费,平台提供算力支持。
弹出卡片:选择相应卡片,与主体卡片产生弹出交互效果。选择卡片时支持搜索选择。 弹窗宽高:设置弹窗尺寸。 下钻: 局部事件:请选择已设置发送消息event1的卡片,否则不会生效。 发送消息event1在“屏幕模板 > 消息联动 > 自定义事件”进行设置。 当开启局部事件时,可设置多个下钻屏幕。 当值
新建及管理我的卡片 新建卡片分类为卡片分组 使用在线构建方式新建卡片 使用模板构建方式新建卡片 使用离线构建方式新建卡片 管理我的卡片 父主题: 在运营中心自定义运营看板
信息,参数如表2所示。 表2 执行动作基本信息参数说明 参数 说明 名称 执行动作是需要完成的特定任务,自定义执行动作的名称,比如,“发送电子邮件”。“更新行”。 长度不能超过64个字符,可包含中文、大小写字母、数字及下划线、中划线、英文小括号,不能以下划线、中划线、英文小括号开头。
卡片本身默认的字段,不可修改。 发送消息事件 卡片做消息联动的发送方需要配置发送消息事件event1。 事件列表:选择默认event1。 绑定值:填写需要联动的参数字段。 例如,绑定值为name,那么接收卡片需要在“接收消息”中添加参数name0,发送卡片的发送数据会发送给接收卡片中rece
营中心指标增量包-100个指标 预置模型服务调用 API SaaS:ChatGLM3-6B大模型服务API在线调用 自定义模型训练 API SaaS:大模型微调服务API在线调用-SFT局部调优 说明: 按需仅适用于AppStage的AI原生应用引擎。 变更计费模式 不支持。 不支持。
义屏幕构建。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请的操作请参见权限管理。 已创建我的卡片,具体请参见使用在线构建方式新建卡片、使用模板构建方式新建卡片、使用离线构建方式新建卡片。 新建屏幕模板 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心。
负载均衡”。 选择左侧导航栏的“监听管理”。 在监听管理页面,单击监听名称。 在监听详情页面选择“后端服务器”页签,检查该后端服务器集群中的节点是否都在线,如果都下线会报此错误。 父主题: SLB同步异常相关问题
此节点用于向遍历到的每一个手机号发送短信。 在“遍历集合元素”节点下单击“ > 添加执行动作”,在“工具节点”页签中选择“华为短信”,执行动作选择为“发送短信”。 配置输入参数,收件人选择为编辑集合元素节点的循环内容,短信内容选择为chat节点的对话内容(输出)。 图7 发送短信节点配置 添加“结束节点”。