检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
前提条件 登录用户为已实名认证的华为账号或华为云账号。 已购买AppStage并关联组织。 配置AI原生应用引擎/运维中心/运营中心服务授权 登录AppStage控制台。 在弹出的“服务授权”对话框,勾选需要授权的授权项,单击“同意授权”。
选择“微服务列表”页签,查看当前服务下的微服务信息,包括微服务名称、所属的服务名称、微服务实例数、调用数(微服务/中间件/一方接入地址/二方数据库/二方接入地址/三方接入地址)等, 在微服务列表上方选择微服务名称、输入集群名称,单击“查询”,可以筛选查看符合条件的微服务。
选择“微服务列表”页签,查看当前服务下的微服务信息,包括微服务名称、所属的服务名称、微服务实例数、调用数(微服务/中间件/一方接入地址/二方数据库/二方接入地址/三方接入地址)等, 在微服务列表上方选择微服务名称、输入集群名称,单击“查询”,可以筛选查看符合条件的微服务。
目前包含字符串、整数、布尔、浮点数、数组、对象。 字符串 整数 布尔 浮点数 数组 对象 值 否 用于指定该变量的值。 这是一句话 12345 true 3.1415 [1,2,3,4,5] {"key":"value"} 输出参数 该执行动作无输出参数。
如需使用WeLink通知,需要先配置对接华为云WeLink,配置后显示“发送WeLink通知”选项。 查看通知记录及结果 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
进入隔离逻辑门槛数 当实例的调用总次数达到该值时开始进入隔离逻辑门槛。 触发隔离连续出错数 当请求实例连续出错达到此阈值时触发实例隔离,如果配置了此项则覆盖实例故障百分比的配置,否则按照实例故障百分比触发隔离。 触发隔离错误百分比 实例故障隔离错误百分比。
Cpu核数 关闭动态资源开关后,可以手动修改Cpu核数。 内存 MB 关闭动态资源开关后,可以手动修改内存大小。 任务名称 默认显示该Judge任务的任务名称。 调度(固定时间) 设置任务执行时间。
进入隔离逻辑门槛数 当实例的调用总次数达到该值时开始进入隔离逻辑门槛。 触发隔离连续出错数 当请求实例连续出错达到此阈值时触发实例隔离,如果配置了此项则覆盖实例故障百分比的配置,否则按照实例故障百分比触发隔离。 触发隔离错误百分比 实例故障隔离错误百分比。
warehouse:选择warehouse类型后,可以基于数仓中创建的指标或视图配置图表。 Cluster 使用数据源选择需要使用的集群。 Database 选择数据存储的数据库。 数据源名称 选择数据表的表名。 数据源路径 数据表路径,可以不设置。
分区数 Topic的分区数默认为6个,不可修改。 副本数 每个Topic设置副本的数量,Kafka会自动在每个副本上备份数据,当其中一个Broker故障时数据依然是可用的,副本数越大可靠性越高。 该参数设置为1时,表示只有一份数据。 TTL(D) 设置数据存储时间,单位为天。
任务配置 资源池 选择执行任务的资源池,在下拉列表可以看到各资源池的可用卡数,根据实际情况选择。 单击“下一步”,分别参照表2和表3配置基础参数、LoRA参数。
mkdir -p /opt/huawei; chown -R appstage:appstage /opt/huawei chmod 666 /etc/hosts 允许用户appstage使用定时任务,并启动一个随机数生成服务以增强系统的随机性。
mkdir -p /opt/huawei; chown -R appstage:appstage /opt/huawei chmod 666 /etc/hosts 允许用户appstage使用定时任务,并启动一个随机数生成服务以增强系统的随机性。
测试质量看板 测试质量看板展示了用例库和测试计划对应的需求覆盖率、缺陷数、用例通过率、用例完成率图表,以及用例通过率、用例关联的缺陷等详细信息。 请参见测试质量看板。
表2 推理模型参数配置说明 参数名称 参数说明 最大token数 影响推理返回内容的最大长度,取值范围:1-10000。 温度 影响结果的随机性,取值越大,随机性越高,取值范围:0-2.0。 多样性 影响结果的多样性,取值越大,结果的多样性越强,取值范围:0-1.0。
prometheus-adapter 20m 200m 20Mi 200Mi dhac-controller 1 dhac-controller 30m 200m 30Mi 500Mi kube-rbac-proxy 30m 100m 30Mi 100Mi dhac-agent 节点数
输出最大token数 表示模型输出的最大长度。 温度 较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。建议该参数和“多样性”(top_p)只设置1个。 多样性 影响输出文本的多样性,取值越大,生成文本的多样性越强。
输入加输出最大token数 否 表示模型输入加输出的最大长度。 存在惩罚 否 介于-2.0和2.0之间的数字。正值会尽量避免重复已经使用过的词语,更倾向于生成新词语。 温度 否 较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。建议该参数和“多样性”只设置1个。
表2 编辑页面内容说明 编辑页面内容 说明 配置数仓图表 可以按照在指标仓库中创建的指标或者视图进行创建。 配置图表数据及类型等参数。 配置图表 可以选择告警图表“_alertlist-_alert”或者其他已创建的图表。
分批执行 作业类型选择虚拟机时,可以选择是否分批执行,如勾选,还需要设置每次下发的数量或百分数,并且支持选择失败后暂停确认。 作业描述 输入作业描述。 超时时间 输入可超时时间。 默认为300,单位秒,最大支持9007199254740991秒。