检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
很抱歉,您的请求当前已达最大并发数,请稍后重试! 很抱歉,您的请求当前已达最大并发数,请稍后重试! 429 AIAE.31005004 The third model service overload error, please try again later!
很抱歉,您的请求当前已达最大并发数,请稍后重试! 很抱歉,您的请求当前已达最大并发数,请稍后重试! 429 AIAE.31005004 The third model service overload error, please try again later!
使用华为账号登录华为云,进入“账号中心 > 基本信息”查看的账号名。 说明: 当华为账号与账号名不匹配,需重新输入。 手机号 成员的手机号码。非必填项,当邮箱地址未填写时手机号必须填写。
分批执行 作业类型选择虚拟机时,可以选择是否分批执行,如勾选,还需要设置每次下发的数量或百分数,并且支持选择失败后暂停确认。 作业描述 输入作业描述。 超时时间 输入可超时时间。 默认为300,单位秒,最大支持9007199254740991秒。
输出最大token数 表示模型输出的最大token数。 温度 简称temperature,较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。建议该参数和“多样性”(top_p)只设置1个。 多样性 简称top_p,影响输出文本的多样性,取值越大,生成文本的多样性越强。
即如果购买了215个应用实例,则组织内所有的服务可以创建的汇聚任务数为108个。 一个组织汇聚任务每天的运行时长上限=汇聚任务数量*10分钟。 实际汇聚任务时长为组织下所有汇聚任务(每个汇聚任务单次执行时长*每天执行次数)之和。
已购买并配置相应的华为云资源,如ECS、VPN、OBS等。 创建采集指标模板 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)” 选择左侧导航栏的“运维数据开发 > 数据开发”,进入“数据开发”页面。
最小连接数:根据服务器的连接数,向连接数最少的服务器优先转发。 自定义参数哈希 负载均衡策略选择为“自定义参数哈希”时,配置此参数。 字符长度0~50,以$符开头,可以由字母、数字、点、下划线、短横线组成,不能包含其他特殊字符,例:$http_x_forwarded_for。
最小连接数:根据服务器的连接数,向连接数最少的服务器优先转发。 自定义参数哈希 负载均衡策略选择为“自定义参数哈希”时,配置此参数。 字符长度0~50,以$符开头,可以由字母、数字、点、下划线、短横线组成,不能包含其他特殊字符,例:$http_x_forwarded_for。
勾选后还需要设置每次下发的数量或百分数,并且支持选择失败后暂停确认。 脚本参数 输入脚本参数。 超时时间 输入可超时时间。 默认为300,单位秒,最大支持9007199254740991秒。
栅格占据的列数:组件所占列数。可以手动输入,也可以单击+/-调节。取值范围为1~12,缺省值为12。 特有属性 跳转地址:填写需要跳转的链接。 打开方式:根据需求设置链接的打开方式。 千位分割:根据需求开启数字的分隔符。 :表示关闭。 :表示开启。
表3 推理模型参数配置说明 参数名称 参数说明 最大token数 影响推理返回内容的最大长度,取值范围:1-10000。 温度 影响结果的随机性,取值越大,随机性越高,取值范围:0-2.0。 多样性 影响结果的多样性,取值越大,结果的多样性越强,取值范围:0-1.0。
取值范围: 枚举值: TRUNCATE_MODE(如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。 SMART_MODE(如果分片的token长度超过向量化模型的token数,则自动对超长部分进行截断处理)。
"defect_index": 1, #DI值 "normal_num": 3, #一般问题数 "serious_num": 2, #严重问题数 "tip_num
输出最大token数 简称max_tokens,表示模型输出的最大长度。 温度 简称temperature,较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。建议该参数和“多样性”(top_p)只设置1个。
successRateAlarmAbsThreshold 成功率告警阈值绝对值,非负浮点数,取值为0到100,默认值为90。
输出最大token数:简称max_tokens,表示模型输出最大token数。 温度:简称temperature,较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。建议该参数和“多样性”(top_p)只设置1个。
OBS接入:数据文件存放在华为云OBS桶,从OBS桶接入数据。 说明: 仅支持使用区域位置为北京四的OBS桶接入数据。 数据文件 当“数据来源”选择“本地上传”时,需配置此参数。 单击“文件上传”选择本地文件进行上传,支持上传的文件类型请参考“数据类型”参数说明。
分摊开启:所有流控配置的统计粒度,会针对SLB实例中的节点的数量进行分摊,SLB节点变化时,每个SLB节点的流控门限值为配置值/SLB节点数,适用于slb节点变化,后端的请求量不变化的场景。单个节点流控门限值 = 配置值/节点数 (向上取值:例如12/5=3)。
分摊开启:所有流控配置的统计粒度,会针对SLB实例中的节点的数量进行分摊,SLB节点变化时,每个SLB节点的流控门限值为配置值/SLB节点数,适用于slb节点变化,后端的请求量不变化的场景。单个节点流控门限值 = 配置值/节点数 (向上取值:例如12/5=3)。