检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理批量推理作业 查看批量服务详情 查看批量服务的事件 管理批量服务生命周期 修改批量服务配置 父主题: 使用ModelArts Standard部署模型并推理预测
config结构 参数 参数类型 描述 model_id String 模型ID。“model_id”可以通过查询模型列表或者ModelArts管理控制台获取。 model_name String 模型名称。 model_version String 模型版本。 source_type
已部署为在线服务的初始化。 部署在线服务predictor。 部署批量服务transformer。 部署服务返回服务对象Predictor,其属性包括服务管理章节下的所有功能。 示例代码 在ModelArts notebook平台,Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。
状态码 状态码 描述 200 OK 401 Unauthorized 403 Forbidden 错误码 请参见错误码。 父主题: APP认证管理
1585809231902, "is_free" : false } 状态码 状态码 描述 200 服务详情 错误码 请参见错误码。 父主题: 服务管理
操作资源的权限,ModelArts提供了工作空间功能,管理员可以根据工作空间,隔离不同子用户操作工作空间内资源的权限。工作空间迁移包括资源池迁移和网络迁移,具体方法可见下文说明。 资源池工作空间迁移 登录ModelArts管理控制台,选择“AI专属资源池 > 弹性集群Cluste
--generate-scale:体现此参数表示会生成量化系数,生成后的系数保存在--scale-output参数指定的路径下。如果有指定的量化系数,则不需此参数,直接读取--scale-input参数指定的量化系数输入路径即可。 --dataset-path:数据集路径,推荐使用:https://huggingface
--generate-scale:体现此参数表示会生成量化系数,生成后的系数保存在--scale-output参数指定的路径下。如果有指定的量化系数,则不需此参数,直接读取--scale-input参数指定的量化系数输入路径即可。 --dataset-path:数据集路径,推荐使用:https://huggingface
--generate-scale:体现此参数表示会生成量化系数,生成后的系数保存在--scale-output参数指定的路径下。如果有指定的量化系数,则不需此参数,直接读取--scale-input参数指定的量化系数输入路径即可。 --dataset-path:数据集路径,推荐使用:https://huggingface
--generate-scale:体现此参数表示会生成量化系数,生成后的系数保存在--scale-output参数指定的路径下。如果有指定的量化系数,则不需此参数,直接读取--scale-input参数指定的量化系数输入路径即可。 --dataset-path:数据集路径,推荐使用:https://huggingface
json中加入"do_sample": true,具体如图所示。 Yi模型 在使用Yi模型的chat版本时,由于transformer 4.38版本的bug,导致在读取tokenizer文件时,加载的vocab_size出现类似如下尺寸不匹配的问题。 RuntimeError: Error(s) in loading
json中加入"do_sample": true,具体如图所示。 Yi模型 在使用Yi模型的chat版本时,由于transformer 4.38版本的bug,导致在读取tokenizer文件时,加载的vocab_size出现类似如下尺寸不匹配的问题。 RuntimeError: Error(s) in loading
json中加入"do_sample": true,具体如图所示。 Yi模型 在使用Yi模型的chat版本时,由于transformer 4.38版本的bug,导致在读取tokenizer文件时,加载的vocab_size出现类似如下尺寸不匹配的问题。 RuntimeError: Error(s) in loading
服务内的推理路径,默认为"/"。 表2 predict返回参数说明 参数 描述 返回消息体 输出的参数和值,平台只做转发,不做识别。 父主题: 服务管理
参数 是否必选 参数类型 描述 model_id 是 String 模型ID。“model_id”可以通过查询模型列表或者ModelArts管理控制台获取。 weight 是 Integer 权重百分比,分配到此模型的流量权重,仅当infer_type为real-time时需要配置
Request 401 Unauthorized 403 Forbidden 404 Not Found 错误码 请参见错误码。 父主题: 授权管理
"true"(MindStudio Insight训练应用程序)。 表4 JobAlgorithm 参数 是否必选 参数类型 描述 id 否 String 算法管理的算法id。 name 否 String 算法名称。无需填写。 subscription_id 否 String 订阅算法的订阅ID。应与
10 } ] } } 状态码 状态码 描述 200 OK。 404 Not Found。 错误码 请参见错误码。 父主题: 配额管理
模型描述信息。 source_type String 模型来源的类型,仅当模型为自动学习部署过来时有值,取值为“auto”。 父主题: 模型管理
204 添加标签成功。 400 参数非法。 401 鉴权失败。 403 权限不足。 404 资源未找到。 错误码 请参见错误码。 父主题: 服务管理