检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
范围为0~5整数。 is_devserver: 是否DevServer部署方式,True表示DevServer模式。False表示ModelArts Standard模式。 model_name:评测模型名称,llama2。 deploy_method:部署方法,不同的部署方式a
范围为0~5整数。 is_devserver: 是否DevServer部署方式,True表示DevServer模式。False表示ModelArts Standard模式。 vllm_model:对应Step4 部署并启动推理服务中的模型地址参数model,模型格式是Huggingface的目录格式。
自动停止,即1小时后停止规格资源计费。 开启自动停止功能后,可选择“1小时”、“2小时”、“4小时”、“6小时”或“自定义”几种模式。选择“自定义”模式时,可指定1~24小时范围内任意整数。 填写Notebook详细参数,如镜像、资源规格等。 镜像:在“自定义镜像”页签选择已上传的自定义镜像。
阅”即可完成工作流的订阅。订阅过的工作流会显示“已订阅”。 运行工作流 订阅完成后,单击“运行”进入ModelArts控制台配置页面。选择资产版本、Workflow名称、云服务区域以及工作空间参数后,单击“导入”。 图3 从AI Gallery导入工作流 工作流运行的云服务区域需
确保服务持久稳定运行,提升运维效率。 计费模式 选择“按需计费”或“包年/包月”模式。 包年/包月 包年/包月是预付费模式,按订单的购买周期计费,适用于可预估资源使用周期的场景,价格比按需计费模式更优惠。 按需计费 按需计费是后付费模式,按云服务器的实际使用时长计费,可以随时开通/删除云服务器。
自动停止,即1小时后停止规格资源计费。 开启自动停止功能后,可选择“1小时”、“2小时”、“4小时”、“6小时”或“自定义”几种模式。选择“自定义”模式时,可指定1~24小时范围内任意整数。 填写Notebook详细参数,如镜像、资源规格等。 镜像:在“自定义镜像”页签选择已上传的自定义镜像。
选择“ModelArts Lite”。 计费模式 - 选择“按需计费”或“包年/包月”模式。 包年/包月 包年/包月是预付费模式,按订单的购买周期计费,适用于可预估资源使用周期的场景,价格比按需计费模式更优惠。 按需计费 按需计费是后付费模式,按云服务器的实际使用时长计费,可以随时开通/删除云服务器。
增强的数据处理任务时,不收费。 但是存储到OBS中的数据会收取费用。具体内容如表1所示。 表1 存储计费项 计费项 计费项说明 适用的计费模式 计费公式 存储资源 对象存储OBS 用于存储训练和推理的输入数据和输出结果数据。具体费用可参见对象存储价格详情。 注意: 存储到OBS中
2、若量化Deepseek-v2-236b模型,大致需要10+小时。 使用量化模型 使用量化模型需要在NPU的机器上运行。 启动vLLM前,请开启图模式(参考步骤六 启动推理服务中的配置环境变量),启动服务的命令和启动非量化模型一致。 父主题: 推理模型量化
算法的代码目录下载到训练容器内的本地路径。规则如下: 必须为/home下的目录; v1兼容模式下,当前字段不生效; 当code_dir以file://为前缀时,当前字段不生效。 working_dir String 运行算法时所在的工作目录。规则:v1兼容模式下,当前字段不生效。 environments Array
算法的代码目录下载到训练容器内的本地路径。规则如下: 必须为/home下的目录; v1兼容模式下,当前字段不生效; 当code_dir以file://为前缀时,当前字段不生效。 working_dir String 运行算法时所在的工作目录。规则:v1兼容模式下,当前字段不生效。 environments Array
算法的代码目录下载到训练容器内的本地路径。规则如下: 必须为/home下的目录; v1兼容模式下,当前字段不生效; 当code_dir以file://为前缀时,当前字段不生效。 working_dir String 运行算法时所在的工作目录。规则:v1兼容模式下,当前字段不生效。 environments Array
USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式;默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型,必须开启此配置,否则精度会异常;其他模型不建议开启,因为性能会有损失。 若要开启图模式,请配置以下4个环境变量,并且启动服务时不要添加enforce-eager参数。
USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式;默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型,必须开启此配置,否则精度会异常;其他模型不建议开启,因为性能会有损失。 若要开启图模式,请配置以下4个环境变量,并且启动服务时不要添加enforce-eager参数。
使用正确的工具和设备:确保您使用正确的工具和设备,并且它们得到了正确的维护和保养。\n\n4.个人防护装备:确保您和您的同事穿戴正确的个人防护装备,如安全鞋、透明眼镜或面罩、手套等。\n\n5.创建一个安全文化:鼓励个人对安全的责任感和意识,并创建一个安全文化,使人们始终关注自己和他人的安全。\n\n6
使用正确的工具和设备:确保您使用正确的工具和设备,并且它们得到了正确的维护和保养。\n\n4.个人防护装备:确保您和您的同事穿戴正确的个人防护装备,如安全鞋、透明眼镜或面罩、手套等。\n\n5.创建一个安全文化:鼓励个人对安全的责任感和意识,并创建一个安全文化,使人们始终关注自己和他人的安全。\n\n6
使用正确的工具和设备:确保您使用正确的工具和设备,并且它们得到了正确的维护和保养。\n\n4.个人防护装备:确保您和您的同事穿戴正确的个人防护装备,如安全鞋、透明眼镜或面罩、手套等。\n\n5.创建一个安全文化:鼓励个人对安全的责任感和意识,并创建一个安全文化,使人们始终关注自己和他人的安全。\n\n6
“计算节点个数” 设置当前版本AI应用的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 “环境变量” 设置环境变量,注入环境变量到容器实例。为确保您的数据安全,在环境变量中,请勿输入敏感信息,如明文密码。
自定义镜像中不能包含恶意代码。 创建AI应用的自定义镜像大小不超过50GB。 对于同步请求模式的AI应用,如果预测请求时延超过60s,会造成请求失败,甚至会有服务业务中断的风险,预测请求时延超过60s时,建议制作异步请求模式的AI应用。 自定义镜像的配置规范 镜像对外接口 设置镜像的对外服务接口,推理接口需与config
Lite”。创建“ModelArts Lite”相关资料请见《ModelArts Lite Cluster用户指南》。该参数仅在贵阳一区域显示。 计费模式 - 选择计费模式,“包年/包月”或“按需计费”。 资源池类型 - 可选物理资源池和逻辑资源池。逻辑资源池与规格有关,如果无逻辑规格则不显示逻辑资源池。