检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
必须开启此参数。 --served-model-name:vllm服务后台id。 可在run_vllm.sh增加如下环境变量开启高阶配置: export DEFER_DECODE=1 # 是否使用推理与Token解码并行;默认值为1表示开启并行,取值为0表示关闭并行。开启该功能
huaweicloud.com/home中,搜索pypi ,也可以查看“pip.conf”文件内容。 下载“torch*.whl ”文件。 在网站“https://download.pytorch.org/whl/torch_stable.html”搜索并下载如下whl文件。 torch-1
--use-spec-decode:是否使用投机推理进行输出统计,不输入默认为false。当使用投机推理时必须开启,否则会导致输出token数量统计不正确。注:由于投机推理的性能测试使用随机输入意义不大,建议开启--dataset-type、--dataset-path,并选择性开启--use-re
pip源中不存在该包,当前默认pip源为pypi.org中的包,请在pypi.org中查看是否有对应版本的包并查看包安装限制。 下载的包与对应基础镜像架构不匹配,如arm系统下载了x86的包,python2版本的pip下载了python3的包。具体基础镜像运行环境请参见推理基础镜像列表。 安装pip包有先后依赖关系。
huaweicloud.com/home中,搜索pypi ,也可以查看“pip.conf”文件内容。 下载“torch*.whl ”文件。 在网站“https://download.pytorch.org/whl/torch_stable.html”搜索并下载如下whl文件。 torch-1
如后处理的超分模型)。 - Lora/TextInversion 是否有动态加载Lora的需求,可否接受把Lora固定到模型内。 是否使用了TextInversion,是否需要动态加载。 - 动态shape 是否可接受分档shape(固定n个挡位的shape)。 - 模型变更频率
sh demo.sh localhost 1 0 PROF_SAVE_PATH:Profiling录制结果存放路径 DO_PROFILER:是否开启Profiling录制功能 父主题: 训练脚本说明
sh demo.sh localhost 1 0 PROF_SAVE_PATH:Profiling录制结果存放路径 DO_PROFILER:是否开启Profiling录制功能 父主题: 训练脚本说明
sh demo.sh localhost 1 0 PROF_SAVE_PATH:Profiling录制结果存放路径 DO_PROFILER:是否开启Profiling录制功能 父主题: 训练脚本说明
设置单节点为高可用冗余节点 开启高可用冗余 挑选无业务节点作为高可用冗余节点使用,在资源池详情页,“节点”页签下,在想要开启高可用冗余的节点操作列,单击“更多 > 开启高可用冗余”,设置成功后,该节点高可用冗余列标签变为“启用”。 如果想批量设置节点开启高可用冗余,可勾选多个节点后
如果使用他人共享的镜像,需要开启镜像复制功能,否则会导致创建模型失败。 “健康检查” 用于指定模型的健康检查。仅当自定义镜像中配置了健康检查接口,才能配置“健康检查”,否则会导致模型创建失败。当前支持以下三种探针: 启动探针:用于检测应用实例是否已经启动。如果提供了启动探针(startup
ager.service会优先读取网卡配置文件中的IP设置为主机IP, 此时无论DH Cient是否关闭,服务器都可以获取分配IP。 当服务器没有网卡配置文件时,DH Client开启,此时服务器会分配私有IP。如果关闭DH Client,则服务器无法获取私有IP。 图2 查看NetworkManager配置
填写Notebook基本信息,包含名称、描述、是否自动停止,详细参数请参见表1。 表1 基本信息的参数描述 参数名称 说明 “名称” Notebook的名称。只能包含数字、大小写字母、下划线和中划线,长度不能大于64位且不能为空。 “描述” 对Notebook的简要描述。 “自动停止” 默认开启,且默认值为“1
sh demo.sh localhost 1 0 PROF_SAVE_PATH:Profiling录制结果存放路径 PROF_ENABLE:是否开启Profiling录制功能 父主题: 训练脚本说明
sh demo.sh localhost 1 0 PROF_SAVE_PATH:Profiling录制结果存放路径 DO_PROFILER:是否开启Profiling录制功能 父主题: 训练脚本说明
表7 预检相关环境变量 变量名 说明 示例 MA_SKIP_IMAGE_DETECT ModelArts预检是否开启。默认为1,1表示开启预检,0表示关闭预检。 推荐开启预检,预检可提前发现节点故障、驱动故障。 “1” 表8 卡死检测相关环境变量 变量名 说明 示例 MA_HANG_DETECT_TIME
模型更加随机。0表示贪婪采样。 stream 否 False Bool 是否开启流式推理。默认为False,表示不开启流式推理。 ignore_eos 否 False Bool ignore_eos表示是否忽略EOS并且继续生成token。 repetition_penalty 否
填写Notebook基本信息,包含名称、描述、是否自动停止,详细参数请参见表1。 表1 基本信息的参数描述 参数名称 说明 “名称” Notebook的名称。只能包含数字、大小写字母、下划线和中划线,长度不能大于64位且不能为空。 “描述” 对Notebook的简要描述。 “自动停止” 默认开启,且默认值为“1
如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install -y docker-engine.aarch64
故障。如果界面错误提示不包含此信息,则是因为后台服务故障导致,建议联系华为云技术支持。 检查当前账号是否具备OBS权限。 如果当前账号是个IAM用户(即子账号),需确认当前账号是否具备OBS服务操作权限。 请参考OBS权限管理,为当前IAM用户配置“作用范围”为“全局级服务”的“Tenant