搜索_华为云

投机推理使用说明 - AI开发平台ModelArts

\ #投机小模型使用的卡数，通常设置为1 --tensor-parallel-size=1 \ --host 0.0.0.0 \ --port 9999 \ --dtype auto \ --gpu-memory-utilization=0.9 \ --served-model-name

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
修改工作空间配额 - AI开发平台ModelArts

是 Integer 要修改的配额值。配额值为正整数或-1，-1代表不限制配额。配额值范围不能超过配额的最大值与最小值。可通过调用查询工作空间配额接口查询配额的最大值。响应参数状态码：200 表5 响应Body参数参数参数类型描述 quotas Array of Work

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
投机推理使用说明 - AI开发平台ModelArts

\ #投机小模型使用的卡数，通常设置为1 --tensor-parallel-size=1 \ --host 0.0.0.0 \ --port 9999 \ --dtype auto \ --gpu-memory-utilization=0.9 \ --served-model-name

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 投机推理
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

source /usr/local/Ascend/ascend-toolkit/set_env.sh && python main.py --port 30027 --listen 0.0.0.0 --force-fp16 基于dockerfile进行build docker build

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
配置Workflow的输入输出目录 - AI开发平台ModelArts

输出目录管理：开发者在编辑开发工作流时可以对所有的输出路径做统一管理，用户无需手动创建输出目录，只需要在工作流运行前配置存储根路径，并且可以根据开发者的目录编排规则在指定目录下查看输出的数据信息。此外同一个工作流的多次运行支持输出到不同的目录下，对不同的执行做了很好的数据隔离。常用方式 InputStorage（路径拼接）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
使用SmoothQuant量化 - AI开发平台ModelArts

=0,1 通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡，若希望使用第一和第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图1 查询结果执行权重转换。 cd autosmoothquant/examples/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

=0,1 通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡，如果希望使用第一和第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图1 查询结果执行权重转换。 cd autosmoothquant/examples/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
AIGC工具tailor使用指导 - AI开发平台ModelArts

h) 查询onnx模型的输入信息。 # 查询onnx模型的输入信息 t.get_model_input_info() 图1 查询onnx模型的输入输出信息查询onnx模型的输出信息。 # 查询模型的输出信息 t.get_model_output_info() 图2 查询onnx模型的输出信息

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
授权API至APP - AI开发平台ModelArts

String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表4 Apps 参数是否必选参数类型描述 app_id 否 String APP的编号，可通过查询APP列表获取。响应参数状态码：200

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建训练作业参数 - AI开发平台ModelArts

对训练作业的描述，默认为空，字符串的长度限制为[0，256]。 worker_server_num 是 Integer 训练作业worker的个数，最大值请从查询作业资源规格接口获取。 app_url 是 String 训练作业的代码目录。如：“/usr/app/”。应与boot_file_url一

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
获取某个超参敏感度分析图像的路径 - AI开发平台ModelArts

是 String 训练作业ID。获取方法请参见查询训练作业列表。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 file_path String 超参敏感度分析图像的保存路径。请求示例如下查询training_job_id为e346206

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
调用MaaS部署的模型服务 - AI开发平台ModelArts

在“API Key管理”页面，单击“创建API Key”，填写描述信息后，单击“确认”会返回“您的密钥”，请复制保存密钥，单击“关闭”后将无法再次查看密钥。最多支持创建5个密钥，密钥只会在新建后显示一次，请妥善保存。当密钥丢失将无法找回，请新建API Key获取新的访问密钥。步骤二：调用MaaS模型服务进行预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

C-6.3.911-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.911 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
注册API并授权给APP - AI开发平台ModelArts

String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表4 Apps 参数是否必选参数类型描述 app_id 否 String APP的编号，可通过查询APP列表获取。响应参数状态码：200

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
Open-Sora 1.0基于Lite Server适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
删除模型 - AI开发平台ModelArts
删除模型 - AI开发平台ModelArts

Model(session, model_id="your_model_id") model_instance.delete_model() 方式2：根据查询模型对象列表返回的模型对象进行模型删除 1 2 3 4 5 6 7 from modelarts.session import Session

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
更新API授权 - AI开发平台ModelArts

String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表4 Apps 参数是否必选参数类型描述 app_id 否 String APP的编号，可通过查询APP列表获取。响应参数状态码：200

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

“策略内容”：允许，云服务中搜索“SFSTurbo”服务并选中，“操作”中查找只读操作“sfsturbo:shares:showShareNic”、“sfsturbo:shares:listShareNics”并选中，查找写操作“sfsturbo:shares:addShareNic”、

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
更新训练作业参数 - AI开发平台ModelArts

对训练作业的描述，默认为空，字符串的长度限制为[0，256]。 worker_server_num 是 Integer 训练作业worker的个数，最大值请从查询作业资源规格接口获取。 app_url 是 String 训练作业的代码目录。如：“/usr/app/”。应与boot_file_url一

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置

总条数： 1392

上一页
1
...
61
62
63
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

投机推理使用说明 - AI开发平台ModelArts

修改工作空间配额 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

配置Workflow的输入输出目录 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

授权API至APP - AI开发平台ModelArts

创建训练作业参数 - AI开发平台ModelArts

获取某个超参敏感度分析图像的路径 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

注册API并授权给APP - AI开发平台ModelArts

Open-Sora 1.0基于Lite Server适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

删除模型 - AI开发平台ModelArts

更新API授权 - AI开发平台ModelArts

委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

更新训练作业参数 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线