检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开放脚本地址,其中region-id根据实际region修改,例如cn-southwest-2 value: "https://mtest-bucket.obs.{region-id}.myhuaweicloud.com/acc/rank"
令安装配置Agent。其它region的安装请参考单台主机下安装Agent。 cd /usr/local && curl -k -O https://obs.cn-north-4.myhuaweicloud.com/uniagent-cn-north-4/script/agent_install
${container_name} bash Step4 下载原始模型包 从HuggingFace官网下载moondream2模型包到本地,下载地址:https://huggingface.co/vikhyatk/moondream2/tree/2024-03-06。 在宿主机上创建一个空目录/
参数 参数类型 描述 use_cache Boolean 是否使用缓存。 请求示例 查询Workflow Execution详情 GET https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/executions/fa4
查看日志和性能 查看日志 训练过程中,训练日志会在第一个的Rank节点打印。 图1 打印训练日志 训练完成后,如果需要单独获取训练日志文件,日志存放在第一个的Rank节点中;日志存放路径为:对应表1表格中output_dir参数值路径下的trainer_log.jsonl文件 查看性能
查看日志和性能 查看日志 训练过程中,训练日志会在第一个的Rank节点打印。 图1 打印训练日志 训练完成后,如果需要单独获取训练日志文件,日志存放在第一个的Rank节点中;日志存放路径为:对应表1表格中output_dir参数值路径下的trainer_log.jsonl文件 查看性能
true:只读权限 false:默认值,读写权限 请求示例 如下以查询“job_id”为10,“version_id”为10的作业为例。 GET https://endpoint/v1/{project_id}/training-jobs/10/versions/10 响应示例 成功响应示例
WorkflowDagPolicies 参数 参数类型 描述 use_cache Boolean 是否使用缓存。 请求示例 停止工作流 POST https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/executions/4dd
参数种类。 请求示例 如下以查询算法限制个数为1,查询作业名字中包含TestModelArtsalgorithm的所有算法数据为例。 GET https://endpoint/v2/{project_id}/algorithms?limit=1&searches=name%3ATestModelArtsalgorithm
设置模型的参数,如图11所示。 元模型来源:从容器镜像中选择。 容器镜像所在的路径:单击选择镜像文件。具体路径查看5SWR地址。 容器调用接口:选择HTTPS。 host:设置为8443。 部署类型:选择在线服务。 图11 设置模型参数 填写启动命令,启动命令内容如下: sh /home/ma-user/infer/run
如果您在本地IDEA环境中开发工作流,则Session初始化使用如下方式 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全; # 本示例以ak和sk保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HU
from_pretrained(onnx_model_path, torch_dtype=torch.float32).to("cpu") url = "https://raw.githubusercontent.com/CompVis/stable-diffusion/main/assets/st
true:只读权限 false:默认值,读写权限 请求示例 如下以查询“job_id”为10,每页5条,第一页的作业版本详情为例。 GET https://endpoint/v1/{project_id}/training-jobs/10/versions?per_page=5&page=1
connection_info字段数据结构说明 参数 参数类型 说明 protocol String 链接仓库协议。当前支持:ssh,https。 url String 链接仓库地址。 credential Object 证书信息,请参见表30。 表24 credential字段数据结构说明
果出现该情况请将编辑器改为utf-8格式后再粘贴代码。 在本地电脑中创建训练脚本“train.py”,内容如下: # base on https://github.com/pytorch/examples/blob/main/mnist/main.py from __future__
nt量化或使用GPTQ量化章节对模型做量化处理。 参数定义和使用方式与vLLM0.5.0版本一致,此处介绍关键参数。详细参数解释请参见https://github.com/vllm-project/vllm/blob/main/vllm/engine/arg_utils.py。 Step7
nt量化或使用GPTQ量化章节对模型做量化处理。 参数定义和使用方式与vLLM0.5.0版本一致,此处介绍关键参数。详细参数解释请参见https://github.com/vllm-project/vllm/blob/main/vllm/engine/arg_utils.py。 步骤七
WorkflowDagPolicies 参数 参数类型 描述 use_cache Boolean 是否使用缓存。 请求示例 启动工作流 POST https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/executions { }
果出现该情况请将编辑器改为utf-8格式后再粘贴代码。 在本地电脑中创建训练脚本“train.py”,内容如下: # base on https://github.com/pytorch/examples/blob/main/mnist/main.py from __future__
log_stream_id 是 String LTS日志流id,长度64。 响应参数 无 请求示例 如下以更新“real-time”类型的服务为例。 PUT https://{endpoint}/v1/{project_id}/services/{service_id} { "description"