检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
--backend:服务类型,如tgi,vllm,mindspore、openai。 --host ${docker_ip}:服务部署的IP地址,${docker_ip}替换为宿主机实际的IP地址。 --port:推理服务端口。 --dataset:数据集路径。 --dataset-type:支持三种 "a
api_server \ --model=${base_model} \ # 大模型权重地址 --speculative-model=${spec_model} \ # 投机小模型权重地址 --num-speculative-tokens=${spec_step} \ #投机步数
设置为允许远程接入访问这个Notebook的IP地址(例如本地PC的IP地址或者访问机器的外网IP地址,最多配置5个,用英文逗号隔开),不设置则表示无接入IP地址限制。 如果用户使用的访问机器和ModelArts服务的网络有隔离,则访问机器的外网地址需要在主流搜索引擎中搜索“IP地址查询”获取,而不是使用
--backend:服务类型,如tgi,vllm,mindspore、openai。 --host ${docker_ip}:服务部署的IP地址,${docker_ip}替换为宿主机实际的IP地址。 --port:推理服务端口。 --dataset:数据集路径。 --dataset-type:支持三种 "a
通过公网使用kubectl工具,可以将kubectl安装在任一台可以访问公网的机器。 首先需要绑定公网地址,单击公网地址后的“绑定”按钮。 图4 绑定公网地址 选择已有的公网IP,或者跳至创建,创建新的弹性公网IP。 完成公网地址绑定后,在“集群信息”找到“连接信息”,单击kubectl后的“配置”按钮。
yaml文件样例 表1 模型训练参数 参数 示例值 参数说明 dataset 【预训练:pt】预训练数据集相对或绝对地址 【微调:sft】微调数据集相对或绝对地址 【必修改】训练时指定的输入数据路径。请根据实际规划修改。用户根据训练情况二选一; processed_data_dir
yaml文件样例 表1 模型训练参数 参数 示例值 参数说明 dataset 【预训练:pt】预训练数据集相对或绝对地址 【微调:sft】微调数据集相对或绝对地址 【必修改】训练时指定的输入数据路径。请根据实际规划修改。用户根据训练情况二选一; processed_data_dir
录下,官网下载地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium-diffusers/tree/main(需登录) 下载公开数据集,上传到容器的/home/ma-user目录下,官网下载地址:https://huggingface
专属资源池需单独创建,不与其他租户共享。 公共资源池 实例规格 选择实例规格,规格中描述了服务器类型、型号等信息。 xxx 流量限制(QPS) 设置待部署模型的流量限制QPS。 1 实例数 设置服务器个数。 1 更多选项 内容审核 选择是否打开内容审核,默认启用。 开关打开(默认打开)
下载vicuna-13b-v1.5模型。下载地址:lmsys/vicuna-13b-v1.5 · Hugging Face 图1 下载vicuna-13b-v1.5模型 步骤四:下载数据集 请用户自行下载GQA数据集,下载地址:images。 将GQA数据集放于${conta
您没有下载权限,请联系您所在企业的华为方技术支持下载获取。 镜像版本 本教程中用到基础镜像地址和配套版本关系如下表所示,请提前了解。 表2 基础容器镜像地址 配套软件版本 镜像用途 镜像地址 配套 获取方式 6.3.908版本 基础镜像 swr.cn-southwest-2.myhuaweicloud
Key管理”页面中创建的API Key。具体操作,请参见创建API Key。 API Endpoint URL 服务调用界面中MaaS服务的基础API地址,需要去掉地址尾部的“/chat/completions” 。具体操作,请参见步骤二:调用MaaS模型服务进行预测。 Function calling
您没有下载权限,请联系您所在企业的华为方技术支持下载获取。 镜像版本 本教程中用到基础镜像地址和配套版本关系如下表所示,请提前了解。 表2 基础容器镜像地址 配套软件版本 镜像用途 镜像地址 配套 获取方式 6.3.909版本 基础镜像 swr.cn-southwest-2.myhuaweicloud
在线服务。详细请参见设置在线服务故障自动重启。 “支持IPV6” 默认关闭。开启该功能后,待在线服务部署完成,服务预测地址中的域名在公网解析时可解析为IPV6地址。 须知: 仅支持部署时开启,开启后不支持修改。 仅北京四支持该功能。 “标签” ModelArts支持对接标签管理服
像来构建一个新镜像。将编写好的Dockerfile文件放置在context文件夹内。训练基础镜像地址请参见训练专属预置镜像列表。 FROM {ModelArts提供的训练基础镜像地址} # 配置pip RUN mkdir -p /home/ma-user/.pip/ COPY
API Key后需要等待多久才能生效? API Key是否支持跨区域使用? 领取MaaS免费常驻服务Token后多久生效? 配置模型服务接口地址时需要注意什么格式问题? 如何正确获取模型名称? 调优数据集异常日志说明 使用ChatGLM3-6B或GLM-4-9B模型微调后,权重校验失败
sysctl -p | grep net.ipv4.ip_forward Step2 获取推理镜像 建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表2。 docker pull {image_url} Step3 上传权重文件 上传安装依赖软件推理代码
${container_model_path}:模型地址,模型格式是HuggingFace的目录格式。即Step3 上传代码包和权重文件上传的HuggingFace权重文件存放目录。若使用了量化功能,则使用推理模型量化章节转换后的权重。如果使用的是训练后模型转换为HuggingFace格式的地址,还需要有Tokenizer原始文件。
${container_model_path}:模型地址,模型格式是HuggingFace的目录格式。即Step3 上传代码包和权重文件上传的HuggingFace权重文件存放目录。如果使用了量化功能,则使用推理模型量化章节转换后的权重。如果使用的是训练后模型转换为HuggingFace格式的地址,还需要有Tokenizer原始文件。
您没有下载权限,请联系您所在企业的华为方技术支持下载获取。 镜像版本 本教程中用到基础镜像地址和配套版本关系如下表所示,请提前了解。 表2 基础容器镜像地址 配套软件版本 镜像用途 镜像地址 配套 获取方式 6.3.908版本 基础镜像 swr.cn-southwest-2.myhuaweicloud