检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
failed.Can not find %s file in current model directory %s. 检查xxx类型模型的存储位置,修改为正确的路径后重试,或者联系技术支持。 提示 模型大小计算失败。多于一个xxx模型文件在路径xxx下。 Model size calculated
数据集有效。可选值如下: true:对图片进行裁剪 false:不对图片进行裁剪(默认值) crop_path String 裁剪后的文件存放路径。 crop_rotate_cache_path String 旋转裁剪任务执行的临时目录。 data_analysis Map<String
export ASCEND_RT_VISIBLE_DEVICES=0,1 使用Opencompass精度测评工具 获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation目录中,代码目录结构如下。目前使用的opencompass版本是0
迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求,能评估推理框架在实际业务中能支持的并发数。 性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_evaluation目录下。 代码目录如下: benchmark_tools
多个属性之间的操作类型。可选值如下: OR:或操作 AND:与操作 property Map<String,Array<String>> 标签属性,是Object格式,存放任意的键值对;key是属性名称,value是取值列表,如value为null表示不根据值搜索,否则搜索的值满足列表中任意一个即可。 type
排序方式,ASC升序,DESC降序。 sort_key 否 String 排序的字段,多个字段使用(“,”)逗号分隔。 offset 否 Integer 分页记录的起始位置偏移量。 limit 否 Integer 每一页的数量。 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型
createTime:默认值,创建时间。 updateTime:更新时间。 limit 否 Integer 每一页的数量。 offset 否 Integer 分页记录的起始位置偏移量。 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 current Integer 当前页数。
数据输入约束。 表11 remote_constraints 参数 参数类型 描述 data_type String 数据输入类型,包括数据存储位置、数据集两种方式。 attributes Array of Map<String,String> objects 数据输入为数据集时的相关属性。枚举值:
\ /bin/bash --device=/dev/davinciX 挂载NPU设备,示例中挂载了8张卡 work_dir:工作目录,目录下存放着训练所需代码、数据等文件 container_work_dir: 容器工作目录,一般同work_dir container_name:自定义容器名
语音标签(包含语音内容和语音起止点)专用内置属性:语音文本内容。 @modelarts:end_index Integer 命名实体标签专用内置属性:文本的结束位置,但不包括end_index所指的字符。例如: 文本内容为“Barack Hussein Obama II (born on August
语音标签(包含语音内容和语音起止点)专用内置属性:语音文本内容。 @modelarts:end_index Integer 命名实体标签专用内置属性:文本的结束位置,但不包括end_index所指的字符。例如: 文本内容为“Barack Hussein Obama II (born August 4,
数据输入约束。 表9 RemoteConstraint 参数 是否必选 参数类型 描述 data_type 否 String 数据输入类型,支持数据存储位置(OBS)、ModelArts数据集两种方式。 attributes 否 Array of Map<String,String> objects
ain/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时,对应的存放地址。请根据实际规划修改。 对于ChatGLMv3-6B和Qwen系列模型,还需要手动修改tokenizer文件,具体请参见训练tokenizer文件说明。
&& \ pip install ipykernel==6.7.0 --trusted-host https://repo.huaweicloud.com -i https://repo.huaweicloud.com/repository/pypi/simple && \
${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统,work_dir为宿主机中工作目录,目录下存放着训练所需代码、数据等文件。container_dir为要挂载到的容器中的目录。为方便两个地址可以相同。 shm-size:共享内存大小。
接口启动2种方式。详细启动服务与请求方式参考:https://docs.vllm.ai/en/latest/getting_started/quickstart.html。 以下服务启动介绍的是在线推理方式,离线推理请参见https://docs.vllm.ai/en/lates
PLAN”,取值为“true”,具体操作请参见管理训练容器环境变量。 代码示例 训练作业的启动脚本示例如下。 启动脚本中设置plog生成后存放在“/home/ma-user/modelarts/log/modelarts-job-{id}/worker-{index}/”目录,而
ain/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时,对应的存放地址。请根据实际规划修改。 对于ChatGLMv3-6B和Qwen系列模型,还需要手动修改tokenizer文件,具体请参见训练tokenizer文件说明。
al-Large-Language-Models at Evaluation)。 步骤一:配置精度测试环境 获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation目录中,代码目录结构如下。目前使用的opencompass版本是0
/home/ma-user/ws/tokenizers/Qwen2-72B 必须修改。加载tokenizer与Hugging Face权重时,对应的存放绝对或相对路径。请根据实际规划修改。 do_train true 指示脚本执行训练步骤,用来控制是否进行模型训练的。如果设置为true,则