检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
${docker_ip} --served-port ${port} --text 图片内容是什么 表2 脚本参数说明 参数 是否必须 参数类型 描述 image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json, 可参考表2
${container_name} bash Step5启动推理 本章节介绍SD3模型的推理过程。使用官方提供的已经训练好的模型进行推理,输入prompt生成指定像素的图片。 使用如下命令登录huggingface,并输入个人账号的token: huggingface-cli login 执行如下命令运行推理脚本启动SD3服务:
数为AppCode值 请求Body按照接口定义传参,本案例中KEY参数为images,选择为File格式,VALUE参数单击上传需要识别的图片。 图6 Headers 图7 Body 图8 返回结果 常见APP认证报错分析 报错信息 "error_msg": "The API does
${container_name} bash 步骤六:启动推理 本章节介绍SD3模型的推理过程。使用官方提供的已经训练好的模型进行推理,输入prompt生成指定像素的图片。 使用如下命令登录huggingface,并输入个人账号的token: huggingface-cli login 执行如下命令运行推理脚本启动SD3服务:
moondream2:/home/ma-user/ #复制moondream2目录到容器中 Step5 准备测试数据 需要用户自己准备测试图片。 将测试图片存放在宿主机/home/temp/data目录下,修改目录权限后,复制到容器中。 chmod -R 777 data #修改data目录权限
度问题 支持溢出检测功能,判断是否存在输入正常但输出存在溢出的API,从而判断是否为正常溢出。 梯度状态监控,用于采集梯度数据并进行梯度相似度比对,可以精准定位出现问题的step。 执行pip install mindstudio-probe msprobe使用手册 性能调优 PyTorch
导入的OBS路径或Manifest路径。 导入Manifest时,path必须精确到具体Manifest文件。 导入为目录时,目前仅支持数据集类型为图片分类、物体检测、图像分割、文本分类、声音分类和表格数据集。 字符限制:不允许出现的特殊字符有换行符(\n)、回车符(\r)、制表符(\t)。
uUtil”、“memUsage”“npuMemUsage”、“npuUtil”,可以添加或取消对应参数的使用情况图。 操作三:鼠标悬浮在图片上的时间节点,可查看对应时间节点的占用率情况。 图1 资源占用情况 表1 参数说明 参数 说明 cpuUsage cpu使用率。 gpuMemUsage
${docker_ip} --served-port ${port} --text 图片内容是什么 表2 脚本参数说明 参数 是否必须 参数类型 描述 image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json, 可参考表2
${docker_ip} --served-port ${port} --text 图片内容是什么 表2 脚本参数说明 参数 是否必须 参数类型 描述 image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json, 可参考表2
${docker_ip} --served-port ${port} --text 图片内容是什么 表2 脚本参数说明 参数 是否必须 参数类型 描述 image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json, 可参考表2
profiling工具对于性能瓶颈进行分析,并针对性地做一些调优操作。 您可以直接使用benchmark命令测试mindir模型性能,用来对比调优前后性能是否有所提升。 # shell cd /home_host/work benchmark --modelFile=diffus
msprobe精度分析工具使用指导 msprobe是MindStudio Training Tools工具链下精度调试部分的工具包,其通过采集和对比标杆(GPU/CPU)环境和昇腾环境上运行训练时的差异点来判断问题所在,主要包括精度预检、精度比对和梯度监控等功能。更多内容请参考msprobe工具介绍。
--image-input-shape:输入图片维度,当前不支持图片动态维度,如果图片不是(1,336,336)shape,将会被resize。 --image-feature-size:图片输入解析维度大小;llava-v1.6图片输入维度与image-feature-size关系映射表见git;计算原理如下:
与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与输入语音匹配的视频,俗称“对口型”。该技术的主要作用就是在将音频与图片、音频与视频进行合成时,口型能够自然。 案例主要介绍如何基于ModelArts Lite Server上的昇腾NPU资源进行模型训练推理。
图3 sft全参微调单机loss曲线对比结果 图4 sft全参微调双机loss曲线对比结果 lora微调NPU训练结果loss收敛且趋势与GPU训练loss一致 图5 lora微调双机loss曲线对比结果 图6 lora微调双机loss曲线对比结果 父主题: MLLM多模态模型训练推理
${docker_ip} --served-port ${port} --text 图片内容是什么 表2 脚本参数说明 参数 是否必须 参数类型 描述 image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json, 可参考表2
${docker_ip} --served-port ${port} --text 图片内容是什么 表2 脚本参数说明 参数 是否必须 参数类型 描述 image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json, 可参考表2
选择数据所在OBS桶的存储区域,以控制台实际可选值为准。 存储位置 选择待发布数据集所在对象存储服务(OBS)的路径。 数据类型 至少选择一个数据集类型的标签。 可选标签:图片、音频、视频、文本、表格、其他 许可证类型 根据业务需求和数据集类型选择合适的许可证类型。 单击许可证类型后面的可以查看许可证详情。 谁可以看
据,并可以通过创建标注任务进行数据标注。 文件型数据标注状态 数据标注状态分为“未标注”和“已标注”。 未标注:仅导入标注对象(指待标注的图片,文本等),不导入标注内容(指标注结果信息)。 已标注:同时导入标注对象和标注内容,当前“自由格式”的数据集不支持导入标注内容。 为了确保