检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
open_clip git reset --hard 37b2c6b321ee697df4c709ca95d6dc849fc7d214 37b2c6b321ee697df4c709ca95d6dc849fc7d214是commit号。 复制Open-clip源码包到容器/home/ma-user目录下。
Map<String,Object> 数据集的样本统计信息,包括样本元信息的统计,json格式。 data_validate Boolean 发布前数据是否经过校验算法校验。可选值如下: true:数据经过校验 false:数据未经过校验 deleted_sample_count Integer
thon import)导入自定义包。 如果ModelArts推理框架代码内部存在同名包,而又未采用相对导入,将会出现冲突,导致部署或预测失败。 父主题: Standard推理部署
当模型创建成功后,您可以进入模型详情页查看模型的信息。 登录ModelArts管理控制台,在左侧菜单栏中选择“模型管理”,进入“自定义模型”列表页面。 单击目标模型名称,进入模型详情页面。 您可以查看模型的基本信息、模型精度,以及切换页签查看更多信息。 表3 模型基本信息 参数 说明 名称 模型的名称。
退订与退换货 在搜索框实例ID信息,确认信息无误后,单击右侧“退订资源”。 图5 搜索实例ID 根据界面提示,确认需要退订的资源,并选择退订原因。 确认退订信息无误后,勾选“我已确认……”和“资源退订后……”提示信息。 单击“退订”,再次根据界面信息确认要退订的资源。 再次单击“退订”,完成包年/包月资源的退订操作。
安装。 (1)已卸载原有版本NVIDIA驱动和CUDA版本,且已安装新版本的NVIDIA驱动和CUDA版本 (2)执行nvidia-smi失败,提示Failed to initialize NVML: Driver/library version mismatch 处理方法 执行命令:lsmod
ModelArts通过多种数据保护手段和特性,保障存储在ModelArts中的数据安全可靠。 数据保护手段 说明 静态数据保护 对于AI Gallery收集的用户个人信息中的敏感信息,如用户邮箱和手机号,AI Gallery在数据库中做了加密处理。其中,加密算法采用了国际通用的AES算法。 传输中的数据保护 在M
小模型投机步数,即小模型生成几个token来交给大模型进行推理,取值通常在2~6之间,步数越小,每次校验的token越少,投机token与大模型一致的概率越高;反之,步数过大会导致与大模型无法保持一致,造成资源浪费。 offline speculative_draft_tensor_parallel_size
此处输入的是具体的OBS文件路径,不是文件夹的路径,否则会导致上传失败。 方式二:打开OBS File Browser选择OBS文件路径,然后单击“上传”,开始上传文件。 图4 上传OBS文件 异常处理 提示文件上传失败,有以下三种常见场景。 异常场景1 图5 文件上传失败 可能原因: OBS路径没有设置为具体的文件路径,设置成了文件夹。
图1 预测报错 原因分析 请在“在线服务”详情页面的日志页签中查看对应的报错日志,分析报错原因。 图2 报错日志 从上图报错日志判断,预测失败是模型推理代码编写有问题。 解决方法 根据日志报错提示,append方法中缺少必填参数,修改模型推理代码文件“customize_service
Server在日常操作与维护过程中涉及的高危操作,需要严格按照操作指导进行,否则可能会影响业务的正常运行。 高危操作风险等级说明: 高:对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。 中:对于可能导致安全风险及可靠性降低的高危操作。 低:高、中风险等级外的其他高危操作。 表1 高危操作一览表
示例代码 在保存Manifest文件之前需要先创建包含Manifest信息的对象,包括Sample样本信息及其标签信息Annotation,然后将若干个样本组成Manifest。保存的时候调用save接口,将session信息传入,即可保存到指定路径。 from modelarts.dataset
创建和保存Pascal VOC文件 需要先创建包含Pascal VOC信息的对象,然后保存。Pascal VOC信息请见表2。路径支持本地和OBS,如果是OBS,需要Session信息。 pascal_voc.save_xml(xml_file_path, save_mode='w'
新建服务、存量服务停止后再启动、存量服务失败后再启动,会立即切换使用新域名。为保障持续提供推理服务,请您及时更新业务中的预测API的域名。 如果您使用的是VPC内部节点访问ModelArts推理的在线服务,预测API切换域名后,由于内网VPC无法识别公网域名,请提交工单联系华为云技术支持打通网络。
[worker-0] [耗时: 秒] 训练代码下载失败,失败原因: [worker-0] 训练输入下载中 [worker-0] [耗时: 秒] 训练输入(参数名称:)下载完成 [worker-0] [耗时: 秒] 训练输入(参数名称:)下载失败,失败原因: [worker-0] 正在安装Python依赖包,导入文件:
Map<String,Object> 数据集的样本统计信息,包括样本元信息的统计,json格式。 data_validate Boolean 发布前数据是否经过校验算法校验。可选值如下: true:数据经过校验 false:数据未经过校验 deleted_sample_count Integer
自动停止服务失败,错误信息: xxx Failed to stop service automatically, error message: %s 请根据错误信息定位和处理问题。 异常 启动边缘服务失败。 Failed to start service. 启动服务失败情况较多,请参考FAQ定位和处理。
自动停止服务失败,错误信息: xxx Failed to stop service automatically, error message: %s 请根据错误信息定位和处理问题。 异常 启动边缘服务失败。 Failed to start service. 启动服务失败情况较多,请参考FAQ定位和处理。
训练作业进程异常退出 问题现象 训练作业运行失败,日志中出现如下类似报错: [Modelarts Service Log]Training end with return code: 137 原因分析 日志显示训练进程的退出码为137。训练进程表示用户的代码启动后的进程,所以这里
镜像保存时报错“The container size (30G) is greater than the threshold (25G)”,镜像创建失败。 原因分析 镜像保存本质是通过在资源集群节点上的agent中进行了docker commit,再配合一系列自动化操作来上传和更新管理数据