检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询开发环境实例详情 GET /v1/{project_id}/notebooks/{id} modelarts:notebook:get - √ √ 更新开发环境实例信息 PUT /v1/{project_id}/notebooks/{id} modelarts:notebook:update
点 代码简单:仅需修改一行代码。 通信瓶颈 :负责reducer的GPU更新模型参数后分发到不同的GPU,因此有较大的通信开销。 GPU负载不均衡:负责reducer的GPU需要负责汇总输出、计算损失和更新权重,因此显存和使用率相比其他GPU都会更高。 DistributedDa
击“确定”。 “分组数”:填写2~200之间的整数,指将图片分为多少组。 “结果处理方式”:“更新属性到当前样本中”,或者“保存到对象存储服务(OBS)”。 “属性名称”:当选择“更新属性到当前样本中”时,需输入一个属性名称。 “结果存储目录”:当选择“保存到对象存储服务(OBS
r: No module named 'multipart'"报错: 截图如下: 解决措施:可更新python-multipart为0.0.12版本,具体步骤如下: 启动训练任务前更新python-multipart版本: pip install python-multipart==0
进行的毫秒数,使得当次Token解码能与下一次模型推理并行计算,从而减少总推理时延。该参数需要设置环境变量DEFER_DECODE=1才能生效。 export USE_VOCAB_PARALLEL=1 # 是否使用词表并行;默认值为1表示开启并行,取值为0表示关闭并行。对于词表
指定排序字段,枚举值如下: publish_at: 服务发布时间,默认值 service_name: 服务名称 transition_at:更新时间 order 否 String 排序方式,枚举值如下: asc : 递增排序 desc: 递减排序,默认值 tags 否 String
数据占满系统目录。系统目录仅支持系统功能基本运行,无法支持大数据存储。 部分训练任务会在训练过程中生成checkpoint文件,并进行更新。如更新过程中,未删除历史的checkpoint文件,会导致/cache目录逐步被用完。 实际存储空间足够,却依旧报错“No Space left
1所示。 workspace Object 工作空间,如表16所示。 latest_update_timestamp String 实例的更新时间。 flavor_details Object 机器规格详情,如表7所示。 pool Object 专属资源池,如表8所示。 ai_project
\"placeholder_cn\":\"每次更新训练的图片数量(总)\",\"placeholder_en\":\"\",\"required\":true},{\"label\":\"lr\",\"value\":\"0.0001\",\"placeholder_cn\":\"更新参数的学习率\",\
d,不要使用OBS路径。 问题现象4 使用pytorch中的dataloader读数据时,作业卡在读数据过程中,日志停在训练的过程中并不再更新日志。 解决方案4 用dataloader读数据时,适当减小num_worker。 父主题: 训练作业卡死
称。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 labels 否 Array of Label objects 待更新的标签列表。 表3 Label 参数 是否必选 参数类型 描述 attributes 否 Array of LabelAttribute objects
task_id String 任务ID。 total_sample_count Integer 样本总数量。 update_time Long 任务更新时间。 version_format String 数据集版本格式。可选值如下: Default:默认格式 CarbonData:Carbon格式(仅表格数据集支持)
例如:每半年对模型进行一次变更,变更的内容包含模型结构,并升级AI框架。 - 是否使用华为MDC产品 如果使用华为MDC产品,请填写MDC版本号,如果没有可以不填。 例如:使用了C83版本。 - 性能指标与预期 例1: 模型:YOLOv5 运行环境:Vnt1 单卡 性能指标:QPS 100/s (两进程)
export_images Boolean 发布时是否导出图片到版本输出目录。可选值如下: true:导出图片到版本输出目录 false:不导出图片到版本输出目录(默认值) extract_serial_number Boolean 发布时是否需要解析子样本序号,用于医疗数据集。可选值如下:
是否启用自动停止功能。 type String 自动停止类别。 timing:自动停止。 idle:空闲停止。 update_at Long 实例最后更新(不包括探活心跳)的时间,UTC毫秒。 请求示例 GET https://{endpoint}/v1/{project_id}/notebooks/{id}/lease
create_time Long 标注团队的创建时间。 description String 标注团队的描述。 update_time Long 标注团队的更新时间。 worker_count Integer 标注团队的成员总数。 workforce_id String 标注团队ID。 workforce_name
高编译效率。FAQ 正常 模型描述已更新。 Model description updated. - 正常 模型运行时依赖未更新。 Model running dependencies not updated. - 正常 模型运行时依赖已更新。正在重新构建镜像 Model running
内的节点,ModelArts支持通过节点池来管理节点。节点池是集群中具有相同配置的一组节点,一个节点池包含一个节点或多个节点,您可以创建、更新和删除节点池。 管理Lite Cluster资源池标签:ModelArts支持为资源池添加标签,用来标识云资源,方便您快速搜索到资源池。 扩缩容Lite
标注成员的当前登录状态。可选值如下: 0:未发送邀请邮件 1:已发送邀请邮件但未登录 2:已登录 3:标注成员已删除 update_time Long 更新时间。 worker_id String 标注成员ID。 workforce_id String 所属标注团队ID。 请求示例 查询标注团队成员详情
是否启用自动停止功能。 type String 自动停止类别。 timing:自动停止。 idle:空闲停止。 update_at Long 实例最后更新(不包括探活心跳)的时间,UTC毫秒。 请求示例 延长运行中的Notebook时长。 https://{endpoint}/v1/{pro