检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Rosbag转OpenData作业(数据回放) 作业输入输出规范 示例代码 构建镜像 父主题: 算子示例
数据提取作业(数据集) 作业输入输出规范 示例代码 构建镜像 父主题: 算子示例
Resim作业(回放仿真) 作业输入输出规范 示例镜像制作 父主题: 算子示例
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。
为什么无法添加产品过滤算子? 仅当数据源为“IoT设备接入数据源”时,必须先使用“产品过滤”算子,将同一个IoT设备接入数据源的不同产品分开,才可进行后续配置。当数据源为其他数据源时,则不需要使用“产品过滤”算子。 父主题: 管道作业常见问题
使用display方法渲染算子输出内容 支持渲染的输出内容 display方法支持渲染的输出内容,包括如下类别: data:结构化数据,使用spreadJs组件渲染。 chart:图表,使用echarts组件渲染。 picture:图片,直接使用html渲染图片。
在CCE中安装部署Jenkins 在CCE中安装部署Jenkins方案概述 资源和成本规划 实施步骤 父主题: DevOps
支持设置了CCE FullAccess或CCE ReadOnlyAccess权限的IAM用户访问,同时还需要拥有命名空间的管理员权限(cluster-admin)。 配置与密钥 / 配置项 ( ConfigMap )无需其他依赖权限。
图解云容器引擎
基于该插件,支持用户在短时高负载场景下,将部署在云容器引擎CCE上的无状态负载(Deployment)、有状态负载(StatefulSet)、普通任务(Job)、定时任务(CronJob)四种资源类型的容器实例(Pod),弹性创建到云容器实例CCI服务上,以减少集群扩容带来的消耗。
容灾 CCE集群高可用推荐配置 在CCE中实现应用高可用部署 插件高可用部署
NPU_Flash_Attn融合算子约束 query、key、value都需要梯度。默认开启重计算,则前向时qkv没有梯度,如果需要关闭重计算,可以在yaml配置 `disable_gradient_checkpointing: true` 关闭,但显存占用会直线上升。
输出结果完成后,作业容器需要在output目录创建一个名为“_SUCCESS”的标识文件,用于通知系统作业已完成。如果作业主动捕获到异常并失败退出,可在output目录创建一个名为“_FAILURE”的标识文件,用于通知系统作业已失败。
当“Pod访问元数据”处于关闭状态时,无需进行额外配置,已禁止容器获取宿主机元数据。 当“Pod访问元数据”处于开启状态时,请参考以下步骤禁止容器获取宿主机元数据。
必须有_SUCCESS或 _FAILURE文件,标志用户镜像任务完成(或失败)。 可选有output_dir/auxiliary目录,用于存储附加文件。对格式没有限制。 人工打标支持 Input 程序必须能接受task_content_json,该参数以环境变量的形式引入镜像。
在CCE集群中部署使用Kubeflow Kubeflow部署 Tensorflow训练 使用Kubeflow和Volcano实现典型AI训练任务 父主题: 批量计算
NPU_Flash_Attn融合算子约束 query、key、value都需要梯度。默认开启重计算,则前向时qkv没有梯度,如果需要关闭重计算,可以在yaml配置 `disable_gradient_checkpointing: true` 关闭,但显存占用会直线上升。
NPU_Flash_Attn融合算子约束 query、key、value都需要梯度。默认开启重计算,则前向时qkv没有梯度,如果需要关闭重计算,可以在yaml配置 `disable_gradient_checkpointing: true` 关闭,但显存占用会直线上升。
NPU_Flash_Attn融合算子约束 query、key、value都需要梯度。默认开启重计算,则前向时qkv没有梯度,如果需要关闭重计算,可以在yaml配置 `disable_gradient_checkpointing: true` 关闭,但显存占用会直线上升。