华为云用户手册

  • 数据保护技术 CodeArts TestPlan通过多种手段保护数据安全。 数据保护手段 简要说明 传输加密(HTTPS) 为保证数据传输的安全性,CodeArts TestPlan使用HTTPS传输数据。 个人数据保护 通过控制个人数据访问权限以及记录操作日志等方法防止个人数据泄露,保证您的个人数据安全。 隐私数据保护 CodeArts TestPlan不消费、不存储用户敏感数据。 数据销毁 用户主动删除业务数据或销户的情况下: 非关键数据会实时物理删除。 关键数据会被标记软删除后,15天再后物理删除。 父主题: 安全
  • 身份认证 用户访问CodeArts TestPlan的方式有多种,包括CodeArts TestPlan用户界面、API、SDK,无论访问方式封装成何种形式,其本质都是通过CodeArts TestPlan提供的REST风格的API接口进行请求。 CodeArts TestPlan的接口需要经过认证请求后才可以访问成功。 CodeArts TestPlan支持两种认证方式: Token认证:通过Token认证调用请求,访问CodeArts TestPlan用户界面默认使用Token认证机制。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。 关于认证鉴权的详细介绍及获取方式,请参见认证鉴权。
  • 责任共担 华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的 云安全 挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责云服务内部的安全,安全地使用云。华为云租户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理,包括但不限于虚拟网络、 虚拟主机 和访客虚拟机的操作系统,虚拟防火墙、API网关和高级安全服务,各项云服务,租户数据,以及身份账号和密钥管理等方面的安全配置。 《华为云安全白皮书》详细介绍华为云安全性的构建思路与措施,包括云安全战略、责任共担模型、合规与隐私、安全组织与人员、基础设施安全、租户服务与租户安全、工程安全、运维运营安全、生态安全。 图1 华为云安全责任共担模型 父主题: 安全
  • 持续自动化测试 支持接口自动化测试 应用测试金字塔测试设计方式,在接口层次进行功能自动化测试。 和UI测试相比,接口测试开发成本低、运行时间短、运行稳定性高,可以实现快速准确的测试反馈。 持续集成自动化测试 应用持续集成方法,使用流水线实现构建、部署、测试,快速测试及时发现问题,避免带问题的制品进入下个环节或环境。 监控生产环境及第三方依赖API 在生产环境建立对产品或第三方依赖API的接口级7x24测试监控,早于客户发现现网问题,并及时修复。
  • 解决方法 单击webm2mov,将视频格式转换小工具webm2mov_20240814.rar下载至本地。 下载过程大约耗时3~5分钟,请耐心等待。 如果用户需要自定义工具,可以获取其源码。 本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov.exe,弹出如图1所示的界面。 图1 工具运行界面 单击“选择webm文件”,选择WEBM格式的视频。 等待视频格式转换完成。请注意,视频格式转换过程中,一定不能关闭如图2所示的2个窗口。 图2 工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的同级目录下面会生成一个同名带时间戳的MOV文件。 文件名示例如下所示: 原始频名称:test.webm 转换后的视频名称:test_20240904155004.mov
  • 云直播转码是如何计费的? 若配置了转码模板,则直播开始推流时即同时开始转码,且产生转码费用,具体费用根据实际转码的编码标准、分辨率和时长进行计算,时长精确到小数点两位,第二位根据第三位四舍五入。 若配置多个输出规格,则各个输出规格的费用和为总直播转码费用。转码计费时长为直播推流时长,非观看时长,同一直播流、同一码率在多人观看情况下仅收取一份转码费用。具体请参见产品价格详情。 转码费用支持按需计费和转码套餐包,其中转码套餐包暂只支持抵扣输出规格为“H264 SD”的转码费用,其他4K/2K/FHD/HD转码只能按需计费。 父主题: 计费购买
  • 购买云直播转码套餐后,产生的转码费用未从套餐包中抵扣? 可能是由于您购买的转码套餐包未覆盖您的转码使用场景。 视频直播 目前提供了两种规格的转码套餐包,H.264标准转码包和H.264高清低码包,在购买转码套餐包之前需要注意如下事项: 直播转码套餐包不支持跨区域使用,如您购买的是“华北-北京一”的转码套餐包,但您使用的是“华北-北京四”直播服务,这种情况就无法通过套餐包抵扣,费用只能从您的余额扣除。 直播转码的编码格式支持H.264和H.265,当前暂只提供了H.264的转码套餐包,若您使用的转码模板中视频编码设置的是H.265,这种情况是无法通过套餐包抵扣的。 直播转码套餐包暂只支持抵扣输出规格为“H264 SD”的转码费用,其他4K/2K/FHD/HD转码只能按需计费。 H.264转码套餐包分标准转码包和高清低码包,若您只购买了其中一种,而使用的是又另一种转码规格,如您购买了“H.264标准转码包”,但使用的转码模板中开启了“高清低码”功能,这种情况也是无法通过套餐包抵扣的。同样的,如您购买了“H.264高清低码包”,但使用的转码模板中未开启了“高清低码”功能,也是无法使用套餐包抵扣。 父主题: 计费购买
  • 如何选择加速区域? 创建 域名 时,支持为播放域名配置可加速的区域,推流域名不支持设置。如果在所选加速区域之外播放,将无法保证功能和质量。 用户可以根据实际情况,选择如下加速区域: 中国大陆 当观众在中国大陆时,应选择此项。域名需要在工信部备案,推荐您在华为云备案中心备案。 中国大陆境外 当观众在海外、中国香港、中国澳门、中国台湾时,应选择此项。 全球加速 当观众在中国大陆、中国香港、中国澳门、中国台湾或其他国家和地区时,应选择此项。域名需要在工信部备案,推荐您在华为云备案中心备案。 不同的加速区域,对应不同的直播CDN带宽或流量单价,详情请参见产品价格详情。
  • 如何选择直播源站? 关联的推流域名必须与播放域名归属同一个直播源站。 推流域名的源站必须选择主播所在区域,不支持主播跨区域推流。比如主播需要同时在中国大陆和马来西亚直播,则需要创建两套推拉流域名,直播源站分别为北京四和新加坡。 请根据实际的直播场景,选择直播源站。详细说明如下所示: 如果直播的推流和播放都在中国大陆,且不需要对实时流进行 媒体处理 操作(如直播录制、直播转码、直播截图等): 添加域名时选择可以选择任一中国内地区域。如果主播不在所选区域,也会正常接入至所在区域的接入节点。播流时会根据观众所在区域进行调度,与媒体处理中心所在区域无关。 如果直播需要对实时流进行媒体处理操作(如直播录制、直播转码、直播截图等): 因为直播录制文件、直播截图需要存储在OBS桶中,所以需要创建的OBS桶,且OBS桶所在区域和直播服务所在区域需要保持一致。 如果您的直播的主播和观众都在海外: 建议您选择距离主播较近的一个直播源站,将视频流推至附近的直播源站。 边缘推流 直播CDN节点遍布全球,使用边缘推流,将视频流优先推送至距离主播最近的边缘节点上,再传输至直播源站。 实时监控网络状态 为实时观察域名直播的网络状态,您可以登录视频直播控制台。在“用量统计”页面中,实时查看当前域名的带宽用量趋势、流量用量趋势、转码用量、直播录制和截图用量趋势,确保直播的稳定顺利进行,请参见用量统计。
  • 产品生命周期 FlexusRDS在MySQL社区版本生命周期的基础上,延长了支持时间。在延长期内,FlexusRDS会持续发布新的版本,新版本仅限于对严重影响实例安全和稳定的问题进行修复。由于MySQL社区对安全类问题进行了保密处理,华为云FlexusRDS并不能承诺修复所有严重的安全和稳定性问题。 FlexusRDS基于MySQL开源社区提供数据库云服务,本文将为您介绍FlexusRDS的版本策略,您可以根据此信息进行规划,在创建实例、数据迁移等操作时选择更合适的目标版本。 华为云延长支持停止时间,是为用户迁移业务提供更充裕的时间。数据迁移的具体操作,请参见数据迁移。 华为云对FlexusRDS内核的支持停止时间参见表1。 表1中的部分时间为预计时间,将会在生命周期结束或FlexusRDS停止支持前进行修正,请以实际时间为准。 FlexusRDS产品生命周期结束后,将不再售卖,并且对存量实例不提供维护服务(例如漏洞补丁修改等),不支持规格扩容。 请您提前制定版本升级或者数据迁移等操作的计划。 表1 FlexusRDS生命周期 版本号 社区发布时间 社区生命周期结束时间 华为云发布时间 华为云EOM(停止销售)时间 华为云EOS(停止服务)时间 5.7 2015年10月21日 2023年10月25日 2018年3月 2024年12月30日 2025年6月30日 8.0 2018年9月14日 2026年4月 2019年2月 2030年08月30日 - 以上FlexusRDS生命周期发布时间是2024-08-30。
  • 修订记录 发布日期 修订记录 2024-03-30 新增支持资源池详情页新增、编辑和删除标签:购买资源池 新增支持节点重置功能:查看资源池详情 新增支持节点释放功能:查看资源池详情 新增支持存量资源池调整DockerSize:扩缩容资源池 资源池列表新增节点标签:ModelArts节点 2023-12-29 新增支持根据资源ID进行筛选资源池:查看资源池详情 新增设置续费策略:设置续费策略 新增调整到期策略:调整到期策略 新增支持逻辑资源池驱动升级:资源池驱动升级 新增支持1个VPC下多个子网的打通:ModelArts网络 2023-10-01 创建专属资源池新增网段参数:购买资源池。 创建专属资源池新增控制节点分布参数:购买资源池。 专属资源池支持IPv6:购买资源池。 专属资源池新增替换节点功能:查看资源池详情。 新增节点故障隔离码列表:资源池异常处理。 新增资源管理支持审计的关键操作列表:资源管理支持审计的关键操作列表
  • 操作流程 Grafana支持灵活而又复杂多样的监控视图和模板,可以满足绝大部分情况下用户的诉求。将Grafana的数据源配置完成后,就可以通过Grafana查看 AOM 保存的所有ModelArts的所有指标。 通过Grafana插件查看AOM中的监控指标的操作流程如下: 安装配置Grafana 安装配置Grafana有在Windows上安装配置Grafana、在Linux上安装配置Grafana和在Notebook上安装配置Grafana三种方式,请您根据实际情况选择。 配置Grafana数据源 使用Grafana配置Dashboards,查看指标数据 父主题: 使用Grafana查看AOM中的监控指标
  • 创建Dashboards查看指标 打开“DashBoards”,单击“New”,选择“New Dashboards”。 在New Dashboards界面,单击“Add a new panel”。 在New dashboard /Edit Panel界面,填写如下参数。 Data source:已配置Grafana数据源; Metric:指标名称,可参考表1、表2、表3获取想要查询的指标; Labels:填写过滤该指标的标签,请参考表4。 图10 创建Dashboards查看指标
  • 准备工作 ModelArts提供了集群视图,节点视图,用户视图,任务视图,任务详细视图这5个模板,这些模板在Grafana官方文档可以搜索下载,您导入模板配置Dashboards时,可直接使用。 表1 模板下载地址 模板名称 下载地址 集群视图 https://cnnorth4-modelarts-sdk.obs.cn-north-4.myhuaweicloud.com/metrics/grafana/dashboards/ModelArts-Cluster-View.json 节点视图 https://cnnorth4-modelarts-sdk.obs.cn-north-4.myhuaweicloud.com/metrics/grafana/dashboards/ModelArts-Node-View.json 用户视图 https://cnnorth4-modelarts-sdk.obs.cn-north-4.myhuaweicloud.com/metrics/grafana/dashboards/ModelArts-User-View.json 任务视图 https://cnnorth4-modelarts-sdk.obs.cn-north-4.myhuaweicloud.com/metrics/grafana/dashboards/ModelArts-Task-View.json 任务详细视图 https://cnnorth4-modelarts-sdk.obs.cn-north-4.myhuaweicloud.com/metrics/grafana/dashboards/ModelArts-Task-Detail-View.json
  • 操作步骤 将本地命令拷贝至E CS 服务器请参考如下方法: 在ECS桌面单击“复制粘贴”,使用快捷键“Ctrl+V”将命令粘贴至窗口中并单击“发送”,将复制的命令发送至命令行窗口,如下图所示。 图3 复制粘贴按钮 图4 粘贴并发送安装命令 登录弹性云服务器。根据需要选择登录方式,具体操作请参考登录弹性云服务器 。 执行如下命令安装libfontconfig1。 sudo apt-get install -y adduser libfontconfig1 回显如下代表执行成功: 执行如下命令下载Grafana安装包。 wget https://dl.grafana.com/oss/release/grafana_9.3.6_amd64.deb --no-check-certificate 下载完成: 执行如下命令安装Grafana。 sudo dpkg -i grafana_9.3.6_amd64.deb 执行命令启动Grafana。 sudo /bin/systemctl start grafana-server 在本地PC访问Grafana配置。 确保ECS绑定了弹性公网IP,且对应配置正确(入方向放开TCP协议的3000端口,出方向全部放通)。设置如下: 单击ECS服务器名称进入详情页,单击“安全组”页签,单击“配置规则”。 单击“入方向规则”,入方向放开TCP协议的3000端口,出方向默认全部放通。 在浏览器中输入“http://{弹性公网IP}:3000”,即可进行访问。首次登录用户名和密码为admin,登录成功后请根据提示修改密码。
  • 操作步骤 下载Grafana安装包。 进入下载链接,单击Download the installer,等待下载成功即可。 安装Grafana。 双击安装包,按照指示流程安装完成即可。 在Windows的“服务”中,找到Grafana,将其开启,如果已经开启,则直接进入4。 登录Grafana。 Grafana默认在本地的3000端口启动,打开链接http://localhost:3000,出现Grafana的登录界面。首次登录用户名和密码为admin,登录成功后请根据提示修改密码。
  • 概述 您可以通过以下方式查看监控指标: 在ModelArts控制台查看监控指标:您在可ModelArts总览页或各模块资源监控页签查看ModelArts监控指标。 在AOM控制台查看ModelArts所有监控指标:ModelArts上报的所有指标都保存在AOM中,用户可以通过AOM服务提供的指标消费和使用的能力来进行指标消费。设置指标阈值告警、告警上报等,都可以直接在AOM控制台查看。 使用Grafana查看AOM中的监控指标:使用Grafana等可视化工具来查看与分析,Grafana支持灵活而又复杂多样的监控视图和模板,为用户提供基于网页仪表面板的可视化监控效果,使用户更加直观地查看到实时资源使用情况。 父主题: 资源监控
  • 操作步骤 登录 云审计 服务管理控制台。 在管理控制台左上角单击图标,选择区域。 在左侧导航栏中,单击“事件列表”,进入“事件列表”页面。 事件列表支持通过筛选来查询对应的操作事件。当前事件列表支持四个维度的组合查询,详细信息如下: 事件来源、资源类型和筛选类型。 在下拉框中选择查询条件。 其中筛选类型选择事件名称时,还需选择某个具体的事件名称。 选择资源ID时,还需输入某个具体的资源ID。 选择资源名称时,还需选择或手动输入某个具体的资源名称。 操作用户:在下拉框中选择某一具体的操作用户,此操作用户指用户级别,而非租户级别。 事件级别:可选项为“所有事件级别”、“normal”、“warning”、“incident”,只可选择其中一项。 时间范围:可选择查询最近七天内任意时间段的操作事件。 在需要查看的事件左侧,单击展开该事件的详细信息。 单击需要查看的事件“操作”列的“查看事件”,可以在弹窗中查看该操作事件结构的详细信息。 更多关于云审计服务事件结构的信息,请参见《云审计服务用户指南》。
  • 资源管理支持审计的关键操作列表 表7 资源管理支持审计的关键操作列表 操作名称 资源类型 事件名称 创建资源池 PoolV2 CreatePoolV2 删除资源池 PoolV2 DeletePoolV2 更新资源池 PoolV2 UpdatePoolV2 创建网络 NetworksV1 CreateNetworksV1 删除网络 NetworksV1 DeleteNetworksV1 更新网络 NetworksV1 UpdateNetworksV1
  • 训练作业支持审计的关键操作列表 表3 训练作业支持审计的关键操作列表 操作名称 资源类型 事件名称 创建训练作业 ModelArtsTrainJob createModelArtsTrainJob 创建训练作业版本 ModelArtsTrainJob createModelArtsTrainVersion 停止训练作业 ModelArtsTrainJob stopModelArtsTrainVersion 更新训练作业描述 ModelArtsTrainJob updateModelArtsTrainDesc 删除训练作业版本 ModelArtsTrainJob deleteModelArtsTrainVersion 删除训练作业 ModelArtsTrainJob deleteModelArtsTrainJob 创建训练作业参数 ModelArtsTrainConfig createModelArtsTrainConfig 更新训练作业参数 ModelArtsTrainConfig updateModelArtsTrainConfig 删除训练作业参数 ModelArtsTrainConfig deleteModelArtsTrainConfig 创建可视化作业 ModelArtsTensorboardJob createModelArtsTensorboardJob 删除可视化作业 ModelArtsTensorboardJob deleteModelArtsTensorboardJob 更新可视化作业描述 ModelArtsTensorboardJob updateModelArtsTensorboardDesc 停止可视化作业 ModelArtsTensorboardJob stopModelArtsTensorboardJob 重启可视化作业 ModelArtsTensorboardJob restartModelArtsgTensorboardJob
  • AI应用管理支持审计的关键操作列表 表4 AI应用管理支持审计的关键操作列表 操作名称 资源类型 事件名称 创建AI应用 model addModel 更新AI应用 model updateModel 删除AI应用 model deleteModel 添加转换任务 convert addConvert 更新转换任务 convert updateConvert 删除转换任务 convert deleteConvert
  • 服务管理支持审计的关键操作列表 表5 服务管理支持审计的关键操作列表 操作名称 资源类型 事件名称 部署服务 service addService 删除服务 service deleteService 更新服务 service updateService 启停服务 service startOrStopService 启停边缘服务节点 service startOrStopNodesService 添加用户访问密钥 service addAkSk 删除用户访问密钥 service deleteAkSk 创建专属资源池 cluster createCluster 删除专属资源池 cluster deleteCluster 添加专属资源池节点 cluster addClusterNode 删除专属资源池节点 cluster deleteClusterNode 获取专属资源池创建结果 cluster createClusterResult
  • AI Gallery支持审计的关键操作列表 表6 AI Gallery支持审计的关键操作列表 操作名称 资源类型 事件名称 发布资产 ModelArts_Market create_content 修改资产信息 ModelArts_Market modify_content 发布资产新版本 ModelArts_Market add_version 订阅资产 ModelArts_Market subscription_content 收藏资产 ModelArts_Market star_content 取消收藏资产 ModelArts_Market cancel_star_content 点赞资产 ModelArts_Market like_content 取消点赞资产 ModelArts_Market cancel_like_content 发布实践 ModelArts_Market publish_activity 报名实践 ModelArts_Market regist_activity 修改个人资料 ModelArts_Market update_user
  • 开发环境支持审计的关键操作列表 表2 开发环境支持审计的关键操作列表 操作名称 资源类型 事件名称 创建Notebook Notebook createNotebook 删除Notebook Notebook deleteNotebook 打开Notebook Notebook openNotebook 启动Notebook Notebook startNotebook 停止Notebook Notebook stopNotebook 更新Notebook Notebook updateNotebook 删除NotebookApp NotebookApp deleteNotebookApp 切换CodeLab规格 NotebookApp updateNotebookApp
  • 数据管理支持审计的关键操作列表 表1 数据管理支持审计的关键操作列表 操作名称 资源类型 事件名称 创建数据集 dataset createDataset 删除数据集 dataset deleteDataset 更新数据集 dataset updateDataset 发布数据集版本 dataset publishDatasetVersion 删除数据集版本 dataset deleteDatasetVersion 同步数据源 dataset syncDataSource 导出数据集 dataset exportDataFromDataset 创建自动标注任务 dataset createAutoLabelingTask 创建自动分组任务 dataset createAutoGroupingTask 创建自动部署任务 dataset createAutoDeployTask 导入样本到数据集 dataset importSamplesToDataset 创建数据集标签 dataset createLabel 更新数据集标签 dataset updateLabel 删除数据集标签 dataset deleteLabel 删除数据集标签和对应的样本 dataset deleteLabelWithSamples 添加样本 dataset uploadSamples 删除样本 dataset deleteSamples 停止自动标注任务 dataset stopTask 创建团队标注任务 dataset createWorkforceTask 删除团队标注任务 dataset deleteWorkforceTask 启动团队标注验收的任务 dataset startWorkforceSamplingTask 通过/驳回/取消验收任务 dataset updateWorkforceSamplingTask 提交验收任务的样本评审意见 dataset acceptSamples 给样本添加标签 dataset updateSamples 发送邮件给团队标注任务的成员 dataset sendEmails 接口人启动团队标注任务 dataset startWorkforceTask 更新团队标注任务 dataset updateWorkforceTask 给团队标注样本添加标签 dataset updateWorkforceTaskSamples 团队标注审核 dataset reviewSamples 创建标注成员 workforce createWorker 更新标注成员 workforce updateWorker 删除标注成员 workforce deleteWorker 批量删除标注成员 workforce batchDeleteWorker 创建标注团队 workforce createWorkforce 更新标注团队 workforce updateWorkforce 删除标注团队 workforce deleteWorkforce 自动创建 IAM 委托 IAM createAgency 标注成员登录labelConsole标注平台 labelConsoleWorker workerLoginLabelConsole 标注成员登出labelConsole标注平台 labelConsoleWorker workerLogOutLabelConsole 标注成员修改labelConsole平台密码 labelConsoleWorker workerChangePassword 标注成员忘记labelConsole平台密码 labelConsoleWorker workerForgetPassword 标注成员通过url重置labelConsole标注密码 labelConsoleWorker workerResetPassword
  • 打通VPC(可选) 通过打通VPC,可以方便用户跨VPC使用资源,提升资源利用率。 在“网络”页签,单击网络列表中某个网络操作列的“打通VPC”。 图4 打通VPC 在打通VPC弹框中,打开“打通VPC”开关,在下拉框中选择可用的VPC和子网。 需要打通的对端网络不能和当前网段重叠。 图5 打通VPC参数选择 如果没有VPC可选,可以单击右侧的“创建虚拟私有云”,跳转到网络控制台,申请创建虚拟私有云。 如果没有子网可选,可以单击右侧的“创建子网”,跳转到网络控制台,创建可用的子网。 支持1个VPC下多个子网的打通,若VPC下有多个子网,会显示“+”,您可单击“+”即可添加子网(上限10个)。 若需要使用打通VPC的方式实现专属资源池访问公网,由于要访问的公网地址不确定,一般是建议用户在VPC中创建SNAT。此场景下,在打通VPC后,专属资源池中作业访问公网地址,默认不能转发到用户VPC的SNAT,需要提交工单联系技术支持在专属资源池VPC的路由中添加指向对等连接的缺省路由。当您开启默认路由后,在打通VPC时,会将ModelArts网络0.0.0.0/0路由作为默认路由,此时无需提交工单添加缺省路由即可完成网络配置。
  • ModelArts网络与VPC介绍 ModelArts网络是承载ModelArts资源池节点的网络连接,基于华为云的VPC进行封装,对用户仅提供网络名称以及CIDR网段的选择项,为了防止在打通VPC的时候有网段的冲突,因此提供了多个CIDR网段的选项,用户可以根据自己的实际情况进行选择。 虚拟私有云VPC 是一套为实例构建的逻辑隔离的、由用户自主配置和管理的虚拟网络环境。为云服务器、云容器、云数据库等资源构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户资源的安全性,简化用户的网络部署。
  • 场景介绍 当专属资源池中的节点含有GPU/Ascend资源时,用户基于自己的业务,可能会有自定义GPU/Ascend驱动的需求,ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。 驱动升级有两种升级方式:安全升级、强制升级。 安全升级:不影响正在运行的业务,开始升级后会先将节点进行隔离(不能再下发新的作业),待节点上的存量作业运行完成后再进行升级,因需要等待作业完成,故升级周期可能比较长。 强制升级:忽略资源池中正在运行的作业,直接进行驱动升级,可能会导致运行中作业失败,需谨慎选择。
  • 场景介绍 ModelArts含有许多“作业”类型(作业为统称,并非单指训练作业),其中有一部分是可以运行在专属资源池上的,包括“训练”、“推理”服务及“Notebook”开发环境。 专属资源池提供了动态设置作业类型的功能,您可以在创建资源池时、创建完成后,对资源池支持的作业类型进行编辑(新增或减少)。当前支持的“作业类型”有“训练作业”、“推理服务”和“开发环境”,用户可按需自行选择。 设置某一作业类型后,即可在此专属资源池中下发此种类型的作业,没有设置的作业类型不能下发。 为了支持不同的作业类型,后台需要在专属资源池上进行不同的初始化操作,例如安装插件、设置网络环境等。其中部分操作需要占据资源池的资源,导致用户实际可用资源减少。因此建议用户按需设置,避免不必要的资源浪费。
  • 场景介绍 当专属资源池创建完成,使用一段时间后,由于用户AI开发业务的变化,对于资源池资源量的需求可能会产生变化,面对这种场景,ModelArts专属资源池提供了扩缩容功能,用户可以根据自己的需求动态调整。 使用扩容功能时,可以增加资源池已有规格的节点数量。 使用缩容功能时,可以减少资源池已有规格的节点数量。 缩容操作可能影响到正在运行的业务,建议用户在业务空窗期进行缩容,或进入资源池详情页面,在指定空闲的节点上进行删除来实现缩容。
共100000条