检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AI开发基本概念 机器学习常见的分类有3种: 监督学习:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。常见的有回归和分类。 非监督学习:在未加标签的数据中,试图找到隐藏的结构。常见的有聚类。 强化学习:智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。
Standard自动学习 使用ModelArts Standard自动学习实现口罩检测 使用ModelArts Standard自动学习实现垃圾分类
自由模式:可以不按顺序学习课件,可随意选择一个开始学习 解锁模式:设置一个时间,按时间进程解锁学习,解锁模式中暂时不支持添加线下课和岗位测评 图4 选择模式 阶段任务 图5 阶段任务 指派范围:选择该学习任务学习的具体学员 图6 指派范围1 图7 指派范围2 设置:对学习任务进行合格标准、奖励等设置
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS多方安全计算进行联合样本分布统计
如何获得华为云开发者认证证书 开发者认证总流程如图1和表1所示。购买认证后,仅需完成在线学习和实验练习,并通过理论和实验考试,即可获得开发者认证证书。 图1 开发者认证流程 表1 开发者认证流程说明 步骤 说明 1 购买认证 进入华为云开发者认证页面选择自己需要的开发者认证,在认
基因容器基于Kubernetes智能化基因计算任务调度和Spark等加速服务,为您提供低成本高性能的基因测序解决方案。支持对接深度学习框架,方便您深度解读报告。 秒级并发 基因容器利用容器技术的秒级并发能力,可将WGS从30小时缩短至5小时以内,对比同类竞品,使用相同样本的情况下,资源利用率大幅提升。 简单易用
模型。 在“参数配置”填写“学习率”、“训练轮次”和“分批训练样本数”。 “学习率”用来控制模型的学习速度,范围为(0,1]。 “训练轮次”指模型训练中遍历数据集的次数。 “分批训练样本数”又叫批尺寸(Batch Size),指一次训练所抓取的数据样本数量,影响训练速度及模型优化效果。
联邦学习作业管理 执行ID选取截断 执行纵向联邦分箱和IV计算作业 执行样本对齐 查询样本对齐结果 父主题: 计算节点API
型。 图1 模型部署 模型部署完成后,单击“发起预测”,在系统弹窗中填写要预测的“样本id”和“模型特征”对应的数值,然后单击“预测”,就会有系统弹窗弹出,显示预测结果。 注意:样本id从创建作业选择数据集的样本id列获取。 图2 发起预测 父主题: 实时预测
产品优势 检测准确 基于深度学习技术和大量的样本库,帮助客户快速准确进行违规内容检测,维护内容安全。 功能丰富 提供文本、图像、音频、视频等内容检测,覆盖涉黄、广告、涉暴等多种违规风险的内容检测。 稳定可靠 内容审核服务已成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验。
执行ID选取截断 功能介绍 执行ID选取截断(样本粗筛) 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/leagues/{league_id}/fl-vertical-jobs/{job_id}/idTruncation 表1 路径参数 参数
确认学习结果 HSS学习完白名单策略关联的服务器后,输出的学习结果中可能存在一些特征不明显的可疑进程需要再次进行确认,您可以手动或设置系统自动将这些可疑进程确认并分类标记为可疑、恶意或可信进程。 学习结果确认方式,在创建白名单策略时可设置: “学习结果确认方式”选择的“自动确认可
课程学习 前提条件 用户具有课程发布权限 操作步骤-电脑端 登录ISDP系统,选择“作业人员->学习管理->我的学习”并进入,查看当前可以学习的课程。 图1 我的学习入口 在“我的学习”的页面,点击每个具体的课程卡片,进入课程详情页面。可以按学习状态(未完成/已完成)、学习类型(
您的标注信息,保证标注多标签的图片,超过2张。 数据集切分后,训练集和验证集包含的标签类别不一样。出现这种情况的原因:多标签场景下时,做随机数据切分后,包含某一类标签的样本均被划分到训练集,导致验证集无该标签样本。由于这种情况出现的概率比较小,可尝试重新发布版本来解决。 ModelArts
每一类数据尽量多,尽量均衡。期望获得良好效果,图像分类项目中,至少有两种以上的分类,每种分类的样本不少于20张。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 数据上传至OBS 在本文档中,采用通过OBS管理控制台将数据上传至OBS桶。 上传OBS的文件规范:
确保OBS中的数据存在 如果存储在OBS中的图片或数据被删除,且未同步至ModelArts自动学习或数据集中,则会导致任务失败。 建议前往OBS检查,确保数据存在。针对图像分类、声音分类、文本分类、物体检测等类型,可在自动学习的数据标注页面,单击“同步数据源”,将OBS中的数据重新同步至ModelArts中。
自动学习生成的模型,存储在哪里?支持哪些其他操作? 模型统一管理 针对自动学习项目,当模型训练完成后,其生成的模型,将自动进入“模型管理”页面,如下图所示。模型名称由系统自动命名,前缀与自动学习项目的名称一致,方便辨识。 自动学习生成的模型,不支持下载使用。 图1 自动学习生成的模型
自动学习简介 自动学习功能介绍 ModelArts自动学习是帮助人们实现模型的低门槛、高灵活、零代码的定制化模型开发工具。自动学习功能根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型。开发者无需专业的开发基础和编码能力,只需上传数据,通过自动学习界面引导和简单操作即可完成模型训练和部署。
数据量足够,为什么盘古大模型微调效果仍然不好 这种情况可能是由于以下原因导致的,建议您排查: 数据质量:请检查训练数据的质量,若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差,都将影响模型训练的效果,建议提升您的数据质量。 父主题: 大模型微调训练类问题
迁移学习 如果当前数据集的特征数据不够理想,而此数据集的数据类别和一份理想的数据集部分重合或者相差不大的时候,可以使用特征迁移功能,将理想数据集的特征数据迁移到当前数据集中。 进行特征迁移前,请先完成如下操作: 将源数据集和目标数据集导入系统,详细操作请参见数据集。 创建迁移数据