检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据开发 概述与连接管理 脚本开发 作业开发 实例管理、补数据监控及配置环境变量 父主题: 实施步骤
语料导入模板中的必填项为:问题类别、问题、答案。 图1 问答语料导入模板 问题类别:用于对语料进行分类。 问题规则:可使用“[]”、“|” 分隔不同词语片段,或使用“*”通配占位。例如,*查[下|一下][北京|上海]的天气*。 答案标签:主要是针对多答案问题时,可对答案设置标签,使不同用户可以看到不同的答案。 父主题:
称,进入规则详情页面。 配置规则的数据源端。 单击“数据源端”下的“创建数据源端”,增加一条数据源端配置。 配置数据源端相关信息,完成后单击“保存”。 表2 数据源端配置 参数 配置说明 产品名称 选择设备所属的产品。 设备名称 选择要转发数据的设备,可以选择指定设备或全部设备。
数据开发 项目创建 数据开发项目需为开发环境和生产环境配置数据鉴权模式,选择计算资源组,同时可以指定运行账号及运行队列。 图1 项目创建 离线任务开发 离线数据开发支持 HiveSQL、ImpalaSQL、SparkSQL、Python、Shell、Jar、Spark 等任务类型。
如何切分ModelArts数据集? 在发布数据集时,仅“图像分类”、“物体检测”、“文本分类”和“声音分类”类型数据集支持进行数据切分功能。 一般默认不启用该功能。启用后,需设置对应的训练验证比例。 输入“训练集比例”,数值只能是0~1区间内的数。设置好“训练集比例”后,“验证集
Region内集群容灾 智能运维 数据库用户管理 运维账户 集群日志管理 启停集群 资源负载管理 资源管理 逻辑集群管理 实时/历史TopSQL查询 数据源管理 管理MRS数据源 管理OBS数据源 管理LakeFormation数据源 06 使用数据库 数据库开发指南重点面向数据库的设计者、应用程
G)配置为4。 表每行数据大小为1MB以下的可以多并发抽取,超过1MB的建议单线程抽取数据。 是否写入脏数据:建议配置为“是”,然后参考图10配置相关参数。脏数据是指与目的端字段不匹的数据,该数据可以被记录到指定的OBS桶中。用户配置脏数据归档后,正常数据可以写入目的端,迁移作业不会因脏数据中断。
Studio实例控制台,登录DataArts Studio管理控制台。 在DataArts Studio控制台首页,选择对应工作空间的“数据开发”模块,进入数据开发页面。 在数据开发组件,进入“数据开发 > 作业开发”页签,单击需要手动配置血缘关系的作业名,打开作业画布。 单击作业画布中的MRS Spark节点,并切换到“血缘关系”页签。
大数据 大数据是指规模庞大且复杂的数据集合,对于企业来说,如何收集、存储和分析大数据具有重要意义。以下是大数据如何使能业务创新、与业务结合并推动业务现代化的几个方面: 数据驱动决策:大数据分析可以帮助企业从海量数据中提取有价值的信息和洞察力,为决策提供支持。通过对历史数据和实时数
华为数据治理实践 华为数据治理的规范流程建设,完成了从数据产生、数据整合、数据分析与数据消费全价值流的规则制定。华为数据治理组织实践,建立实体化的数据管理组织,向公司数据管理部汇报,同时组建了跨领域数据联合作战团队。华为已建立统一的数据分类管理框架,指导各领域进行分类管理。华为信
开发者联盟授权认证 已经在华为开发者联盟认证过的华为账号用户,可以登录华为云并开通华为云业务后,在实名认证页面进行授权认证。 操作步骤 进入“实名认证”页面,选择“开发者联盟授权认证”。 如果提示“您在开发者联盟未实名认证,请选择其它认证方式。”,表示无法使用开发者联盟授权认证,请使用个人实名认证或企业实名认证。
对接大数据平台 支持的大数据平台简介 华为云MRS对接OBS Cloudera CDH对接OBS Hortonworks HDP对接OBS 父主题: 大数据场景下使用OBS实现存算分离
数据开发 使用GaussDB(DWS)冷热数据切换功能降低业务成本 使用GaussDB(DWS)分区自动管理功能降低电商和物联网行业数据分区维护成本 使用GaussDB(DWS)视图重建功能实现视图解耦以提升开发效率 HStore表使用优秀实践 GIN索引使用实践 实现数据列的加解密
更新云服务器元数据 功能介绍 更新云服务器元数据。 如果元数据中没有待更新字段,则自动添加该字段。 如果元数据中已存在待更新字段,则直接更新字段值。 如果元数据中的字段不在请求参数中,则保持不变 如果元数据中包含了敏感数据,您应当采取适当的措施来保护敏感数据,比如限制访问范围、加密等。
没有模型的问答和基于标注数据训练了模型的区别 训练模型会将问答进行优化训练得到最佳回答效果,没有模型的问答只是基于标准问和答案匹配结果。 父主题: 智能问答机器人
数据管理 数据集管理 数据集版本管理 样本管理 导入任务管理 导出任务管理 Manifest管理 标注任务管理
数据开发 数据连接 父主题: 效能洞察(CodeArts Board)
数据目录如何可视化展示数据血缘? 数据血缘在数据目录中展示,首先要完成元数据采集任务,其次数据开发作业中要包含支持自动血缘解析的节点类型和场景,或者在作业节点中已自定义血缘关系的输入表和输出表。当存在运行成功的数据开发作业调度任务时,系统会生成作业中的血缘关系,并在数据目录中进行可视化展示。
监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据开发 > 数据开发”,进入“数据开发”页面。 选择“数据治理 > 指标仓库”。 单击逻辑主体后的“新建”。 配置逻辑主体参数,参数说明如表1所示,配置完成后,单击“确定”。 表1 配置逻辑主体参数说明 参数类型 参数名称 参数说明 基本信息
or pause怎么办? 如何创建数据库和数据表,数据库对应的是不是数据连接? 为什么执行完HIVE任务什么结果都不显示? 在作业监控页面里的“上次实例状态”只有运行成功、运行失败,这是为什么? 如何创建通知配置对全量作业都进行结果监控? 数据开发的并行执行节点数是多少? DataArts