搜索_华为云

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

result.saveAsTextFile(outputPath) #停止SparkContext sc.stop() 需要将编码格式设置为“UTF-8”，否则后续脚本运行时会报错。准备数据文件“in.txt”，内容为一段英文单词。操作步骤：将脚本和数据文件传入OBS桶中，如下图。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
管理并查看CDM监控指标 - 数据治理中心 DataArts Studio

管理并查看CDM监控指标 CDM支持的监控指标设置CDM告警规则查看CDM监控指标父主题：创建并管理CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
自然周期调度之同周期依赖原理 - 数据治理中心 DataArts Studio

小时依赖小时规则：每个自然小时周期内的实例产生依赖，区间边界是自然小时[00:00,00:59]。举例1：A依赖B，在同自然小时内，无论A、B设置在什么时间点执行，A永远在B之后执行。图7 小时依赖小时举例一举例2：A依赖B，A在每小时5分0秒执行，B在12分执行，A会等B执行完成后执行。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践 > 周期调度依赖策略
申请API授权 - 数据治理中心 DataArts Studio

单击待绑定应用的API名称，进入API信息页面。在“调用信息”页面，单击“申请权限”。在申请权限页面，设置使用截止时间、选择应用，然后单击“确认”，完成API的权限申请。如果生成API时设置入参位置为Static，则还需设置静态参数值。如果未配置Static参数值，则SDK调用时会使用API入参默认值

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API
查看数据质量报告 - 数据治理中心 DataArts Studio

业务报告的统计范围是依据数据架构主题关联匹配的质量作业运行的结果，包含主题域、主题域分组、业务对象、表名、评分等信息。查看技术报告数据质量评分质量评分的满分可设置为5分，10分，100分。默认为5分制，是以表关联的规则为基础进行评分的。而表、数据库等不同维度的评分均基于规则评分，本质上是基于规则评分在不同维度下的加权平均值进行计算的。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
Sub Job - 数据治理中心 DataArts Studio

父作业的环境变量读取替换。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
创建并配置简单模式工作空间 - 数据治理中心 DataArts Studio

创建并配置简单模式工作空间创建简单模式工作空间设置工作空间配额（可选）修改作业日志存储路径父主题：购买并配置DataArts Studio

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio
CloudTable连接参数说明 - 数据治理中心 DataArts Studio

cloudtable.com:2181 IAM统一身份认证如果所需连接的CloudTable集群在创建时开启了“IAM统一身份认证”，该参数需设置为“是”，否则设置为“否”。当选择IAM统一身份认证时，需要输入用户名、AK和SK。否用户名登录CloudTable集群的用户名。 admin

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置DIS源端参数 - 数据治理中心 DataArts Studio

DIS的通道名。 dis 是否持久运行用户自定义是否永久运行。设置为长久运行的任务，如果DIS系统发生中断，任务也会失败结束。是 DIS分区ID DIS分区ID，该参数支持输入多个分区ID，使用英文逗号（,）分隔。 0,1,2 偏移量参数设置从DIS拉取数据时的初始偏移量：最新：最大偏移量，即拉取最新的数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。如何调整抽取并发数集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议规格名称 vCPUs/内存集群并发数上限参考

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
ROMA FDI Job - 数据治理中心 DataArts Studio

Studio支持跨资源空间选择FDI任务。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

FusionInsight LibrA过程中，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。因此，在单表或整库导入到DWS/FusionInsight

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
创建补数据实例 - 数据治理中心 DataArts Studio

是否按照天粒度补数据，true表示是，false表示否。 priority 否 int 设置补数据作业的优先级。当系统资源不充足时，可以优先满足优先级较高的作业的计算资源，数字越大优先级越高，当前只支持对DLI SQL算子设置优先级。 is_stop_when_fail 否 Boolean 补数据

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
目的端为关系数据库 - 数据治理中心 DataArts Studio

先导入阶段表，如果设置为“true”，数据导入目的表之前会把数据先导入阶段表，如果成功导入阶段表，则再从阶段表导入到目的表，这样避免导入过程失败，在目的表遗留部分成功数据。 toJobConfig.extendCharLength 否 Boolean 扩大字符字段长度，如果设置为“tru

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
DORIS SQL - 数据治理中心 DataArts Studio

填写数据库名称，该数据库已创建好，建议不要使用默认数据库。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
新建数据标准 - 数据治理中心 DataArts Studio

下划线，且以英文字母开头。数据长度设置数据长度：可以为空。数据长度为空时，对数据长度不做限制。选择可以设置为具体的数值。输入1~10000之间的数值。选择可以设置为一个范围。输入数据范围的临界值，输入值范围1~10000。如果设置了数据长度标准，当数据类型为STRIN

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 标准设计
MRS MapReduce - 数据治理中心 DataArts Studio

否选择输出数据存储的路径。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
CSS - 数据治理中心 DataArts Studio

否选择输出数据的存储路径。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
GBase SQL - 数据治理中心 DataArts Studio

选择数据库名称，该数据库已创建好，建议不要使用默认数据库。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置ElasticSearch源端参数 - 数据治理中心 DataArts Studio

配置ElasticSearch源端参数表1 ElasticSearch作为源端时的作业参数参数类型参数名说明是否必须填取值样例基本参数索引类似关系数据库的schema或数据库名称，整库迁移多索引以逗号分隔。支持输入索引别名。支持输入通配符表达式(*)。如果选择了多个索引，索引的结构必须一致。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数

总条数： 759

上一页
1
...
18
19
20
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

管理并查看CDM监控指标 - 数据治理中心 DataArts Studio

自然周期调度之同周期依赖原理 - 数据治理中心 DataArts Studio

申请API授权 - 数据治理中心 DataArts Studio

查看数据质量报告 - 数据治理中心 DataArts Studio

Sub Job - 数据治理中心 DataArts Studio

创建并配置简单模式工作空间 - 数据治理中心 DataArts Studio

CloudTable连接参数说明 - 数据治理中心 DataArts Studio

配置DIS源端参数 - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

ROMA FDI Job - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

创建补数据实例 - 数据治理中心 DataArts Studio

目的端为关系数据库 - 数据治理中心 DataArts Studio

DORIS SQL - 数据治理中心 DataArts Studio

新建数据标准 - 数据治理中心 DataArts Studio

MRS MapReduce - 数据治理中心 DataArts Studio

CSS - 数据治理中心 DataArts Studio

GBase SQL - 数据治理中心 DataArts Studio

配置ElasticSearch源端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线