搜索_华为云

DLI Spark - 数据治理中心 DataArts Studio

DLI程序包：作业执行前，会将资源包文件上传到DLI资源管理。分组设置否当“资源类型”选择了“DLI程序包”时，需要设置。可选择“已有分组”，“创建新分组”或“不分组”。组名称否当“资源类型”选择了“DLI程序包”时，需要设置。选择“已有分组”：可选择已有的分组。选择“创建新分组”：可输入自定义的组名称。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置CDM作业定时任务 - 数据治理中心 DataArts Studio

荐您启用数据开发调度即可，无需配置CDM定时任务。定时任务功能原理：采用Java Quartz定时器，类似Cron表达式配置。对起始时间解析出分，小时，天，月。构造出cronb表达式。以配置天调度为例：重复周期选择1天：若当前时间2022/10/14 12:00，配置起始时间为2022/10/14

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
数据开发API（V2）概览 - 数据治理中心 DataArts Studio

10 查询发布包列表用于查询发布包的列表信息。 100 10 查询指定发布包详情用于查询指定的发布包详情信息。 100 10 设置作业标签此设置作业标签。 100 10 查询告警通知记录查询指定时间段内的告警通知记录。 100 10 发布任务包目前支持发布包管理中相关包的发布，支持发布多个任务包。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > API概览
管理工作空间 - 数据治理中心 DataArts Studio

管理工作空间创建并管理工作空间设置工作空间配额（可选）修改作业日志存储路径

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作
（可选）购买规格增量包 - 数据治理中心 DataArts Studio

“操作 > 配额使用量”，查看每个工作空间的配额使用量。设置配额使用量阈值告警购买规格增量包前，您可以设置配额使用量阈值告警。当触发告警时，表明您应当购买规格增量包，否则随着业务量增长，您的业务可能会受到影响。设置配额使用量阈值告警的操作方法如下所示：在DataArts Studio实例卡片上，单击选择“更多

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
身份认证与访问控制 - 数据治理中心 DataArts Studio

发责任人、运维管理员设置为管理员角色。开发者：开发者拥有工作空间内创建、管理工作项的业务操作权限。建议将任务开发、任务处理的用户设置为开发者。运维者：运维者具备工作空间内运维调度等业务的操作权限，但无法更改工作项及配置。建议将运维管理、状态监控的用户设置为运维者。访客：访客

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 安全
管理API - 数据治理中心 DataArts Studio

管理API API版本管理设置API可见停用/恢复API 下线/删除API 复制API 同步API 全量导出/导出/导入API 父主题：开发数据服务API

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API
HDFS连接参数说明 - 数据治理中心 DataArts Studio

连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 mrs_hdfs_link Manager IP MRS Manager的浮动IP地址，可以单击输入框后的“选择”来选定已创建的MRS集群，CDM会自动填充下面的鉴权参数。说明：当前DataArts Studio不支持对

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置作业调度为年调度 - 数据治理中心 DataArts Studio

> 作业开发”。任务配置为月调度，如下图：图1 调度周期配置为月在节点的连线上，单击右键，选择设置条件，配置条件表达式。通过表达式来判断，是否执行后续的业务节点。图2 设置条件表达式表达式配置方法如下所示。 #{DateUtil.getMonth(Job.planTime)

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。如何调整抽取并发数集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议规格名称 vCPUs/内存集群并发数上限参考

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

_cluster”，为Spark作业提供运行所需的物理资源。获取Spark作业代码本示例使用的Spark作业代码来自maven库（下载地址：https://repo.maven.apache.org/maven2/org/apache/spark/spark-examples_2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
DLI Flink Job - 数据治理中心 DataArts Studio

的资源配置。管理节点CU数量是设置管理单元的CU数，支持设置1~4个CU数，默认值为1个CU。并发数是并发数是指同时运行Flink SQL作业的任务数。说明：并发数不能大于计算单元（CUs-1）的4倍。异常自动启动否设置是否启动异常自动重启功能，当作业异常时将自动重启并恢复作业。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
Sub Job - 数据治理中心 DataArts Studio

父作业的环境变量读取替换。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
新建数据质量作业 - 数据治理中心 DataArts Studio

选择了模板名称和版本后，SQL自动显示。规则权重设置规则的权重，支持按照字段级别设置权重。权重范围：【1-9】，整数。默认值为5。计算范围选择扫描区域支持选择“全表扫描”或“条件扫描”，默认为全表扫描。当仅需计算一部分数据，或需周期性按时间戳运行质量作业时，建议通过设置where条件进行条件扫描。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
目的端为关系数据库 - 数据治理中心 DataArts Studio

先导入阶段表，如果设置为“true”，数据导入目的表之前会把数据先导入阶段表，如果成功导入阶段表，则再从阶段表导入到目的表，这样避免导入过程失败，在目的表遗留部分成功数据。 toJobConfig.extendCharLength 否 Boolean 扩大字符字段长度，如果设置为“tru

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
配置DLI目的端参数 - 数据治理中心 DataArts Studio

car_detail 导入前清空数据选择导入前是否清空目的表的数据。如果设置为是，任务启动前会清除目标表中数据。否空字符串作为null 如果设置为true，空字符串将作为null。否清空数据方式导入前清空数据，如果设置为true时，呈现此参数。 TRUNCATE：删除标准数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

result.saveAsTextFile(outputPath) #停止SparkContext sc.stop() 需要将编码格式设置为“UTF-8”，否则后续脚本运行时会报错。准备数据文件“in.txt”，内容为一段英文单词。操作步骤：将脚本和数据文件传入OBS桶中，如下图。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

持各种WEB应用，成本低，中小企业首选。 ORACLE ORACLE数据库系统是以分布式数据库为核心的一组软件产品，是目前最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一。 ORACLE数据库是目前世界上使用最为广泛的数据库管理系统，作为一个通用的数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
数据库部署在其他云 - 数据治理中心 DataArts Studio

具体操作请参考其他云对应官网资料进行专线或VPN购买和对接。其他云数据库所在网络添加路由。其他云数据库所属网络的路由表中需要添加路由，目的地址指向Migration资源组VPC网段，下一跳跳至步骤3中创建的云专线物理连接或VPN对端网关设备。其他云数据库添加白名单及安全组规则。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通
申请API授权 - 数据治理中心 DataArts Studio

单击待绑定应用的API名称，进入API信息页面。在“调用信息”页面，单击“申请权限”。在申请权限页面，设置使用截止时间、选择应用，然后单击“确认”，完成API的权限申请。如果生成API时设置入参位置为Static，则还需设置静态参数值。如果未配置Static参数值，则SDK调用时会使用API入参默认值

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API

总条数： 801

上一页
1
...
17
18
19
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI Spark - 数据治理中心 DataArts Studio

配置CDM作业定时任务 - 数据治理中心 DataArts Studio

数据开发API（V2）概览 - 数据治理中心 DataArts Studio

管理工作空间 - 数据治理中心 DataArts Studio

（可选）购买规格增量包 - 数据治理中心 DataArts Studio

身份认证与访问控制 - 数据治理中心 DataArts Studio

管理API - 数据治理中心 DataArts Studio

HDFS连接参数说明 - 数据治理中心 DataArts Studio

配置作业调度为年调度 - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

Sub Job - 数据治理中心 DataArts Studio

新建数据质量作业 - 数据治理中心 DataArts Studio

目的端为关系数据库 - 数据治理中心 DataArts Studio

配置DLI目的端参数 - 数据治理中心 DataArts Studio

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

数据库部署在其他云 - 数据治理中心 DataArts Studio

申请API授权 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线