搜索_华为云

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
企业模式简介 - 数据治理中心 DataArts Studio

配置开发生产环境隔离配置两套数据湖服务，进行开发与生产环境隔离。对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS等），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切换对应的数据湖。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间
购买数据模型数量增量包 - 数据治理中心 DataArts Studio

作 > 配额使用量”，查看每个工作空间的配额使用量。设置配额使用量阈值告警购买配额扩充增量包前，您可以设置配额使用量阈值告警。当触发告警时，表明您应当购买配额扩充增量包，否则随着业务量增长，您的业务可能会受到影响。设置配额使用量阈值告警的操作方法如下所示：在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
购买技术资产数量增量包 - 数据治理中心 DataArts Studio

作 > 配额使用量”，查看每个工作空间的配额使用量。设置配额使用量阈值告警购买配额扩充增量包前，您可以设置配额使用量阈值告警。当触发告警时，表明您应当购买配额扩充增量包，否则随着业务量增长，您的业务可能会受到影响。设置配额使用量阈值告警的操作方法如下所示：在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
更新业务指标 - 数据治理中心 DataArts Studio

String 指标责任人。 owner_department 是 String 指标管理部门。 destination 是 String 设置目的。 definition 是 String 指标定义。 expression 是 String 计算公式。 remark 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 业务指标接口
创建业务指标 - 数据治理中心 DataArts Studio

String 指标责任人。 owner_department 是 String 指标管理部门。 destination 是 String 设置目的。 definition 是 String 指标定义。 expression 是 String 计算公式。 remark 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 业务指标接口
配置默认项 - 数据治理中心 DataArts Studio

仅对脚本中未设置上述参数值的情况下生效，如脚本中已设置此参数值，则优先以读取人工设置的值传递至MRS。特别提醒：如MRS集群是安全模式，则不支持此设置方式，需提前将集群设置为非安全模式。在数据开发主界面的左侧导航栏，选择“配置管理 > 配置”。单击“默认项设置”，可设置“作业运行自动传递脚本名称”配置项。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
批量配置作业 - 数据治理中心 DataArts Studio

策略。责任人设置所选作业的责任人，只能从当前工作空间中的用户选择。如果设置为保持不变，则各作业保持原来的责任人。周期作业实例并发数设置所选作业并行处理的数量。如果设置为保持不变，则保持原来的周期作业实例并发数。是否清理超期等待运行的作业实例如果设置为取消运行，需要

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
重启集群 - 数据治理中心 DataArts Studio

SOFTLY：一般重启。默认值为“IMMEDIATELY”。强制重启业务进程会中断，并重启集群的虚拟机。 restartLevel 否 String 重启级别： SERVICE：重启服务。 VM：重启虚拟机。默认值为“SERVICE”。 type 是 String 集群节点类型，只支持“cdm”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
跨空间进行作业调度 - 数据治理中心 DataArts Studio

Dummy节点不执行任何操作，本例选择Dummy节点用于设置Dummy节点到Subjob节点之间连线的IF条件。 Subjob节点用于将需要后续执行的作业job2作为子作业引用执行。实际使用中您可以引用已有作业，也可以使用其他作业节点替代Subjob节点。作业的调度方式设置为“事件驱动调度”，DIS通道

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
数据服务专享版集群正式商用后，如何继续使用公测期间创建的数据服务专享版集群和API？ - 数据治理中心 DataArts Studio

编辑空间管理在“空间信息”中，单击“设置”按钮对已分配配额进行配置。图4 设置已分配配额数据服务已创建的API属于计费项，当前操作正在增加API配额，这会使工作空间下可以创建更多的API，同时可能使收费增加，请确认。设置专享版API已分配配额。图5 设置配额已分配配额不能小于已使

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据服务
开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

图1 新建作业进入到作业开发页面，拖动“MRS Flink”节点到画布中并单击，配置节点的属性。图2 配置MRS Flink节点属性参数设置说明： --Flink作业名称 wordcount --MRS集群名称选择一个MRS集群 --运行程序参数 -c org.apache

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

result.saveAsTextFile(outputPath) #停止SparkContext sc.stop() 需要将编码格式设置为“UTF-8”，否则后续脚本运行时会报错。准备数据文件“in.txt”，内容为一段英文单词。操作步骤：将脚本和数据文件传入OBS桶中，如下图。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

数据缓存队列大小，默认为0，即表示缓存队列不考虑数据大小，只按照数据条数计算。在debezium.max.queue.size无法有效限制内存占用时，考虑显式设置该值来限制缓存数据的大小。 jdbc.properties.socketTimeout int 300000 全量阶段连接Mysql的so

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
通过API工具调用无认证方式的API - 数据治理中心 DataArts Studio

特定分页数据，您可以修改如下参数设置分页，其中pageSize表示分页后的页面大小，pageNum表示页码。图4 分页参数设置自定义分页的脚本/MyBatis方式API是在创建API时将分页逻辑写到取数SQL中，因此不支持在调用时修改分页设置。（可选）排序配置：默认情况下，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

文件。图4 选择JSON文件 JSON文件上传成功后，单击“设置密码”，配置数据连接的密码或SK。图5 进入设置密码在设置密码弹窗中，依次输入各数据连接的密码或SK，完成后单击确认，回到导入作业界面。图6 设置密码在导入作业界面，单击确认，开始导入。图7 开始导入导

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
基线运维约束限制 - 数据治理中心 DataArts Studio

DLI约束限制： DLI提供的设置作业优先级功能，当资源不充足时，可以优先满足优先级较高的作业的计算资源。DLI优先级功能包含DLI Flink Job、DLI SQL和DLI Spark三个作业算子。只有运行在弹性资源池上的作业支持设置作业优先级。弹性资源池上的SQL作业支持作业优先级。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
查询脚本实例执行结果 - 数据治理中心 DataArts Studio

数。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。响应参数表3 参数说明参数名是否必选

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 脚本开发API
Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

HDFS。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
源端为HTTP/HTTPS - 数据治理中心 DataArts Studio

个文件，默认为|。 fromJobConfig.useQuery 否 Boolean 该参数设置为“true”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“false”时，上传到OBS的对象使用的对象名，包含query参数。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明

总条数： 908

上一页
1
...
9
10
11
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

企业模式简介 - 数据治理中心 DataArts Studio

购买数据模型数量增量包 - 数据治理中心 DataArts Studio

购买技术资产数量增量包 - 数据治理中心 DataArts Studio

更新业务指标 - 数据治理中心 DataArts Studio

创建业务指标 - 数据治理中心 DataArts Studio

配置默认项 - 数据治理中心 DataArts Studio

批量配置作业 - 数据治理中心 DataArts Studio

重启集群 - 数据治理中心 DataArts Studio

跨空间进行作业调度 - 数据治理中心 DataArts Studio

数据服务专享版集群正式商用后，如何继续使用公测期间创建的数据服务专享版集群和API？ - 数据治理中心 DataArts Studio

开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

通过API工具调用无认证方式的API - 数据治理中心 DataArts Studio

数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

基线运维约束限制 - 数据治理中心 DataArts Studio

查询脚本实例执行结果 - 数据治理中心 DataArts Studio

Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

源端为HTTP/HTTPS - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线