搜索_华为云

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

数据连接：默认选择SQL脚本“dws_sql”中设置的数据连接，支持修改。数据库：默认选择SQL脚本“dws_sql”中设置的数据库，支持修改。脚本参数：通过EL表达式获取"yesterday"的值，EL表达式如下： #{Job.getYesterday("yyyy-MM-dd")} 节点名称：默认显示为SQL脚本“dws_sql”的名称，支持修改。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MAX（单分区数据量大小（G）/2G*2，再后向上取整，1）。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。 changelog.enabled boolean false - Hudi changelog功能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。否最大重试次数 “自动重试”为是时显示该参数。 1 重试间隔时间 “自动重试”为是时显示该参数。 120秒是否写入脏数据选择是否记录脏数据，默认不记录脏数据，当脏数据过多时，会影响同步任务的整体同步速度。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
Data Quality Monitor - 数据治理中心 DataArts Studio

默认项设置”修改此策略。当“失败重试”配置为“是”才显示“超时重试”。当前节点失败后，后续节点处理策略是节点执行失败后的操作：终止后续节点执行计划：停止后续节点的运行，当前作业实例状态显示为“失败”。终止当前作业执行计划：停止当前作业运行，当前作业实例状态显示为“失败”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
步骤4：元数据采集 - 数据治理中心 DataArts Studio

图6 查看监控任务当采集任务成功后，在左侧导航栏单击“数据目录”，选择“技术资产”页签，然后设置筛选条件，例如选中连接“mrs_hive_link”，以及选中“Table”，将显示符合条件的所有的表。图7 技术资产单击所需要的元数据名称，即可查看详情信息。图8 元数据详情

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
衍生指标 - 数据治理中心 DataArts Studio

维度对应的字段。例如，该示例中，统计维度设置为地区。时间周期在下拉框中选择所需要的时间周期，并选择关联的字段。系统预置了一些时间周期，如果不能满足需求，请参考时间周期进行创建。过滤条件名称输入过滤条件名称。过滤条件类型设置过滤条件类型。业务定义输入过滤条件的业务定义。支持的长度为0~600个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标开发
基线管理 - 数据治理中心 DataArts Studio

）”，基线任务以及其依赖链上游的所有任务运行异常或者失败后，在任务未修复前，可以设置间隔时间发送告警通知。说明：最大通知次数可设置为1~50。默认为1时，最小通知间隔不显示。最小通知间隔可设置为5~60。通知方式按主题按责任人主题当“通知方式”选择“按主题”时才需配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
实时作业监控 - 数据治理中心 DataArts Studio

点监控等信息。在节点监控页签，可以查看实时作业的运行日志。同时，您可以查看当前作业版本、作业运行状态、启动、重跑、作业开发、是否显示指标监控、设置作业刷新频率等。实时作业监控：禁用节点后恢复您可以对实时作业中某个节点配置“禁用”后恢复运行，恢复运行时可以重新选择运行位置。参考访问DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

单击环境变量配置下的“导出”，导出环境变量。图5 导出环境变量导出资源单击左侧导航上的“资源管理”，进入资源管理页面。单击资源目录中的，选择“显示复选框”。图6 显示资源复选框勾选需要导出的资源，单击 > 导出资源。导出完成后，即可通过浏览器下载地址，获取到导出的zip文件。图7 选择并导出资源

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MAX（单分区数据量大小（G）/2G*2，再后向上取整，1）。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。 changelog.enabled boolean false - Hudi changelog功能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。否最大重试次数 “自动重试”为是时显示该参数。 1 重试间隔时间 “自动重试”为是时显示该参数。 120秒是否写入脏数据选择是否记录脏数据，默认不记录脏数据，当脏数据过多时，会影响同步任务的整体同步速度。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
新建整库迁移作业 - 数据治理中心 DataArts Studio

当“是否写入脏数据”为“是”才显示该参数。脏数据要写入的连接，目前只支持写入到OBS连接。 obs_link OBS桶当“脏数据写入连接”为OBS类型的连接时，才显示该参数。写入脏数据的OBS桶的名称。 dirtydata 脏数据目录 “是否写入脏数据”选择为“是”时，该参数才显示。 OBS上

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
配置方式生成API - 数据治理中心 DataArts Studio

T等，遵循resultful风格。 GET：请求服务器返回指定资源，推荐使用GET请求。 POST：请求服务器新增资源或执行特殊操作。POST请求当前不支持body体，而是直接透传。描述对API进行简要描述。标签对API设置标签。用于标记当前API的属性，创建后可以通过标

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

r权限，无法创建连接。建议用户名的密码策略设置为永不过期，避免由于密码过期导致连接失败，引起业务受损。密码是 MRS集群的访问密码，通过代理连接的时候，是必选项。开启ldap 否当“连接方式”参数选择为“通过代理连接”时，显示该配置项。当MRS Hive对接外部LDA

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
DWS SQL - 数据治理中心 DataArts Studio

默认项设置”修改此策略。当“失败重试”配置为“是”才显示“超时重试”。当前节点失败后，后续节点处理策略是节点执行失败后的操作：终止后续节点执行计划：停止后续节点的运行，当前作业实例状态显示为“失败”。终止当前作业执行计划：停止当前作业运行，当前作业实例状态显示为“失败”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Import GES - 数据治理中心 DataArts Studio

默认项设置”修改此策略。当“失败重试”配置为“是”才显示“超时重试”。当前节点失败后，后续节点处理策略是节点执行失败后的操作：终止后续节点执行计划：停止后续节点的运行，当前作业实例状态显示为“失败”。终止当前作业执行计划：停止当前作业运行，当前作业实例状态显示为“失败”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MRS Presto SQL - 数据治理中心 DataArts Studio

默认项设置”修改此策略。当“失败重试”配置为“是”才显示“超时重试”。当前节点失败后，后续节点处理策略是节点执行失败后的操作：终止后续节点执行计划：停止后续节点的运行，当前作业实例状态显示为“失败”。终止当前作业执行计划：停止当前作业运行，当前作业实例状态显示为“失败”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
CDM有哪些优势？ - 数据治理中心 DataArts Studio

标。免运维需要自行开发完善运维功能，自行保证系统可用性，尤其是告警及通知功能，否则只能人工值守。使用CDM服务，用户不需要维护服务器、虚拟机等资源。CDM的日志，监控和告警功能，有异常可以及时通知相关人员，避免7*24小时人工值守。高效率在迁移过程中，数据读写过程都是由

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）

总条数： 703

上一页
1
...
12
13
14
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

Data Quality Monitor - 数据治理中心 DataArts Studio

步骤4：元数据采集 - 数据治理中心 DataArts Studio

衍生指标 - 数据治理中心 DataArts Studio

基线管理 - 数据治理中心 DataArts Studio

实时作业监控 - 数据治理中心 DataArts Studio

数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

配置方式生成API - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

DWS SQL - 数据治理中心 DataArts Studio

DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

Import GES - 数据治理中心 DataArts Studio

MRS Presto SQL - 数据治理中心 DataArts Studio

CDM有哪些优势？ - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线