搜索_华为云

MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

输入便于记忆和区分的连接名称。 dwslink 数据库服务器 DWS数据库的IP地址或域名。 192.168.0.3 端口 DWS数据库的端口。 8000 数据库名称 DWS数据库的名称。 db_demo 用户名拥有DWS数据库的读、写和删除权限的用户。 dbadmin 密码用户的密码。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

N文件。图3 批量导入在弹出的窗口中，选择导出作业获取的JSON文件，上传JSON文件。图4 选择JSON文件 JSON文件上传成功后，单击“设置密码”，配置数据连接的密码或SK。图5 进入设置密码在设置密码弹窗中，依次输入各数据连接的密码或SK，完成后单击确认，回到导入作业界面。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
Open/Close Resource - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

向上取整，1）。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

向上取整，1）。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
跨空间进行作业调度 - 数据治理中心 DataArts Studio

执行后续的作业节点。如果您需要匹配多条消息记录，可以添加多个Dummy节点并分别添加到Subjob节点的IF条件，然后将数据开发组件配置项中的“多IF策略”设置为“逻辑或”即可。图4 编辑参数表达式测试运行作业job_agent，在工作空间A的作业job1未运行的情况下，前往实例监控中查看执行结果是否符合预期。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
性能调优 - 数据治理中心 DataArts Studio

如果大量CDM作业同时执行，当超过当前CDM集群的并发执行作业数时，会导致作业排队，耗时提升。建议您将迁移作业的运行时间错开，平摊在业务周期内，避免资源紧张导致迁移时间过长。调整抽取并发数对于低任务量场景，调整抽取并发数是性能调优的最佳方式。CDM迁移作业支持设置作业抽取并发数，同时也可以设置集群最大抽取并发数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
DWS SQL - 数据治理中心 DataArts Studio

数据连接是默认选择SQL脚本中设置的数据连接，支持修改。数据库是默认选择SQL脚本中设置的数据库，支持修改。脚本参数否关联的SQL脚本如果使用了参数，此处显示参数名称，请在参数名称后的输入框配置参数值。参数值支持使用EL表达式。若关联的SQL脚本，脚本参数发生变化，可单击刷新按钮同步。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

当缓存的数据达到定时批写时间间隔的条件，触发数据写入。增大该值有助于增加单次写入时缓存的数据条数，但由于写入频率降低，会提升DWS数据可见的时延。 sink.buffer-flush.max-size int 512 DWS单次写入的数据大小，默认为512MB，可在目的端配置的高级配置中设置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
MRS Impala SQL - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
管理通知 - 数据治理中心 DataArts Studio

说明：最大通知次数可设置为1~50。默认为1时，最小通知间隔不显示。最小通知间隔可设置为5~60。运行成功：作业的状态为“成功”时，发送通知。未完成：该功能仅支持按天调度的作业配置。如果作业执行时间超过设置的未完成时间，则发送通知。运行取消：作业的状态为“已取消”时，则发送通知。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
批作业监控 - 数据治理中心 DataArts Studio

冻结：作业实例尚未生成或者作业实例是等待运行的状态，且实例未被冻结上，才能够进行冻结。已被冻结的作业实例，实例运行状态为冻结状态。作业被冻结后，会按照作业运行失败进行处理，下游依赖的相关作业，如果依赖设置的是挂起，则下游作业挂起；如果依赖设置的继续执行，则下游作业继续执行；如果依赖设置的取消，则下游作业取消执行。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
新建事实表 - 数据治理中心 DataArts Studio

单击“编辑”按钮，并打开“生成异常数据”的开关。开启此项，表示异常数据将按照配置的参数存储到规定的库中。输入数据库或Schema信息，表示存储异常数据的数据库或Schema。设置异常表的表前缀和表后缀，表示存储异常数据的表前缀和后缀。异常表的前后和后缀只能包含英文字母、数字和下划线。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
迁移作业原理 - 数据治理中心 DataArts Studio

创建CDM迁移作业时，支持设置该作业的抽取并发数。该参数设置为适当的值可以有效提升迁移速度，过小则会限制迁移速度，过大则会导致任务过载、迁移失败。迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
添加工作空间成员和角色 - 数据治理中心 DataArts Studio

开发者：开发者拥有工作空间内创建、管理工作项的业务操作权限。建议将任务开发、任务处理的用户设置为开发者。运维者：运维者具备工作空间内运维调度等业务的操作权限，但无法更改工作项及配置。建议将运维管理、状态监控的用户设置为运维者。访客：访客可以查看工作空间内的数据，但无法操作业务。建议将只查

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 授权用户使用DataArts Studio
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

单线程flush的FileGroup的数量 <= 5，推荐值2。单线程flush的FileGroup的数量 <= 10，推荐值5。单线程flush的FileGroup的数量 <= 25，推荐值10。单线程flush的FileGroup的数量 <= 50，推荐值20。单线程flush的FileGroup的数量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
配置元数据采集任务 - 数据治理中心 DataArts Studio

新策略，设置数据目录中元数据的更新方式。需要注意的是配置的更新、删除策略是作用在用户配置的数据库、数据表的范围内的。勾选“仅更新数据目录中的元数据”：采集任务仅更新数据目录已经采集到的元数据勾选“仅添加新元数据”：采集任务仅采集数据源中存在，但是数据目录中不存在的元数据勾

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
MRS HetuEngine - 数据治理中心 DataArts Studio

是 Hetu支持的数据源。用户可以在MRS Manager的Hetu组件中自行添加数据源。数据库是默认选择SQL脚本中设置的数据库，支持修改。资源队列否输入资源队列名称。脚本参数否关联的SQL脚本如果使用了参数，此处显示参数名称，请在参数名称后的输入框配置参数值。参数值支持使用EL表达式。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
步骤5：数据架构设计 - 数据治理中心 DataArts Studio

其他字段可以不设置。如果表中的字段数据来源于同一个关系模型中的多个表，您可以新建一个映射。在该映射的“源表”中，您可以将多个表设置Join，然后再为表中的字段设置源字段。本示例只需要新建一个映射。单击“新建”，新建一个映射，如图30。映射名称：新建映射时会自动生成，您也可以修改。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

schema：该参数会显示在写入的数据的消息体中，此处配置该参数时后续显示为设置的参数；如果没有配置，默认使用原表的schema值。 table：该参数会显示在写入的数据的消息体中，此处配置该参数时后续显示为设置的参数；如果没有配置，默认使用源端的表名。 acks：取值0，1、all。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数

总条数： 514

上一页
1
...
8
9
10
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

Open/Close Resource - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

跨空间进行作业调度 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

DWS SQL - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

MRS Impala SQL - 数据治理中心 DataArts Studio

管理通知 - 数据治理中心 DataArts Studio

批作业监控 - 数据治理中心 DataArts Studio

新建事实表 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

添加工作空间成员和角色 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

MRS HetuEngine - 数据治理中心 DataArts Studio

步骤5：数据架构设计 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线