搜索_华为云

开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

当“作业调度身份是否可配置”设置为“是”，该参数可见。配置委托后，作业执行过程中，以委托的身份与其他服务交互。作业优先级自动匹配创建作业时配置的作业优先级，此处支持修改。实例超时时间配置作业实例的超时时间，设置为0或不配置时，该配置项不生效。如果您为作业设置了异常通知，当作业实

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

SQL脚本中开发完成的DWS SQL脚本“dws_sql”。数据连接：默认选择SQL脚本“dws_sql”中设置的数据连接，支持修改。数据库：默认选择SQL脚本“dws_sql”中设置的数据库，支持修改。脚本参数：通过EL表达式获取"yesterday"的值，EL表达式如下： #{Job

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
MySQL同步到DMS Kafka作业配置 - 数据治理中心 DataArts Studio

否：默认为否，不记录脏数据。表示不允许脏数据存在。如果同步过程中产生脏数据，任务将失败退出。是：允许脏数据，即任务产生脏数据时不影响任务执行。允许脏数据并设置其阈值时：若产生的脏数据在阈值范围内，同步任务将忽略脏数据（即不会写入目标端），并正常执行。若产生的脏数据超出阈值范围，同步任务将失败退出。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
基本概念 - 数据治理中心 DataArts Studio

时，您需要同时为添加的成员设置相应的角色。角色是一组操作权限的集合。不同的角色拥有不同的操作权限，把角色授予成员后，成员即具有了角色的所有权限。每位成员至少要拥有一个角色，并且可以同时拥有多种角色。数据集成集群一个数据集成集群运行在一个弹性云服务器之上，用户可以在集群中创建

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
Shell - 数据治理中心 DataArts Studio

支持再重试。当节点运行超时导致的失败不会重试时，您可前往“默认项设置”修改此策略。当“失败重试”配置为“是”才显示“超时重试”。重试条件否失败重试选择“是”时，支持设置重试条件。打开重试条件的开关，设置返回码的范围。 Shell作业可以根据返回码判断作业节点执行失败是

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发SQL脚本 - 数据治理中心 DataArts Studio

支持。单击右上角的，设置相关脚本的环境变量。举例如下所示：设置Hive SQL脚本的环境变量： --hiveconf hive.merge.mapfiles=true; --hiveconf mapred.job.queue.name=queue1 设置Spark SQL脚本的环境变量：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。如果目标数据源为云上服务（如DWS、MRS及ECS等），则网络互通需满足如下条件： CDM集群与云上服务处于不同区域的情况下，需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
配置MRS Hudi目的端参数 - 数据治理中心 DataArts Studio

型在线进行压缩的场景。说明：运行-失败重试期间不允许修改此模式。是批次数据大小 “全量模式写Hoodie”设置为“否”时，使用微批模式呈现此参数。用于设置单个批次写Hoodie的数据行数，默认100000行。 100000 使用入库时间字段将一个字段标记为入库时间字段

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
日志提示解析日期格式失败时怎么处理？ - 数据治理中心 DataArts Studio

ate_test”和“test1”在云搜索服务中不存在时，CDM会在云搜索服务中自动创建该索引和类型），则CDM默认会将时间类型字段的格式设置为“yyyy-MM-dd HH:mm:ss.SSS Z”的标准格式，例如“2018-01-08 08:08:08.666 +0800”。图2

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

文件格式：同源端相同，选择“二进制格式”。其它可选参数保持默认即可。单击“下一步”进行任务配置，其中抽取并发数默认为3，适当增加可以增加迁移速率，本例中设置为8，其它参数保持默认即可。重复上述步骤创建其它迁移目录的作业，参数配置都相同。2个CDM集群的作业个数平均分配，并发执行。作业执行完

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

Hive。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

目标字段赋值：单击操作列“目标字段赋值”可自定义MongoDB到DWS的字段映射情况。同时用户可以为所有DWS目标端的字段，设置对应的源表映射字段，或者设置手动赋值的字符串内容。列名：目的端DWS表字段的名称。类型：目的端DWS表字段的类型。字段值：目的端DWS表字段的取值来源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

DWS的写入模式，可在目的端配置中设置，实时处理集成作业推荐使用COPY MODE。 UPSERT：为批量更新入库模式。 COPY：为DWS专有的高性能批量入库模式。批写最大数据量 int 50000 DWS单次写入的最大条数，可在目的端配置中设置。当缓存的数据达到“批写最大数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
通知周期概览 - 数据治理中心 DataArts Studio

才需要配置。设置通知发送的具体日期。当调度周期为周时，可设置为一周中星期一至星期日的某一天或某几天。当调度周期为月时，可设置为一月中每月1号至每月31号的某一天或某几天。具体时间是设置通知发送的具体时间点，可以精确设置到小时和分钟。选择主题是设置通知发送的主题。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
配置Hive源端参数 - 数据治理中心 DataArts Studio

过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
Python - 数据治理中心 DataArts Studio

选择执行Python语句的主机。需确认该主机配有用于执行Python脚本的环境。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
API编排典型配置 - 数据治理中心 DataArts Studio

/恢复API。设置API工作流可见：在API工作流列表页面，单击对应工作流操作栏中的“更多 > 设置可见”，即可弹出API工作流设置可见窗口。设置API工作流可见可以修改API工作流在服务目录中的可见范围。设置可见流程与API设置可见流程基本一致，可参考设置API可见。复制

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

自定义分页的脚本/MyBatis方式API是在创建API时将分页逻辑写到取数SQL中，因此不支持在调用时修改分页设置。（可选）默认情况下，系统会根据排序参数信息给出默认排序情况，自定义排序默认为升序。如果需要修改排序情况，可以修改如下参数设置。其中排序参数描述pre_order_by的值填写形式为“排序参数参数名:

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
数据集成应用示例 - 数据治理中心 DataArts Studio

user_dws 密码访问DWS数据库的用户密码。 dws_password 获取token 调用其他API前，需要获取token，并设置成环境变量。 curl -H "Content-Type:application/json" https://{iam_endpoint}/v3/auth/tokens

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 应用示例
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优

总条数： 908

上一页
1
...
8
9
10
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

MySQL同步到DMS Kafka作业配置 - 数据治理中心 DataArts Studio

基本概念 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

配置MRS Hudi目的端参数 - 数据治理中心 DataArts Studio

日志提示解析日期格式失败时怎么处理？ - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

通知周期概览 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

API编排典型配置 - 数据治理中心 DataArts Studio

（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

数据集成应用示例 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线