搜索_华为云

配置Hive源端参数 - 数据治理中心 DataArts Studio

“使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，CDM将根据该语句导出数据。说明： SQL语句只能查询数据，支持join和嵌套写法，但不能有多条查询语句，比如 select * from table a; select * from table b。不支持with语句。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数
步骤1：数据准备 - 数据治理中心 DataArts Studio

步骤1：数据准备使用DataArts Studio前的准备如果您是第一次使用DataArts Studio，请参考购买并配置DataArts Studio章节完成注册华为账号、购买DataArts Studio实例（DataArts Studio企业版）、创建工作空间等一系列

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
创建补数据实例 - 数据治理中心 DataArts Studio

请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。 X-Auth-Token 是 String IAM Token 最小长度：0

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
配置ElasticSearch源端参数 - 数据治理中心 DataArts Studio

f:3 } } } 将拆成三个字段 [a.b.c], [a.b.d.e], [a.b.d.f]。否是过滤条件对源数据进行过滤，使用ES查询的参数q语法。否 last_name:Smith 抽取元字段是否抽取索引的元字段，目前只支持（_index、_type、_id、_score）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
简易变量集参考 - 数据治理中心 DataArts Studio

业务ID参数获取说明方法说明 $job_id 数据开发作业id。获取该ID请参考查询作业详情。 $instance_id 作业实例id（单节点作业测试运行不生成实例id，不支持）。获取该ID请参考查询作业实例列表。父主题：数据开发

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
配置HBase 源端参数 - 数据治理中心 DataArts Studio

02:00:00" 或 "${dateformat(yyyy-MM-dd HH:mm:ss, -1, DAY)}" 开始 RowKey 填写需要查询的RowKey。否 0001 结束 RowKey 填写需要结束的RowKey。否 0100 父主题：配置作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
源端为Apache Kafka，目的端为MRS Kafka - 数据治理中心 DataArts Studio

费组。当迁移作业消费DMS Kafka集群某一Topic的消息后，在Kafka集群的“消费组管理”可以看到此处配置的消费组ID、在“消息查询”可以查到消费属性group.id。因为Kafka把消费消息的一方称为消费者(Consumer)，多个消费者组成一个消费组(Consumer

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 配置源端和目标端参数
Sub Job - 数据治理中心 DataArts Studio

将根据父作业的环境变量读取替换。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据架构配置数据搬迁 - 数据治理中心 DataArts Studio

况。图38 导入汇总表成功导入成功后，请单击“发布”，使其处于“已发布”状态。搬迁后验证在新空间的表数据导入完成后，您可以在新空间查看并验证模型和表数据等是否与旧空间一致，以确保导入成功。父主题： DataArts Studio配置数据搬迁实践

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
配置Hive目的端参数 - 数据治理中心 DataArts Studio

当换行符处理方式选择为替换时，指定替换的字符串。 - 执行Analyze语句数据全部写入完成后会异步执行ANALYZE TABLE语句，用于优化Hive表查询速度，执行的SQL如下：非分区表：ANALYZE TABLE tablename COMPUTE STATISTICS 分区表：ANALYZE

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业目的端参数
数据质量API概览 - 数据治理中心 DataArts Studio

40 质量作业接口表4 质量作业接口 API 说明 API流量限制（次/10s）用户流量限制（次/10s）获取质量作业列表V1 批量查询数据质量作业，返回质量作业列表。 300 40 获取质量作业列表获取质量作业列表。 300 40 获取质量作业详情获取质量作业详情 300

帮助中心 > 数据治理中心 DataArts Studio > API参考 > API概览
GBase SQL - 数据治理中心 DataArts Studio

选择数据库名称，该数据库已创建好，建议不要使用默认数据库。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MRS MapReduce - 数据治理中心 DataArts Studio

输出数据路径否选择输出数据存储的路径。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
离散小时调度与作业最近依赖调度逻辑 - 数据治理中心 DataArts Studio

实例时，需要向后找，向后查找时，只依赖最近的一个实例。通过图表进一步进行原理解释： “先向前找上游依赖实例，依赖上游一整个区间内的实例” 解释如下：图1 先向前找上游依赖实例，依赖上游一整个区间内的实例 “向前未找到依赖的实例时，需要向后找，向后查找时，只依赖最近的一个实例”

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
RDS SQL - 数据治理中心 DataArts Studio

解析您输入SQL语句中携带的参数。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
DORIS SQL - 数据治理中心 DataArts Studio

填写数据库名称，该数据库已创建好，建议不要使用默认数据库。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置Hive目的端参数 - 数据治理中心 DataArts Studio

location=earth']. 执行Analyze语句数据全部写入完成后会异步执行ANALYZE TABLE语句，用于优化Hive表查询速度，执行的SQL如下：非分区表：ANALYZE TABLE tablename COMPUTE STATISTICS 分区表：ANALYZE

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
文件格式介绍 - 数据治理中心 DataArts Studio

这个参数是针对数据库导出到CSV文件的场景，如果一张表的数据量比较大，那么导出到CSV文件的时候，会生成一个很大的文件，有时会不方便下载或查看。这时可以在目的端指定该参数，这样会生成多个指定大小的CSV文件，避免导出的文件过大。该参数的数据类型为整型，单位为MB。 JSON格式

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
文件格式介绍 - 数据治理中心 DataArts Studio

这个参数是针对数据库导出到CSV文件的场景，如果一张表的数据量比较大，那么导出到CSV文件的时候，会生成一个很大的文件，有时会不方便下载或查看。这时可以在目的端指定该参数，这样会生成多个指定大小的CSV文件，避免导出的文件过大。该参数的数据类型为整型，单位为MB。 JSON格式

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
批量配置作业 - 数据治理中心 DataArts Studio

作业配置菜单配置作业的通用项。图3 通用配置表1 通用配置参数说明节点状态轮询时间设置所选作业的所有节点轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。如果设置为保持不变，则各节点保持原来的节点轮询时间。节点执行的最长时间设置所选作业的所有节点执行超时时间，如果

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业

总条数： 1188

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Hive源端参数 - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

创建补数据实例 - 数据治理中心 DataArts Studio

配置ElasticSearch源端参数 - 数据治理中心 DataArts Studio

简易变量集参考 - 数据治理中心 DataArts Studio

配置HBase 源端参数 - 数据治理中心 DataArts Studio

源端为Apache Kafka，目的端为MRS Kafka - 数据治理中心 DataArts Studio

Sub Job - 数据治理中心 DataArts Studio

数据架构配置数据搬迁 - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

数据质量API概览 - 数据治理中心 DataArts Studio

GBase SQL - 数据治理中心 DataArts Studio

MRS MapReduce - 数据治理中心 DataArts Studio

离散小时调度与作业最近依赖调度逻辑 - 数据治理中心 DataArts Studio

RDS SQL - 数据治理中心 DataArts Studio

DORIS SQL - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

批量配置作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线