搜索_华为云

设置工作空间配额 - 数据治理中心 DataArts Studio

Administrator账号。 DAYU User账号，但为当前工作空间的管理员。操作步骤参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在旧版首页的“空间管理”或新版首页的“实例配置>空间管理”页签，单击列表中相应工作空间后的“编辑”，弹出“空间信息”弹窗。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 创建并配置简单模式工作空间
创建补数据实例 - 数据治理中心 DataArts Studio

请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。说明：多个DataArts Studio实例需要指定工作空间。当工作空间

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
授权dlg_agency委托 - 数据治理中心 DataArts Studio

本例以MRS权限管理业务场景为例进行说明，则需要授予的权限为IAM权限、MRS/DWS数据连接Agent权限和MRS用户同步权限。本例中使用授权项配置最小权限，授权操作如下：登录统一身份认证服务IAM控制台。在IAM服务左侧导航窗格中，进入“权限管理 > 权限”，单击页面中的“创建自定义策略”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理
获取质量报告趋势 - 数据治理中心 DataArts Studio

主题域(业务报告有效)。 l3 否 String 业务对象(业务报告有效)。 data_connection_id 否 String 数据连接id(技术报告有效)。 database_name 否 String 数据库名称(技术报告有效)。 table_name 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量报告接口
配置调度日历 - 数据治理中心 DataArts Studio

按照日历配置自定义工作日期进行调度，不支持于实时处理作业，只支持批处理作业。配置方法参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
获取质量报告概览 - 数据治理中心 DataArts Studio

主题域(业务报告有效)。 l3 否 String 业务对象(业务报告有效)。 data_connection_id 否 String 数据连接id(技术报告有效)。 database_name 否 String 数据库名称(技术报告有效)。 table_name 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量报告接口
配置ElasticSearch源端参数 - 数据治理中心 DataArts Studio

f:3 } } } 将拆成三个字段 [a.b.c], [a.b.d.e], [a.b.d.f]。否是过滤条件对源数据进行过滤，使用ES查询的参数q语法。否 last_name:Smith 抽取元字段是否抽取索引的元字段，目前只支持（_index、_type、_id、_score）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
简易变量集参考 - 数据治理中心 DataArts Studio

业务ID参数获取说明方法说明 $job_id 数据开发作业id。获取该ID请参考查询作业详情。 $instance_id 作业实例id（单节点作业测试运行不生成实例id，不支持）。获取该ID请参考查询作业实例列表。父主题：数据开发

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
参考：作业分片维度 - 数据治理中心 DataArts Studio

支持按表字段分片。仅当配置“按表分区抽取”时，按表分区分片。 SAP HANA 支持按表字段分片。不支持按表分区分片。分库每个后端连接一个子作业，子作业支持按主键分片。 NoSQL 分布式缓存服务（DCS）不支持分片。 Redis 不支持分片。文档数据库服务（DDS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
配置DWS目的端参数 - 数据治理中心 DataArts Studio

UPSERT模式，数据发生主键或唯一约束冲突时，更新除了主键和唯一约束列的其他列数据。 COPY_UPSERT模式，使用DWS专有的高性能批量入库工具。 COPY 导入开始前导入数据前，选择是否清除目的表的数据：不清除：写入数据前不清除目标表中数据，数据追加写入。清除全部数据：写入数据前会清除目标表中数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
配置HBase 源端参数 - 数据治理中心 DataArts Studio

02:00:00" 或 "${dateformat(yyyy-MM-dd HH:mm:ss, -1, DAY)}" 开始 RowKey 填写需要查询的RowKey。否 0001 结束 RowKey 填写需要结束的RowKey。否 0100 父主题：配置作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
获取质量报告业务报告数据 - 数据治理中心 DataArts Studio

主题域分组。 l2 String 主题域。 l3 String 业务对象。 table_name String 数据表对象名，格式为：数据连接.库.模式表/表。 l1_score Double 主题域分组评分。 l2_score Double 主题域评分。 l3_score Double

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量报告接口
配置Hive目的端参数 - 数据治理中心 DataArts Studio

当换行符处理方式选择为替换时，指定替换的字符串。 - 执行Analyze语句数据全部写入完成后会异步执行ANALYZE TABLE语句，用于优化Hive表查询速度，执行的SQL如下：非分区表：ANALYZE TABLE tablename COMPUTE STATISTICS 分区表：ANALYZE

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
Sub Job - 数据治理中心 DataArts Studio

将根据父作业的环境变量读取替换。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
离散小时调度与作业最近依赖调度逻辑 - 数据治理中心 DataArts Studio

实例时，需要向后找，向后查找时，只依赖最近的一个实例。通过图表进一步进行原理解释： “先向前找上游依赖实例，依赖上游一整个区间内的实例” 解释如下：图1 先向前找上游依赖实例，依赖上游一整个区间内的实例 “向前未找到依赖的实例时，需要向后找，向后查找时，只依赖最近的一个实例”

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
性能调优 - 数据治理中心 DataArts Studio

移效率与业务稳定性。需要作为不同的用途或给多个业务部门使用。例如既需要用于数据迁移作业，又需要作为DataArts Studio管理中心连接代理时，建议各配置至少一个CDM集群。待迁移任务库表较多，迁移量较大。此时可以使用多个CDM集群同时作业，提升迁移效率。当前CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
MRS MapReduce - 数据治理中心 DataArts Studio

输出数据路径否选择输出数据存储的路径。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据质量API概览 - 数据治理中心 DataArts Studio

40 质量作业接口表4 质量作业接口 API 说明 API流量限制（次/10s）用户流量限制（次/10s）获取质量作业列表V1 批量查询数据质量作业，返回质量作业列表。 300 40 获取质量作业列表获取质量作业列表。 300 40 获取质量作业详情获取质量作业详情 300

帮助中心 > 数据治理中心 DataArts Studio > API参考 > API概览
数据治理模块域 - 数据治理中心 DataArts Studio

和实际物理数据的一致）。主数据管理首先进行企业主数据的识别，然后对已识别主数据按照主数据规范要求进行数据治理和IT改造，以支撑企业业务流和工具链的打通和串联。管理中心数据治理的开展离不开组织、流程和政策的建设，管理中心也管理着数据治理过程中公共核心的统一数据源、数据驾驶舱等，满足不同角色的用户拥有个性化的工作台。

帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论 > 数据治理框架
For Each - 数据治理中心 DataArts Studio

子作业实例。数据集的来源包括：来自于上游节点的输出。例如DLI SQL、Hive SQL、Spark SQL的select语句，或者Shell节点的echo等。使用EL表达式为：#{Job.getNodeOutput('preNodeName')}，即前一个节点的输出值。来自

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考

总条数： 1344

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

设置工作空间配额 - 数据治理中心 DataArts Studio

创建补数据实例 - 数据治理中心 DataArts Studio

授权dlg_agency委托 - 数据治理中心 DataArts Studio

获取质量报告趋势 - 数据治理中心 DataArts Studio

配置调度日历 - 数据治理中心 DataArts Studio

获取质量报告概览 - 数据治理中心 DataArts Studio

配置ElasticSearch源端参数 - 数据治理中心 DataArts Studio

简易变量集参考 - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

配置DWS目的端参数 - 数据治理中心 DataArts Studio

配置HBase 源端参数 - 数据治理中心 DataArts Studio

获取质量报告业务报告数据 - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

Sub Job - 数据治理中心 DataArts Studio

离散小时调度与作业最近依赖调度逻辑 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

MRS MapReduce - 数据治理中心 DataArts Studio

数据质量API概览 - 数据治理中心 DataArts Studio

数据治理模块域 - 数据治理中心 DataArts Studio

For Each - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线