搜索_华为云

立即执行作业 - 数据治理中心 DataArts Studio

立即执行作业功能介绍本接口用于立即执行作业，验证作业是否能执行成功。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。 URI URI格式 POST /v1/{project_id}/jobs/{job_name}/run-immediate 参数说明表1

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
查看数据资产 - 数据治理中心 DataArts Studio

在“数据预览”页签，预览当前表的业务数据。根据列的分类信息，支持对预览数据根据配置脱敏策略的设置进行实时脱敏。数据预览支持的数据源类型：DWS、DLI、Hive、MySQL。列的分类信息支持在新建采集任务时自动设置和在数据分类菜单中手动添加两种方式。其中仅DWS、DLI支持新建采集任务时自动设置分类。在“变更记录”页签，查看数据表变更详情。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 查看工作空间数据地图
主题设计 - 数据治理中心 DataArts Studio

主题设计是通过分层架构表达对数据的分类和定义，帮助厘清数据资产，明确业务领域和业务对象的关联关系。您可以通过以下两种方式进行主题设计：新建主题并发布手动新建并发布主题。导入主题设计信息如果主题信息比较复杂，建议采用导入方式批量导入主题信息。您可以下载系统提供的主题设计模板，在模板文件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 数据调研
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度。作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
数据开发的并行执行节点数是多少？ - 数据治理中心 DataArts Studio

在数据开发主界面的左侧导航栏，选择“配置管理 > 配置”。选择“节点并发数”。配置工作空间的节点并发数，工作空间的节点并发数不能大于DataArts Studio实例的并行节点并发数上限。 DataArts Studio实例的节点并发数上限可通过表2获取。其中的作业节点调度次数/天配额可通过DataArts

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
配置任务组 - 数据治理中心 DataArts Studio

任务组的名称。任务组名称不能重名。最大并发数当前任务组作业节点最大并发数。最大节点并发数即为当前DataArts Studio实例的并发数。当前DataArts Studio实例的节点并发数上限为1000，请不要超过该上限。最大并发数与DataArts Studio实例规

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

目前数据集成集群支持以下部分规格供用户选择： cdm.large：8核CPU、16G内存的虚拟机，最大带宽/基准带宽为3/0.8 Gbps，集群作业并发数上限为16。 cdm.xlarge：16核CPU、32G内存的虚拟机，最大带宽/基准带宽为10/4 Gbps，集群作业并发数上限为3

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
FTP/SFTP连接参数说明 - 数据治理中心 DataArts Studio

FTP/SFTP连接适用于从线下文件服务器或ECS服务器上迁移文件到数据库。当前仅支持Linux操作系统的FTP 服务器。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。连接FTP或SFTP服务器时，连接参数相同，如表1所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
数据服务配置数据搬迁 - 数据治理中心 DataArts Studio

当前仅专享版支持按照导入文件定义自动新建审核人（须确保审核人已为当前工作空间成员）。表1 导入参数配置说明参数说明是否发布配置导入的API是否需要发布，默认不发布。仅专享版支持该参数。仅导入API：仅导入API，导入后的API为“未发布”状态。导入API并发布到当前空

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
迁移作业原理 - 数据治理中心 DataArts Studio

影响因素说明业务相关因素作业抽取并发数配置创建CDM迁移作业时，支持设置该作业的抽取并发数。该参数设置为适当的值可以有效提升迁移速度，过小则会限制迁移速度，过大则会导致任务过载、迁移失败。迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
数据开发概述 - 数据治理中心 DataArts Studio

表1 数据开发的主要功能支持的功能说明数据管理支持管理DWS、DLI、MRS Hive等多种数据仓库。支持可视化和DDL方式管理数据库表。脚本开发提供在线脚本编辑器，支持多人协作进行SQL、Shell、Python脚本在线代码开发和调测。支持使用变量和函数。作业开发

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

如何降低CDM使用成本？如果是迁移公网的数据上云，可以使用NAT网关服务，实现CDM服务与子网中的其他弹性云服务器共享弹性IP，可以更经济、更方便的通过Internet迁移本地数据中心或第三方云上的数据。具体操作如下：假设已经创建好了CDM集群（无需为CDM集群绑定专用弹性

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
作业开发流程 - 数据治理中心 DataArts Studio

提供图形化设计器，支持拖拉拽方式快速构建数据处理工作流。预设数据集成、计算&分析、资源管理、数据监控、其他等多种任务类型，通过任务间依赖完成复杂数据分析处理。支持多种作业调度方式。支持导入和导出作业。支持作业状态运维监控和作业结果通知。提供编辑锁定能力，支持多人协同开发场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
步骤2：数据集成 - 数据治理中心 DataArts Studio

图10 任务配置单击“显示高级属性”，可配置“抽取并发数”以及“是否写入脏数据”，如图10所示。抽取并发数：设置同时执行的抽取任务数。并发抽取数取值范围为1-1000，若配置过大，则以队列的形式进行排队。 CDM迁移作业的抽取并发量，与集群规格和表大小有关。按集群规格建议每1CUs（1CUs=1核4G）配置为4。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
查看资产总览 - 数据治理中心 DataArts Studio

业务资产来自于数据架构组件中定义并发布过的逻辑实体与数据表，资产总览展示业务对象、逻辑实体、业务属性的数量及其详情。技术资产来自于数据连接和元数据采集任务，资产总览展示数据库、数据表、数据量的数量及其详情。指标资产来自于数据架构组件中定义并发布过的业务指标，资产总览展示业务指标及其详情。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 查看工作空间数据地图
通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

通过浏览器调用无认证方式的API 当无认证方式的API入参位置在Query或Path时，支持直接通过浏览器调用。无认证方式建议仅在测试接口时使用，不推荐正式使用。若调用方为不可信任用户，则存在数据库安全风险（如数据泄露、数据库高并发访问导致宕机、SQL注入等风险）。本章节以Chrome浏览器为例，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
FTP/SFTP连接 - 数据治理中心 DataArts Studio

server 是 String FTP或SFTP服务器的地址。 linkConfig.port 是 String FTP或SFTP服务器端口号。 linkConfig.username 是 String 登录FTP或SFTP服务器的用户名。 linkConfig.password

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
配置离线处理集成作业 - 数据治理中心 DataArts Studio

迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端为DLI数据源时，抽取并发数建议配置为1，否则可能会导致写入失败。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）

总条数： 1066

上一页
1
2
3
4
5
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

立即执行作业 - 数据治理中心 DataArts Studio

查看数据资产 - 数据治理中心 DataArts Studio

主题设计 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

数据开发的并行执行节点数是多少？ - 数据治理中心 DataArts Studio

配置任务组 - 数据治理中心 DataArts Studio

（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

FTP/SFTP连接参数说明 - 数据治理中心 DataArts Studio

数据服务配置数据搬迁 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

数据开发概述 - 数据治理中心 DataArts Studio

DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

作业开发流程 - 数据治理中心 DataArts Studio

步骤2：数据集成 - 数据治理中心 DataArts Studio

查看资产总览 - 数据治理中心 DataArts Studio

通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

FTP/SFTP连接 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线