搜索_华为云

Python - 数据治理中心 DataArts Studio

选择执行Python语句的主机。需确认该主机配有用于执行Python脚本的环境。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
步骤1：数据准备 - 数据治理中心 DataArts Studio

DLI连接创建完成后，跳转到数据开发页面。图3 跳转到数据开发页面参见图4，在DLI连接上右键单击，创建一个数据库用于存放数据表，数据库名称为“BI”。图4 创建数据库创建一个DLI SQL脚本，以通过DLI SQL语句来创建数据表。图5 新建脚本在新建脚本弹出的SQL编

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
创建数据连接需要注意哪些事项？ - 数据治理中心 DataArts Studio

在创建数据连接前，请确保您已具备连接所需的Agent代理（即CDM集群），且待连接的数据湖与CDM集群之间网络互通。如果数据湖为云下的数据库，则需要通过公网或者专线打通网络。请确保数据源所在的主机和CDM集群均能访问公网，并且防火墙规则已开放连接端口。如果数据湖为云上服务（如

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 管理中心
CDM Job - 数据治理中心 DataArts Studio

是：重新执行节点，请配置以下参数。最大重试次数重试间隔时间（秒）否：默认值，不重新执行节点。说明：建议仅对文件类作业或启用了导入阶段表的数据库作业配置自动重试，避免自动重试重复写入数据导致数据不一致。如果调度CDM迁移作业时使用了参数传递，不能在CDM迁移作业中配置“作业失败重试”参数，推荐在此处配置即可。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
DRS任务切换到实时Migration作业配置 - 数据治理中心 DataArts Studio

Migration作业需要根据DRS的同步位点启动作业，做到数据的续传、不漏数。请联系DRS运维人员获取到DRS任务同步的安全位点（一个binlog文件名），联系MySQL数据库运维根据安全位点查询出当前DRS已同步binlog的时间戳，根据这个时间戳启动Migration作业。在启动Migration作业前务必将DRS作业暂停，避免造成写冲突。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
检查集群版本与权限 - 数据治理中心 DataArts Studio

guest agent版本。 DWS连接用户权限非三权分立模式，连接中的用户至少需具备数据库dbadmin权限，三权分立模式，连接中的用户需具备系统管理员权限。非三权分立模式，参考数据库用户设置dbadmin管理员用户。三权分立模式，参考设置三权分立设置系统管理员用户。查看DWS集群guest

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理
备份管理 - 数据治理中心 DataArts Studio

待还原的资产存储路径为备份资产中生成的文件路径。您可在还原资产前修改备份路径下的backup.json文件，支持修改连接名（connectionName）、数据库名（database）和集群名（clusterName）。图2 还原资产单击“确定”。父主题：运维调度

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
配置Doris目的端参数 - 数据治理中心 DataArts Studio

配置Doris目的端参数表1 Doris作为目的端时的作业参数参数类型参数名说明取值样例基本参数模式或表空间待写入数据的数据库名称，支持自动创建Schema。单击输入框后面的按钮可选择模式或表空间。 schema 表名写入数据的目标表名，单击输入框后面的按钮可进入表的选择界面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
获取表权限审批人列表 - 数据治理中心 DataArts Studio

群id schema_name 否 String schema名称，dws需要传这个字段 database_name 否 String 数据库名称 table_name 否 String 表名称 expire_time 否 Long 权限到期时间时间戳，毫秒。响应参数状态码：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 权限审批接口
认证鉴权 - 数据治理中心 DataArts Studio

Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存起来，避免频繁调用。使用Token前请确保Token离过期有足够的时间，防止调用API的过程中Token过期导致调用API失败。 Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API
Shell - 数据治理中心 DataArts Studio

Shell节点运行的输出结果不能大于30M，大于30M会报错。主机连接是选择执行Shell脚本的主机。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置CDM作业字段映射 - 数据治理中心 DataArts Studio

常用于标记数据库来源，以确保导入到目的端数据的完整性。图1 字段映射目前支持以下类型自定义字段：常量常量参数即参数值是固定的参数，不需要重新配置值。例如“lable”=“friends”用来标识常量值。变量您可以使用时间宏、表名宏、版本宏等变量来标记数据库来源信息。变

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
获取数据源中的表 - 数据治理中心 DataArts Studio

数据连接id，可通过数据连接列表中获取。表2 Query参数参数是否必选参数类型描述 database_name 是 String 数据库名称。 table_name 否 String 指定查询表的名称。 limit 否 String 数据条数限制。 offset 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 管理中心API > 数据源元数据获取
MRS Hive SQL - 数据治理中心 DataArts Studio

选择需要执行的脚本。如果脚本未创建，请参考新建脚本和开发SQL脚本先创建和开发脚本。数据连接是默认选择SQL脚本中设置的数据连接，支持修改。数据库是默认选择SQL脚本中设置的数据库，支持修改。 MRS资源队列否选择已创建好的MRS资源队列。说明：需要先在数据安全服务队列权限功能中，配置对应

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
LTS数据连接参数说明 - 数据治理中心 DataArts Studio

连接时，请选择一个CDM集群。如果没有可用的CDM集群，请参考创建CDM集群进行创建。数据集成配置域名是表示通过内部网络访问集群数据库的访问地址，可填写域名。内网访问域名地址在创建集群时自动生成，您可以通过管理控制台获取访问地址：根据注册的账号登录DWS云服务管理控制台。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
流程设计 - 数据治理中心 DataArts Studio

流程设计流程设计基于价值流产生，属于指标管理的流程处理模块，指导并规范需求的管理，确保业务需求受理、分析、交付等过程的高效运作；并聚焦高价值需求，实现业务价值最大化，支撑业务运作及目标的达成。数据指标流程设计首先需要基于明确的业务诉求，在明确业务需要统计的指标后，制定指标对应的数据信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标设计
数据安全总览页面 - 数据治理中心 DataArts Studio

在总览页，用户可以根据日期，根据不同数据源类型。例如查看数据仓库服务（DWS）、数据湖探索（DLI）或MapReduce服务（MRS Hive）类型的下所包含的数据库中的敏感数据，包括敏感表总数、敏感字段总数、脱敏表数、嵌入水印表数、水印溯源数。图2 数据概况数据分析报表敏感表密级分布图展示敏感

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全
管理脱敏算法 - 数据治理中心 DataArts Studio

态脱敏任务。静态脱敏场景与引擎之间的对应关系请参考参考：静态脱敏场景介绍。随机脱敏支持配置“随机算法保持原数据关联性”参数，开启后不同数据库中的相同数据，经过相同的规则脱敏后，脱敏结果是一致的。注意此参数开启后会存在被破解的安全风险，如确需开启，建议配置随机盐值，用于抵抗字典攻击。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
获取质量报告概览 - 数据治理中心 DataArts Studio

业务对象(业务报告有效)。 data_connection_id 否 String 数据连接id(技术报告有效)。 database_name 否 String 数据库名称(技术报告有效)。 table_name 否 String 数据表名称(技术报告有效)。 start_timestamp 否 Long

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量报告接口
配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数表1 Kafka作为目的端时的作业参数参数类型参数名说明取值样例基本参数 Topic 输入Topic数据库名称。 default 数据格式写入目的端时使用的数据格式。 CSV：将列按照字段分隔符拼接。 JSON: 将所有列按照指定字段名称拼接为JSON字符串。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数

总条数： 637

上一页
1
...
21
22
23
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

创建数据连接需要注意哪些事项？ - 数据治理中心 DataArts Studio

CDM Job - 数据治理中心 DataArts Studio

DRS任务切换到实时Migration作业配置 - 数据治理中心 DataArts Studio

检查集群版本与权限 - 数据治理中心 DataArts Studio

备份管理 - 数据治理中心 DataArts Studio

配置Doris目的端参数 - 数据治理中心 DataArts Studio

获取表权限审批人列表 - 数据治理中心 DataArts Studio

认证鉴权 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

获取数据源中的表 - 数据治理中心 DataArts Studio

MRS Hive SQL - 数据治理中心 DataArts Studio

LTS数据连接参数说明 - 数据治理中心 DataArts Studio

流程设计 - 数据治理中心 DataArts Studio

数据安全总览页面 - 数据治理中心 DataArts Studio

管理脱敏算法 - 数据治理中心 DataArts Studio

获取质量报告概览 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线