搜索_华为云

创建简单模式工作空间 - 数据治理中心 DataArts Studio

数据开发组件：作业，作业目录，脚本，脚本目录和资源。数据质量组件：质量作业和对账作业。数据目录组件：技术资产中的表（Table）和文件（File）类型资产，以及元数据采集任务。数据服务组件：数据服务集群，API和APP。数据安全组件：敏感数据发现任务，脱敏策略，静态脱敏任务和数据水印任务。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 创建并配置简单模式工作空间
查找衍生指标 - 数据治理中心 DataArts Studio

variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment String ak = System.getenv("CLOUD_SDK_AK"); String sk = System.get

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 衍生指标接口
Python - 数据治理中心 DataArts Studio

数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MRS MapReduce - 数据治理中心 DataArts Studio

具体操作请参考新建资源。 Jar包参数否 Jar包的参数。输入数据路径否选择输入数据所在的路径。输出数据路径否选择输出数据存储的路径。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
主机连接参数说明 - 数据治理中心 DataArts Studio

etc/hosts.allow文件里面。 CDM集群的内网IP获取方式请参见查看并修改CDM集群配置。端口是主机的SSH端口号。 Linux操作系统主机的默认登录端口为22，如有修改可通过主机路径“/etc/ssh/sshd_config”文件中的port字段确认端口号。 KMS密钥

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
如何查看审计日志 - 数据治理中心 DataArts Studio

如何查看审计日志概述云审计服务（Cloud Trace Service，CTS）可以记录DataArts Studio相关的操作事件，用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。在您开启了云审计服务后，系统开始记录DataArts Studio的相关操作，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 审计日志
补数据场景使用介绍 - 数据治理中心 DataArts Studio

补数据场景使用介绍适用场景在某项目搬迁场景下，当您需要补充以前时间段内的历史业务数据，需要查看历史数据的详细信息时，可以使用补数据特性。补数据是指作业执行一个调度任务，在过去某一段时间里生成一系列的实例。用户可以通过补数据，修正历史中出现数据错误的作业实例，或者构建更多的作业记录以便调试程序等。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
补数据场景使用介绍 - 数据治理中心 DataArts Studio

补数据场景使用介绍适用场景在某项目搬迁场景下，当您需要补充以前时间段内的历史业务数据，需要查看历史数据的详细信息时，可以使用补数据特性。补数据是指作业执行一个调度任务，在过去某一段时间里生成一系列的实例。用户可以通过补数据，修正历史中出现数据错误的作业实例，或者构建更多的作业记录以便调试程序等。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
报错“配置项[linkConfig.createBackendLinks]不存在”或“配置项 [throttlingConfig.concurrentSubJobs] 不存在怎么办”？ - 数据治理中心 DataArts Studio

报错“配置项[linkConfig.createBackendLinks]不存在”或“配置项 [throttlingConfig.concurrentSubJobs] 不存在怎么办”？问题描述创建数据连接时报错“配置项[linkConfig.createBackendLinks]不存在”或创建作业时报错“配置项

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
Shell - 数据治理中心 DataArts Studio

数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
创建并管理工作空间 - 数据治理中心 DataArts Studio

Studio数据开发的作业日志默认存储在以“dlf-log-{projectId}”命名的OBS桶中。{projectId}即项目ID，您可以参考获取项目ID和账号ID进行获取。 DLI脏数据OBS路径用于指定DataArts Studio数据开发中DLI SQL执行过程中的脏数据存储的OBS桶。工作空间成员如需使用DataArts

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 管理工作空间
配置OBS桶 - 数据治理中心 DataArts Studio

如果未配置测试运行历史OBS桶，则无法查看历史运行的详细信息。请参考本节操作配置OBS桶。约束限制 OBS路径仅支持OBS桶，不支持并行文件系统。配置方法参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
Spark Python脚本如何引用Python脚本？ - 数据治理中心 DataArts Studio

hello1(odps) # print("xxx") --py-files hdfs:///tmp/pyspark/hello.py 在作业算子MRS Spark Python中引用Python脚本：在运行程序参数中配置参数--py-files和参数值hdfs:///tmp/pyspark/hello

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
开发一个Python作业 - 数据治理中心 DataArts Studio

etc/hosts.allow文件里面。 CDM集群的内网IP获取方式请参见查看并修改CDM集群配置。端口是主机的SSH端口号。 Linux操作系统主机的默认登录端口为22，如有修改可通过主机路径“/etc/ssh/sshd_config”文件中的port字段确认端口号。 KMS密钥

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
作业开发流程 - 数据治理中心 DataArts Studio

作业开发流程作业开发功能提供如下能力：提供图形化设计器，支持拖拉拽方式快速构建数据处理工作流。预设数据集成、计算&分析、资源管理、数据监控、其他等多种任务类型，通过任务间依赖完成复杂数据分析处理。支持多种作业调度方式。支持导入和导出作业。支持作业状态运维监控和作业结果通知。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
新建衍生指标 - 数据治理中心 DataArts Studio

更新：当数据重复时系统中的原有数据为草稿状态，则会覆盖生成新的草稿数据。系统中的原有数据为发布状态，则会生成下展数据。单击“添加文件”，选择编辑完成的导入模板。单击“上传文件”，上传完成后，自动跳转到“上次导入”页签，查看已导入的数据。单击“关闭”。导出可通过导出的方式将衍生指标导出到本地。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
配置OBS源端参数 - 数据治理中心 DataArts Studio

JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。 CSV格式列表文件当“文件格式”选择为“二进制格式”时，才有该参数。打开列表文件功能时，支持读取OBS桶中文件（如txt文件）的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径（不支持目录），例如直接写为如下内容：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数
开发Shell脚本 - 数据治理中心 DataArts Studio

请参见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
示例场景说明 - 数据治理中心 DataArts Studio

示例场景说明本实践通过DataArts Studio服务的数据集成CDM组件、数据开发DLF组件和数据仓库服务（DWS）对电影评分原始数据进行分析，输出评分最高和最活跃Top10电影。您可以学习到数据集成模块的数据迁移和数据开发模块的脚本开发、作业开发、作业调度等功能，以及DWS

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
查询实时作业运行状态 - 数据治理中心 DataArts Studio

"totalGetBytes": 0, "totalGetRecords": 0, "totalPutBytes": 0, "totalPutRecords": 0 } ], "status": "NORMAL"

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API

总条数： 1031

上一页
1
...
40
41
42
...
52
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建简单模式工作空间 - 数据治理中心 DataArts Studio

查找衍生指标 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

MRS MapReduce - 数据治理中心 DataArts Studio

主机连接参数说明 - 数据治理中心 DataArts Studio

如何查看审计日志 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

报错“配置项[linkConfig.createBackendLinks]不存在”或“配置项 [throttlingConfig.concurrentSubJobs] 不存在怎么办”？ - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

创建并管理工作空间 - 数据治理中心 DataArts Studio

配置OBS桶 - 数据治理中心 DataArts Studio

Spark Python脚本如何引用Python脚本？ - 数据治理中心 DataArts Studio

开发一个Python作业 - 数据治理中心 DataArts Studio

作业开发流程 - 数据治理中心 DataArts Studio

新建衍生指标 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

查询实时作业运行状态 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线