搜索_华为云

新建事实表 - 数据治理中心 DataArts Studio

单击“编辑”按钮，并打开“生成异常数据”的开关。开启此项，表示异常数据将按照配置的参数存储到规定的库中。输入数据库或Schema信息，表示存储异常数据的数据库或Schema。设置异常表的表前缀和表后缀，表示存储异常数据的表前缀和后缀。异常表的前后和后缀只能包含英文字母、数字和下划线。配置好以后，单击保存异常数据配置信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

间。自定义字段配置自定义字段的参数名称和参数值。作业标签配置作业的标签，用以分类管理作业。单击“新增”，可给作业重新添加一个标签。也可选择管理作业标签中已配置的标签。配置作业参数单击编辑器右侧的“参数”，展开配置页面，配置如表4所示的参数。表4 作业参数配置功能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
Python - 数据治理中心 DataArts Studio

选择执行Python语句的主机。需确认该主机配有用于执行Python脚本的环境。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
主题设计 - 数据治理中心 DataArts Studio

填写好模板中的相关参数并保存。模板参数的详细描述请参见表3。导出的主题设计信息您可以将某个DataArts Studio实例的数据架构中已建立的主题设计信息导出到Excel文件中。导出后的文件可用于导入。关于导出主题设计的更多信息，请参见导出主题设计信息。下载的主题导入模板

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 数据调研
源端为对象存储 - 数据治理中心 DataArts Studio

GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 fromJobConfig.jsonReferenceNode 否 String 记录节点，当文件格式为“JSON_FILE”时此参数有效。对该JSON节点下的数据进行解析，如果该节点对应的数据为JSON数组，那

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
Shell - 数据治理中心 DataArts Studio

中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往ECS主机的/tmp目录下去运行的，需要确保/tmp目录磁盘不被占满。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

单击“选择模板”，选择已创建好的脚本模板，系统支持可以引用多个模板。创建模板的详细操作请参见配置模板。 MRS Flink作业的运行程序参数，请参见《MapReduce用户指南》中的运行Flink作业。 Flink作业执行参数否配置Flink作业执行参数。 Flink程序执行的关键参数，该参

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
查询连接详情（待下线） - 数据治理中心 DataArts Studio

如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。响应参数表3 Connection参数说明参数名是否必选参数类型说明 name 是 String 连接名称，只能包含四种字符：英文字母、数字、中划线和下划线，且长度小于等于100个字符。连接名称不能重复。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
查询数据服务集群访问日志列表 - 数据治理中心 DataArts Studio

ect-Token的值。 workspace 是 String 工作空间ID，获取方法请参见实例ID和工作空间ID。 Content-Type 否 String 消息体的类型（格式），有Body体的情况下必选，没有Body体无需填写。如果请求消息体中含有中文字符，则需要通过cha

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 集群管理接口
开发一个Python作业 - 数据治理中心 DataArts Studio

hell、Python脚本的调度频率很高，ECS主机会将Agent的内网IP加入黑名单。为了保障作业的正常调度，强烈建议您使用ECS主机的root用户将绑定Agent（即CDM集群）的内网IP加到/etc/hosts.allow文件里面。 CDM集群的内网IP获取方式请参见查看并修改CDM集群配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
新建原子指标 - 数据治理中心 DataArts Studio

原子指标是对指标统计逻辑、具体算法的一个抽象。为了从根源上解决定义、研发不一致的问题，指标定义明确设计统计逻辑（即计算逻辑），不需要ETL二次或者重复研发，从而提升了研发效率，也保证了统计结果的一致性。原子指标：原子指标中的度量和属性来源于多维模型中的维度表和事实表，与多维模型所属的业务对象保持一

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
修改连接（待下线） - 数据治理中心 DataArts Studio

如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 Connection参数说明参数名是否必选参数类型说明 name 是 String 连接名称，只能包含五种字符：英文字母、数字、中划线和下划线，且长度小于等于100个字符。连接名称不能重复。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

单击“选择模板”，选择已创建好的脚本模板，系统支持可以引用多个模板。创建模板的详细操作请参见配置模板。 MRS Flink作业的运行程序参数，请参见《MapReduce用户指南》中的运行Flink作业。 Flink作业执行参数配置Flink作业执行参数。 Flink程序执行的关键参数，该参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
配置环境变量 - 数据治理中心 DataArts Studio

变量是指不同的空间下取值不同，需要重新配置值，比如“工作空间名称”变量，这个值在不同的空间下配置不一样，导出导入后需要重新进行配置。常量是指在不同的空间下都是一样的，导入的时候，不需要重新配置值。图2 环境变量配置表1 环境变量参数配置参数是否必选说明参数名称是

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
新建数据对账作业 - 数据治理中心 DataArts Studio

当“规则类型”选择“自定义规则”，数据对象选择对应的数据库即可。数据对象在来源对象选择的数据表将和右侧目的对象的数据表做结果比较。选择配置的数据对账规则所应用到的表。说明：数据表与数据库强相关，基于已选择的数据库。数据库基于已建立的数据连接。 SQL 当“规则类型”选择“自定义规则”时，需要配置该

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
源端为FTP/SFTP - 数据治理中心 DataArts Studio

个分片，一个处理9个10M的文件，一个处理1个200M的文件。 fromJobConfig.jsonReferenceNode 否 String 记录节点，当文件格式为“JSON_FILE”时此参数有效。对该JSON节点下的数据进行解析，如果该节点对应的数据为JSON数组，那么系

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
查询连接列表（待下线） - 数据治理中心 DataArts Studio

String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。响应参数参数名是否必选参数类型说明 total 是 Integer 总的连接个数 connections 是 List<Connections>

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
新建时间限定 - 数据治理中心 DataArts Studio

原子指标是计算逻辑的标准化定义，时间限定则是条件限制的标准化定义。为保障所有统计指标统一、标准、规范地构建，时间限定在业务板块内唯一，并唯一归属于一个来源逻辑表，计算逻辑也以该来源逻辑表模型的字段为基础进行定义。由于一个时间限定的定义可能来自于归属不同数据域的多个逻辑表，因此一个时间限定可能归属于多个数据域。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
查询数据分类列表 - 数据治理中心 DataArts Studio

Token，通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）使用Token认证时必选。响应参数状态码： 200 表4 响应Body参数参数参数类型描述 total Integer 数据分类总的数量 category_groups Array of DataCategoryDTO

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 数据分类接口
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

景。 CSV格式换行符处理方式指定在写入文本文件表的数据包含换行符，特指(\n|\r|\r\n)的情况下处理换行符的策略。删除不处理替换为其他字符串删除换行符替换字符串当换行符处理方式选择为替换时，指定替换的字符串。 - 高级属性写入到临时文件文件格式为二进制格式时显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数

总条数： 489

上一页
1
...
6
7
8
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建事实表 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

主题设计 - 数据治理中心 DataArts Studio

源端为对象存储 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

查询连接详情（待下线） - 数据治理中心 DataArts Studio

查询数据服务集群访问日志列表 - 数据治理中心 DataArts Studio

开发一个Python作业 - 数据治理中心 DataArts Studio

新建原子指标 - 数据治理中心 DataArts Studio

修改连接（待下线） - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

配置环境变量 - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

查询连接列表（待下线） - 数据治理中心 DataArts Studio

新建时间限定 - 数据治理中心 DataArts Studio

查询数据分类列表 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线