搜索_华为云

开发Python脚本 - 数据治理中心 DataArts Studio

请参见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
DataArts Studio的工作空间可以删除吗？ - 数据治理中心 DataArts Studio

数据开发组件：作业，作业目录，脚本，脚本目录和资源。数据质量组件：质量作业和对账作业。数据目录组件：技术资产中的表（Table）和文件（File）类型资产，以及元数据采集任务。数据服务组件：数据服务集群，API和APP。数据安全组件：敏感数据发现任务，脱敏策略，静态脱敏任务和数据水印任务。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
新建维度 - 数据治理中心 DataArts Studio

Alias: &aliasDimensionVo, TableType: &tableTypeDimensionVo, ObsLocation: &obsLocationDimensionVo, Owner: &ownerDimensionVo, Datasource:

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 维度接口
查询作业执行历史 - 数据治理中心 DataArts Studio

Integer 总文件数。 ROWS_READ Long 读取的行数。 BYTES_READ Long 读取的字节数。 ROWS_WRITTEN Long 写入的行数。 FILES_WRITTEN Integer 写入的文件数。 FILES_READ Integer 读取的文件数。 TOTAL_SIZE

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
PHP - 数据治理中心 DataArts Studio

获取并安装PHP安装包，如果未安装，请至PHP官方下载页面下载。将PHP安装目录中的“php.ini-production”文件复制到“C:\windows”，改名为“php.ini”，并在文件中增加如下内容。 1 2 3 extension_dir = "php安装目录/ext" extension=openssl

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考 > 使用APP认证调用API
Python - 数据治理中心 DataArts Studio

equests”库。 pip install requests 如果pip安装requests遇到证书错误，请下载并使用Python执行此文件，升级pip，然后再执行以上命令安装。获取并安装IntelliJ IDEA，如果未安装，请至IntelliJ IDEA官方网站下载。已在IntelliJ

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考 > 使用APP认证调用API
购买DataArts Studio基础包 - 数据治理中心 DataArts Studio

如果多个云服务一起搭配使用，需要注意不同区域的云服务内网不互通。例如DataArts Studio（包括管理中心、CDM等组件）需要与MRS、OBS等服务互通时，如果DataArts Studio与其他云服务处于不同区域的情况下，需要通过公网或者专线打通网络；而在同区域情况下，同子网、同安全组的不同实例默认网络互通。

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
步骤6：数据开发处理 - 数据治理中心 DataArts Studio

在DataArts Studio数据开发模块中，您将完成以下步骤：数据管理脚本开发作业开发历史数据到源数据表，使用数据集成将历史数据从OBS导入到SDI贴源层的原始数据表。历史数据清洗，使用数据开发的MRS Hive SQL脚本将源数据表清洗之后导入DWI层的标准出行数据表。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
迁移到DWS时出现value too long for type character varying怎么处理？ - 数据治理中心 DataArts Studio

这个问题，可以通过将目的端作业参数“扩大字符字段长度”选择“是”来解决，选择此选项后，再创建目的表时会自动将varchar类型的字段长度扩大3倍。编辑CDM的表/文件迁移作业，目的端作业配置下“自动创表”选择“不存在时创建”，则高级属性下面会出现参数“扩大字符字段长度”，配置该参数为“是”即可，如图2所示。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

主题信息。您可以下载系统提供的主题设计模板，在模板文件中填写主题的相关参数后，使用模板批量导入主题信息。您可以预先将某个DataArts Studio实例的数据架构中已建立的主题设计信息导出到Excel文件中。导出后的文件可用于导入。建立好主题设计信息后，可以对主题信息进行查找、编辑或删除操作。

帮助中心 > 数据治理中心 DataArts Studio > 功能总览
更新维度 - 数据治理中心 DataArts Studio

Alias: &aliasDimensionVo, TableType: &tableTypeDimensionVo, ObsLocation: &obsLocationDimensionVo, Owner: &ownerDimensionVo, Datasource:

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 维度接口
目的 - 数据治理中心 DataArts Studio

然后结合华为数据治理案例和新冠疫情简单描述了数据治理的应用，最后描述了方法论在DataArts Studio产品上的落地以及详细的落地指导文档。

帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论
项目ID和账号ID - 数据治理中心 DataArts Studio

接口为“GET https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点，可参考IAM文档获取。接口的认证鉴权请参见认证鉴权。响应示例如下，其中projects下的“id”即为项目ID。当返回多个id，请依据实际的区域（name）获取。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
Python - 数据治理中心 DataArts Studio

数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置DIS源端参数 - 数据治理中心 DataArts Studio

最早：最小偏移量，即拉取最早的数据。最新 APP名字配置用户数据消费程序的唯一标识符，不存在时会自动创建。 cdm 数据格式解析数据时使用的格式：二进制格式：适用于文件迁移场景，不解析数据内容原样传输。 CSV格式：以CSV格式解析源数据。 JSON格式：以JSON格式解析源数据。二进制格式字段分隔符

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
数据源和资源组网络不通如何排查？ - 数据治理中心 DataArts Studio

查看是否创建了数据源相关VPC和子网的网络连接，并且该网络连接是否成功绑定资源组。请检查数据源实例安全组入方向规则，确认是否已放通资源组的网段。请阅读网络打通文档，逐步检查操作，确保都已正确配置。父主题：数据集成（实时作业）

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）

总条数： 818

上一页
1
...
36
37
38
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发Python脚本 - 数据治理中心 DataArts Studio

DataArts Studio的工作空间可以删除吗？ - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

查询作业执行历史 - 数据治理中心 DataArts Studio

PHP - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

购买DataArts Studio基础包 - 数据治理中心 DataArts Studio

步骤6：数据开发处理 - 数据治理中心 DataArts Studio

迁移到DWS时出现value too long for type character varying怎么处理？ - 数据治理中心 DataArts Studio

HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

更新维度 - 数据治理中心 DataArts Studio

目的 - 数据治理中心 DataArts Studio

项目ID和账号ID - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

配置DIS源端参数 - 数据治理中心 DataArts Studio

数据源和资源组网络不通如何排查？ - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线