搜索_华为云

新建数据对账作业 - 数据治理中心 DataArts Studio

覆盖：如果对账作业名称有重复，会覆盖现有同名作业。如果选择覆盖，请在导入文件前，停止所有作业调度，否则调度中的作业会导致上传文件失败。单击“上传文件”，选择准备好的数据文件。可通过如下两种方式填写数据文件： (推荐使用) 通过“导出”功能，可将数据直接/或修改后批量导入系统。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
开发Python脚本 - 数据治理中心 DataArts Studio

请参见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

类型。此处即使自定义也不会生效。 type 操作操作类型。 INDEX：不指定主键，es内部生成id，使得每次写入都是不同id的新增数据文件。 CREATE：需要指定主键。如果主键已经存在，写入失败。 UPDATE：需要指定主键。如果主键已经存在，覆盖原有数据。 UPSERT：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
查看数据质量报告 - 数据治理中心 DataArts Studio

您可以通过以下两种方式导出质量报告：若使用局点有OBS服务，系统默认导出到关联的OBS桶中。由于质量报告数据量较大，单个导出文件字段条数最多为2000条，因此OBS桶里或许会有多个导出文件。导出的报告仅限当前工作空间内。若使用局点没有OBS服务，系统默认导出到本地。在DataArts St

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
查询作业执行历史 - 数据治理中心 DataArts Studio

Integer 总文件数。 ROWS_READ Long 读取的行数。 BYTES_READ Long 读取的字节数。 ROWS_WRITTEN Long 写入的行数。 FILES_WRITTEN Integer 写入的文件数。 FILES_READ Integer 读取的文件数。 TOTAL_SIZE

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

新增访问密钥”，如图7所示。图7 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
DataArts Studio的工作空间可以删除吗？ - 数据治理中心 DataArts Studio

数据开发组件：作业，作业目录，脚本，脚本目录和资源。数据质量组件：质量作业和对账作业。数据目录组件：技术资产中的表（Table）和文件（File）类型资产，以及元数据采集任务。数据服务组件：数据服务集群，API和APP。数据安全组件：敏感数据发现任务，脱敏策略，静态脱敏任务和数据水印任务。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
源端为Kafka - 数据治理中心 DataArts Studio

Kafka导出数据，专享版请任意输入，标准版请输入有效的消费组ID。 fromJobConfig.dataFormat 是枚举解析数据时使用的格式： BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.maxPollRecords 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
通过API工具调用APP认证方式的API - 数据治理中心 DataArts Studio

对比所下载SDK包的SHA256值和命令示例中的SHA256值。如果一致，则表示下载过程不存在篡改和丢包。生成认证信息解压SDK包，双击打开其中的“demo.html”文件，输入如下参数后，单击“Send request”查看返回值。 Key、Secret：API授权应用的AppKey

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
迁移到DWS时出现value too long for type character varying怎么处理？ - 数据治理中心 DataArts Studio

这个问题，可以通过将目的端作业参数“扩大字符字段长度”选择“是”来解决，选择此选项后，再创建目的表时会自动将varchar类型的字段长度扩大3倍。编辑CDM的表/文件迁移作业，目的端作业配置下“自动创表”选择“不存在时创建”，则高级属性下面会出现参数“扩大字符字段长度”，配置该参数为“是”即可，如图2所示。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
源端为DIS - 数据治理中心 DataArts Studio

DIS分区ID，该参数支持输入多个分区ID，使用“,”分隔。 fromJobConfig.dataFormat 是枚举解析数据时使用的格式： BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.separator 否 String 字段分隔符。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
查询作业状态 - 数据治理中心 DataArts Studio

Integer 总文件数。 ROWS_READ Long 读取的行数。 BYTES_READ Long 读取的字节数。 ROWS_WRITTEN Long 写入的行数。 FILES_WRITTEN Integer 写入的文件数。 FILES_READ Integer 读取的文件数。 TOTAL_SIZE

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
MRS Hudi数据连接参数说明 - 数据治理中心 DataArts Studio

新增访问密钥”，如图1所示。图1 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
配置数据血缘 - 数据治理中心 DataArts Studio

支持自动血缘解析的作业节点及场景作业节点支持场景 DLI SQL 支持解析DLI中表与表之间数据插入产生的血缘。支持通过建表语句产生的OBS文件到DLI表之间的血缘。 DWS SQL 支持Insert into等DML操作产生的DWS表之间的血缘。 MRS Hive SQL 支持Insert

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
DataArts Studio配置数据搬迁简介 - 数据治理中心 DataArts Studio

CDM集群和数据服务专享版集群在工作空间之间相互隔离，建议您在新空间提前准备好对应旧空间的集群。搬迁依赖于OBS功能，请您提前规划OBS桶和文件夹目录。 DataArts Studio数据搬迁时，依赖各组件的备份或导入导出能力。您可以根据自己的数据需求，自由选择搬迁哪个组件的数据。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 table 高级属性迁移行为选择写入目的端的迁移方式。新增：将文件记录直接插入指定的集合。有则替换，无则新增：以指定的过滤键作为查询条件。如果在集合中找到匹配的记录，则替换该记录。如果不存在，则添加新记录。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

huawei.opengauss.jdbc.Driver：连接GaussDB数据源时，选择此驱动程序名称。驱动文件来源是选择驱动文件的来源方式。驱动文件路径是驱动文件在OBS上的路径。需要您自行到官网下载.jar格式驱动并上传至OBS中。 MySQL驱动：获取地址https://downloads

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程

总条数： 359

上一页
1
...
12
13
14
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建数据对账作业 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

查看数据质量报告 - 数据治理中心 DataArts Studio

查询作业执行历史 - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

DataArts Studio的工作空间可以删除吗？ - 数据治理中心 DataArts Studio

源端为Kafka - 数据治理中心 DataArts Studio

通过API工具调用APP认证方式的API - 数据治理中心 DataArts Studio

迁移到DWS时出现value too long for type character varying怎么处理？ - 数据治理中心 DataArts Studio

源端为DIS - 数据治理中心 DataArts Studio

查询作业状态 - 数据治理中心 DataArts Studio

MRS Hudi数据连接参数说明 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

DataArts Studio配置数据搬迁简介 - 数据治理中心 DataArts Studio

配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线