搜索_华为云

Spark Python脚本如何引用Python脚本？ - 数据治理中心 DataArts Studio

SparkSession,SQLContext import hello def execute_sql(sql_query): return odps.sql(sql_query) def create_spark_session(): conf = SparkConf()

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
步骤1：数据准备 - 数据治理中心 DataArts Studio

csv后缀，选择“UTF-8”编码格式（不能带BOM），则能以CSV格式保存该文件。将源数据CSV文件上传到OBS服务。登录控制台，选择“存储 > 对象存储服务 OBS”，进入OBS控制台。单击“创建桶”，然后根据页面提示配置参数，创建一个名称为“fast-demo”的OBS桶。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
隐私数据保护简介 - 数据治理中心 DataArts Studio

表。而目标表数据可以用来对外提供数据服务，为数据安全使用提供基础保障。动态脱敏在数据安全组件创建动态脱敏策略后，系统会将动态脱敏策略同步到数据源服务，由数据源对数据列按照指定规则进行动态脱敏。当策略中指定的用户和用户组在访问敏感数据时，系统会直接返回由数据源动态脱敏后的数据，保护敏感数据不被泄露。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护
通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

il01、mail02和mail03，且表结构一致，数据内容不同。目的端为MRS Hive服务。操作前提已创建CDM集群。已经开通了MRS Hive服务。已经在MRS Hive服务中创建了数据库和表。创建连接登录DataArts Studio控制台，找到所需要的DataArts

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
DataArts Studio支持连接哪些数据源？ - 数据治理中心 DataArts Studio

DataArts Studio支持连接哪些数据源？ DataArts Studio支持对接如DLI、DWS、MRS Hive等云服务，也支持对接如MySQL、Oracle等传统数据库，支持程度各有不同，详情请参见DataArts Studio支持的数据源章节。 DataArts

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 管理中心
步骤2：数据准备 - 数据治理中心 DataArts Studio

Studio前，您需要根据业务场景选择符合需求的云服务或数据库作为数据湖底座，由数据湖底座提供存储和计算的能力，DataArts Studio基于数据湖底座进行一站式数据开发、治理和服务。 DataArts Studio平台支持对接如DLI、DWS、MRS Hive等云服务，也支持对接如MySQL、O

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
配置实时网络连接 - 数据治理中心 DataArts Studio

业务VPC）和数据源VPC，再通过对等连接方式连通业务VPC与资源组网段。优点：无需额外购买其他服务。缺点：操作复杂，局限性大，需要根据用户实际组网去修改网络链路上的路由及服务配置，后续每增加一个资源组就须重复操作一遍整个流程。约束限制资源组为私网网段，不能与本租户VPC重叠，否则会导致网络无法打通。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 管理DataArts Studio资源
数据库、数据仓库、数据湖与华为智能数据湖方案是什么，有哪些区别和联系？ - 数据治理中心 DataArts Studio

者能快速有效地从大量数据中，分析出有价值的信息，提供决策支持。自从数据仓库出现之后，信息产业就开始从以关系型数据库为基础的运营式系统慢慢向决策支持系统发展。数据仓库相比数据库，主要有以下两个特点：数据仓库是面向主题集成的。数据仓库是为了支撑各种业务而建立的，数据来自于分散的操

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
DLI Spark - 数据治理中心 DataArts Studio

作业之后进行变量替换。说明： Spark作业不支持自定义设置jvm垃圾回收算法。 Module名称否 DLI系统提供的用于执行跨源作业的依赖模块，访问各个不同的服务，选择不同的模块： CloudTable/MRS HBase: sys.datasource.hbase DDS：sys

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
删除连接 - 数据治理中心 DataArts Studio

描述 200 OK。 400 请求错误。 401 鉴权失败。 403 没有操作权限。 404 找不到资源。 500 服务内部错误，具体返回错误码请参考错误码。 503 服务不可用。错误码请参见错误码。父主题：连接管理

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 连接管理
企业模式简介 - 数据治理中心 DataArts Studio

配置企业模式环境隔离，包含DLI队列配置和DB配置。对于Serverless服务（例如DLI），DataArts Studio通过管理中心的环境隔离来配置生产环境和开发环境数据湖服务的对应关系，在开发和生产流程中自动切换对应的数据湖。因此您需要在Serverless数据湖服务中准备两套队列、两套数据库资源，建议通过

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间
使用CDM迁移数据由于字段类型映射不匹配导致报错怎么处理？ - 数据治理中心 DataArts Studio

使用CDM迁移数据由于字段类型映射不匹配导致报错怎么处理？问题描述在使用CDM迁移数据到数据仓库服务（DWS）时，迁移作业失败，且执行日志中出现“value too long for type character varying”错误提示。原因分析这种情况一般是源表与目标

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
删除作业 - 数据治理中心 DataArts Studio

请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。响应参数状态码： 500 表3 响应Body参数参数参数类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
上传存量数据 - 数据治理中心 DataArts Studio

连接H公司本地的Apache Hadoop HDFS文件系统时，连接类型选择“Apache HDFS”，然后单击“下一步”。图2 创建HDFS连接名称：用户自定义连接名称，例如“hdfs_link”。 URI：配置为H公司HDFS文件系统的Namenode URI地址。认证类型：安全

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
监控安全风险 - 数据治理中心 DataArts Studio

监控安全风险 DataArts Studio提供基于云监控服务CES的资源监控能力，帮助用户监控账号下的DataArts Studio数据集成模块中的CDM集群，执行自动实时监控、告警和通知操作。用户可以实时掌握集群运行中所产生的网络流入速率、网络流出速率、CPU使用率、内存使用率、磁盘利用率、失败作业率等信息。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 安全
MySQL数据迁移到OBS - 数据治理中心 DataArts Studio

连接管理 > 驱动管理”页面，上传了MySQL数据库驱动。创建CDM集群并绑定EIP 如果是独立CDM服务，参考创建集群创建CDM集群；如果是作为DataArts Studio服务CDM组件使用，参考创建集群创建CDM集群。关键配置如下： CDM集群的规格，按待迁移的数据量选择，一般选择cdm

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 使用教程
查询作业详情 - 数据治理中心 DataArts Studio

MRSSpark：执行MRS服务的Spark作业 MapReduce：执行MRS服务的MapReduce作业 MRSFlinkJob: 执行MRS服务的FlinkJob作业。 MRSHetuEngine: 执行MRS服务的HetuEngine作业。 DLISpark：执行DLF服务的Spark作业

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
实时集成作业监控 - 数据治理中心 DataArts Studio

对于运行状态异常的实时集成作业，可以进行停止操作。单击“停止”，系统弹出停止任务的提示框。单击“确认”，停止该任务。实时集成作业监控：恢复对于运行状态异常的实时集成作业，可以进行恢复操作。单击“恢复”。系统提示“操作成功”，任务恢复成功。实时集成作业监控：查看作业详细信息

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
数据集成API错误码 - 数据治理中心 DataArts Studio

连接到文件服务器时出错。连接到文件服务器时出错。请联系客服或技术支持人员协助解决。 Cdm.0413 400 向文件服务器传输数据时出错。向文件服务器传输数据时出错。请联系客服或技术支持人员协助解决。 Cdm.0415 400 从文件服务器下载文件出错。从文件服务器下载文件出错。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录 > 错误码
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？问题描述 CDM迁移数据到DWS时如何选取分布列？解决方案在使用CDM迁移数据到数据仓库服务（DWS）或者FusionInsight LibrA，且CDM在DWS端自动创建一个新表时，在创建作业的字段映射界面，需要选择分布列，如图1所示。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成

总条数： 1244

上一页
1
...
33
34
35
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Python脚本如何引用Python脚本？ - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

隐私数据保护简介 - 数据治理中心 DataArts Studio

通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

DataArts Studio支持连接哪些数据源？ - 数据治理中心 DataArts Studio

步骤2：数据准备 - 数据治理中心 DataArts Studio

配置实时网络连接 - 数据治理中心 DataArts Studio

数据库、数据仓库、数据湖与华为智能数据湖方案是什么，有哪些区别和联系？ - 数据治理中心 DataArts Studio

DLI Spark - 数据治理中心 DataArts Studio

删除连接 - 数据治理中心 DataArts Studio

企业模式简介 - 数据治理中心 DataArts Studio

使用CDM迁移数据由于字段类型映射不匹配导致报错怎么处理？ - 数据治理中心 DataArts Studio

删除作业 - 数据治理中心 DataArts Studio

上传存量数据 - 数据治理中心 DataArts Studio

监控安全风险 - 数据治理中心 DataArts Studio

MySQL数据迁移到OBS - 数据治理中心 DataArts Studio

查询作业详情 - 数据治理中心 DataArts Studio

实时集成作业监控 - 数据治理中心 DataArts Studio

数据集成API错误码 - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线