搜索_华为云

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

#每一行数据按照空格拆分得到一个个单词 words = lines.flatMap(lambda line:line.split(" "),True) #将每个单词组装成一个tuple 计数1 pairWords = words.map(lambda word:(word

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置DLI目的端参数 - 数据治理中心 DataArts Studio

配置DLI目的端参数表1 DLI作为目的端时的作业参数参数名说明取值样例资源队列选择目的表所属的资源队列。 DLI的default队列无法在迁移作业中使用，您需要在DLI中新建SQL队列。新建队列操作请参考创建队列。 cdm 数据库名称写入数据的数据库名称。 dli

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业目的端参数
查询多种类型的表信息 - 数据治理中心 DataArts Studio

object value，统一的返回结果的外层数据结构。表6 value 参数参数类型描述 total Integer 总量。 records Array of AllTableVO objects 查询到的审批单对象（AllTableVO）数组。表7 AllTableVO 参数

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 信息架构接口
数据安全总览页面 - 数据治理中心 DataArts Studio

在总览页，用户可以根据日期，根据不同数据源类型。例如查看数据仓库服务（DWS）、数据湖探索（DLI）或MapReduce服务（MRS Hive）类型的下所包含的数据库中的敏感数据，包括敏感表总数、敏感字段总数、脱敏表数、嵌入水印表数、水印溯源数。图2 数据概况数据分析报表敏感表密级分布图展示敏感

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全
启用细粒度认证 - 数据治理中心 DataArts Studio

配置权限详见配置权限集或配置角色。 DWS联通性测试前，已完成用户同步，然后将当前登录账号切换为IAM子用户账号，且至少具有DWS Database Access权限。已经为MRS Hive连接和MRS SPARK连接中的用户配置了代理权限，请参考参考：为MRS数据连接用户配置代理权限进行配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
源端为Kafka - 数据治理中心 DataArts Studio

BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.maxPollRecords 否 String 每次向Kafka请求数据限制最大请求记录数。 fromJobConfig.maxPollInterval 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
数据安全 - 数据治理中心 DataArts Studio

username/password,login denied”怎么办？启用细粒度认证后，在数据开发组件选择数据库时报错“Failed to obtain the database”怎么办？为什么权限同步到DLI中，会提示权限不够？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
目的端作业参数说明 - 数据治理中心 DataArts Studio

目的端作业参数说明目的端为关系数据库目的端为OBS 目的端为HDFS 目的端为Hive 目的端为HBase/CloudTable 目的端为DDS 目的端为Elasticsearch/云搜索服务目的端为DLI 目的端为DIS 父主题：附：公共数据结构

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构
源端作业参数说明 - 数据治理中心 DataArts Studio

源端作业参数说明源端为关系数据库源端为对象存储源端为HDFS 源端为Hive 源端为HBase/CloudTable 源端为FTP/SFTP 源端为HTTP/HTTPS 源端为MongoDB/DDS 源端为Redis 源端为DIS 源端为Kafka 源端为Elasticsearch/云搜索服务

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构
更新规则模板 - 数据治理中心 DataArts Studio

表示准确性，Consistency表示一致性。 type String 规则类型，Field表示字段级规则，Table表示表级规则，Database表示库级规则，Cross-field表示跨字段级规则，Customize表示自定义规则。 system_template Boolean

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 规则模板接口
MRS Impala SQL - 数据治理中心 DataArts Studio

MRS Impala SQL 功能通过MRS Impala SQL节点执行数据开发模块中预先定义的Impala SQL脚本。参数用户可参考表1和表2配置MRS Impala节点的参数。表1 属性参数参数是否必选说明节点名称是节点名称，可以包含中文、英文字母、数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
批量配置作业 - 数据治理中心 DataArts Studio

批量配置作业参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。单击作业目录中的，选择“显示复选框”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
新建复合指标 - 数据治理中心 DataArts Studio

新建复合指标复合指标是由一个或多个衍生指标叠加计算而成，其中的维度、限定均继承于衍生指标。注意，不能脱离衍生指标、维度和限定的范围，去产生新的维度和限定。约束与限制单工作空间允许创建的复合指标个数最多5000个。前提条件您已新建衍生指标，并且衍生指标已通过审核，具体操作请参见新建衍生指标。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
同步IAM用户到数据源 - 数据治理中心 DataArts Studio

0以下时，才支持用户同步。DWS集群guest_agent版本查看方法请参考查看DWS集群guest agent版本。 DWS数据源用户同步前，要求用户已至少配置DWS Database Access权限，否则会同步失败。 IAM用户同步到DWS，需要为dlg_agency委托配置如下权限，详见授权dlg_agency委托：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理
MRS HetuEngine - 数据治理中心 DataArts Studio

MRS HetuEngine 功能通过MRS HetuEngine节点执行数据开发模块中预先定义的HetuEngine SQL脚本。参数用户可参考表1和表2配置MRS HetuEngine节点的参数。表1 属性参数参数是否必选说明节点名称是节点名称，可以包含中

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
作业开发流程 - 数据治理中心 DataArts Studio

作业开发流程作业开发功能提供如下能力：提供图形化设计器，支持拖拉拽方式快速构建数据处理工作流。预设数据集成、计算&分析、资源管理、数据监控、其他等多种任务类型，通过任务间依赖完成复杂数据分析处理。支持多种作业调度方式。支持导入和导出作业。支持作业状态运维监控和作业结果通知。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
数据架构支持哪些数据建模方法？ - 数据治理中心 DataArts Studio

型，再进一步细化设计出逻辑模型，最后设计物理模型。物理模型：是在逻辑数据模型的基础上，考虑各种具体的技术实现因素，进行数据库体系结构设计，真正实现数据在数据库中的存放，例如：所选的数据仓库是DWS或DLI。维度建模维度建模是从分析决策的需求出发构建模型，它主要是为分析需求服

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据架构
为什么权限同步到DLI中，会提示权限不够？ - 数据治理中心 DataArts Studio

DLI权限同步时，需要该权限。例如DLI权限同步时，如果无此权限会导致同步失败，系统提示权限不足。 DLI权限管理时必选 dli:database:grantPrivilege dli:table:grantPrivilege dli:column:grantPrivilege

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据安全
配置Doris源端参数 - 数据治理中心 DataArts Studio

配置Doris源端参数 Doris源端参数列表参数类型参数名说明取值样例基本参数使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，CDM将根据该语句导出数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
Spark Python脚本如何引用Python脚本？ - 数据治理中心 DataArts Studio

Spark Python脚本如何引用Python脚本？下图为一个Python脚本： def hello1(odps): sql_str="""select date_ptn ( to_char (

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发

总条数： 808

上一页
1
...
24
25
26
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

配置DLI目的端参数 - 数据治理中心 DataArts Studio

查询多种类型的表信息 - 数据治理中心 DataArts Studio

数据安全总览页面 - 数据治理中心 DataArts Studio

启用细粒度认证 - 数据治理中心 DataArts Studio

源端为Kafka - 数据治理中心 DataArts Studio

数据安全 - 数据治理中心 DataArts Studio

目的端作业参数说明 - 数据治理中心 DataArts Studio

源端作业参数说明 - 数据治理中心 DataArts Studio

更新规则模板 - 数据治理中心 DataArts Studio

MRS Impala SQL - 数据治理中心 DataArts Studio

批量配置作业 - 数据治理中心 DataArts Studio

新建复合指标 - 数据治理中心 DataArts Studio

同步IAM用户到数据源 - 数据治理中心 DataArts Studio

MRS HetuEngine - 数据治理中心 DataArts Studio

作业开发流程 - 数据治理中心 DataArts Studio

数据架构支持哪些数据建模方法？ - 数据治理中心 DataArts Studio

为什么权限同步到DLI中，会提示权限不够？ - 数据治理中心 DataArts Studio

配置Doris源端参数 - 数据治理中心 DataArts Studio

Spark Python脚本如何引用Python脚本？ - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线