搜索_华为云

开发SQL脚本 - 数据治理中心 DataArts Studio

支持。单击右上角的，设置相关脚本的环境变量。举例如下所示：设置Hive SQL脚本的环境变量： --hiveconf hive.merge.mapfiles=true; --hiveconf mapred.job.queue.name=queue1 设置Spark SQL脚本的环境变量：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
Shell - 数据治理中心 DataArts Studio

支持再重试。当节点运行超时导致的失败不会重试时，您可前往“默认项设置”修改此策略。当“失败重试”配置为“是”才显示“超时重试”。重试条件否失败重试选择“是”时，支持设置重试条件。打开重试条件的开关，设置返回码的范围。 Shell作业可以根据返回码判断作业节点执行失败是

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据服务专享版集群正式商用后，如何继续使用公测期间创建的数据服务专享版集群和API？ - 数据治理中心 DataArts Studio

编辑空间管理在“空间信息”中，单击“设置”按钮对已分配配额进行配置。图4 设置已分配配额数据服务已创建的API属于计费项，当前操作正在增加API配额，这会使工作空间下可以创建更多的API，同时可能使收费增加，请确认。设置专享版API已分配配额。图5 设置配额已分配配额不能小于已使

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据服务
基本概念 - 数据治理中心 DataArts Studio

时，您需要同时为添加的成员设置相应的角色。角色是一组操作权限的集合。不同的角色拥有不同的操作权限，把角色授予成员后，成员即具有了角色的所有权限。每位成员至少要拥有一个角色，并且可以同时拥有多种角色。数据集成集群一个数据集成集群运行在一个弹性云服务器之上，用户可以在集群中创建

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
配置Hive源端参数 - 数据治理中心 DataArts Studio

过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

（可选）分页配置：默认情况下，对于配置方式和默认分页的脚本/MyBatis方式API，系统将默认赋值返回量。如果需要获取特定分页数据，您可以添加如下参数设置分页，其中pageSize表示分页后的页面大小，pageNum表示页码。 https://xx.xx.xx.xx/getContestantInfo/2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

文件。图4 选择JSON文件 JSON文件上传成功后，单击“设置密码”，配置数据连接的密码或SK。图5 进入设置密码在设置密码弹窗中，依次输入各数据连接的密码或SK，完成后单击确认，回到导入作业界面。图6 设置密码在导入作业界面，单击确认，开始导入。图7 开始导入导

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
配置默认项 - 数据治理中心 DataArts Studio

仅对脚本中未设置上述参数值的情况下生效，如脚本中已设置此参数值，则优先以读取人工设置的值传递至MRS。特别提醒：如MRS集群是安全模式，则不支持此设置方式，需提前将集群设置为非安全模式。在数据开发主界面的左侧导航栏，选择“配置管理 > 配置”。单击“默认项设置”，可设置“作业运行自动传递脚本名称”配置项。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

是否必选说明作业状态轮询时间（秒）是设置轮询时间（30~60秒、120秒、180秒、240秒、300秒），每隔x秒查询一次作业是否执行完成。作业运行过程中，根据设置的作业状态轮询时间查询作业运行状态。最长等待时间是设置作业执行的超时时间，如果作业配置了重试，在超时时间内未执行完成，该作业将会再次重试。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
新建离线处理集成作业 - 数据治理中心 DataArts Studio

当“作业调度身份是否可配置”设置为“是”，该参数可见。配置委托后，作业执行过程中，以委托的身份与其他服务交互。作业优先级自动匹配创建作业时配置的作业优先级，此处支持修改。实例超时时间配置作业实例的超时时间，设置为0或不配置时，该配置项不生效。如果您为作业设置了异常通知，当作业实

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
处理消息 - 数据治理中心 DataArts Studio

action 否 Integer 执行动作。0=立刻执行, 1=定期执行。 time 否 String 使用截止时间。仅定期执行需要此参数，默认服务器当前时间三天后。响应参数状态码： 400 表4 响应Body参数参数参数类型描述 error_code String 错误码。 error_msg

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 消息管理接口
Python - 数据治理中心 DataArts Studio

选择执行Python语句的主机。需确认该主机配有用于执行Python脚本的环境。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

SQL脚本中开发完成的Hive SQL脚本“hive_sql”。数据连接：默认选择SQL脚本“hive_sql”中设置的数据连接，支持修改。数据库：默认选择SQL脚本“hive_sql”中设置的数据库，支持修改。作业编排完成后，单击，测试运行作业。如果运行成功，单击画布空白处，在右侧的“调度配置”页面，配置作业的调度策略。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
终端订阅管理 - 数据治理中心 DataArts Studio

Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。在数据开发主界面的左侧导航栏，选择“配置管理 > 配置”。单击“默认项设置”，设置“作业告警通知主题”配置项。按责任人配置工作空间作业告警通知主题的详细操作请参见作业告警通知主题。如果已配置，请忽略。图1 配置作业告警通知主题

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
日志提示解析日期格式失败时怎么处理？ - 数据治理中心 DataArts Studio

ate_test”和“test1”在云搜索服务中不存在时，CDM会在云搜索服务中自动创建该索引和类型），则CDM默认会将时间类型字段的格式设置为“yyyy-MM-dd HH:mm:ss.SSS Z”的标准格式，例如“2018-01-08 08:08:08.666 +0800”。图2

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

重新启动输入数据路径否设置输入数据路径，系统支持从HDFS或OBS的目录路径进行配置。输出数据路径否设置输出数据路径，系统支持从HDFS或OBS的目录路径进行配置。表2 配置高级参数参数是否必选说明作业状态轮询时间（秒）是设置轮询时间（30~60秒、12

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
企业模式简介 - 数据治理中心 DataArts Studio

配置开发生产环境隔离配置两套数据湖服务，进行开发与生产环境隔离。对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS等），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切换对应的数据湖。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间
基线管理 - 数据治理中心 DataArts Studio

）”，基线任务以及其依赖链上游的所有任务运行异常或者失败后，在任务未修复前，可以设置间隔时间发送告警通知。说明：最大通知次数可设置为1~50。默认为1时，最小通知间隔不显示。最小通知间隔可设置为5~60。通知方式按主题按责任人主题当“通知方式”选择“按主题”时才需配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

SQL脚本中开发完成的DWS SQL脚本“dws_sql”。数据连接：默认选择SQL脚本“dws_sql”中设置的数据连接，支持修改。数据库：默认选择SQL脚本“dws_sql”中设置的数据库，支持修改。脚本参数：通过EL表达式获取"yesterday"的值，EL表达式如下： #{Job

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

FusionInsight LibrA过程中，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。因此，在单表或整库导入到DWS/FusionInsight

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）

总条数： 554

上一页
1
...
8
9
10
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发SQL脚本 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

数据服务专享版集群正式商用后，如何继续使用公测期间创建的数据服务专享版集群和API？ - 数据治理中心 DataArts Studio

基本概念 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

配置默认项 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

新建离线处理集成作业 - 数据治理中心 DataArts Studio

处理消息 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

终端订阅管理 - 数据治理中心 DataArts Studio

日志提示解析日期格式失败时怎么处理？ - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

企业模式简介 - 数据治理中心 DataArts Studio

基线管理 - 数据治理中心 DataArts Studio

开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线