-
CDM迁移性能如何? - 数据治理中心 DataArts Studio
CDM迁移性能如何? 单个cdm.large规格实例理论上可以支持1TB~8TB/天的数据迁移,实际传输速率受公网带宽、集群规格、文件读写速度、作业并发数设置、磁盘读写性能等因素影响。更多详情请参见性能白皮书。 父主题: 数据集成
-
配置Elasticsearch/云搜索服务(CSS)目的端参数 - 数据治理中心 DataArts Studio
配置Elasticsearch/云搜索服务(CSS)目的端参数 作业中目的连接为配置Elasticsearch连接或配置云搜索服务(CSS)连接时,即将数据导入到Elasticsearch/云搜索服务(CSS)时,目的端作业参数如表1所示。 表/文件迁移和整库迁移时需配置的参数不
-
认证鉴权 - 数据治理中心 DataArts Studio
进入“我的凭证”页面,选择“访问密钥 > 新增访问密钥”,如图1所示。 图1 单击新增访问密钥 单击“确定”,根据浏览器提示,保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件,即可查看访问密钥(Access Key Id和Secret
-
如何备份CDM作业? - 数据治理中心 DataArts Studio
如何备份CDM作业? 用户可以先通过CDM的批量导出功能,把所有作业脚本保存到本地,仅在需要的时候再重新创建集群、重新导入作业,实现作业备份。 父主题: 数据集成
-
如何查看审计日志 - 数据治理中心 DataArts Studio
Studio的相关操作,云审计服务的管理控制台保存最近7天的操作记录。 前提条件 已开通云审计服务。开通方式请参见开通云审计服务。 操作步骤 登录管理控制台,在服务列表中选择“云审计服务 CTS”,进入云审计服务控制台。 在云审计服务控制台,默认展示事件列表,您可以通过筛选来查询对应的操作事件。 其中,DataArts
-
返回结果 - 数据治理中心 DataArts Studio
"error_code": "AS.0001" } 其中,error_code表示错误码,error_msg表示错误描述信息。 父主题: 如何调用API
-
IF条件判断教程 - 数据治理中心 DataArts Studio
getNodeStatus("test2")) == "success" ? "true" : "false"}, test3节点IF条件表达式为:#{(Job.getNodeStatus("test3")) == "success" ? "true" : "false"}, 此处表达式均采用前一个节点的执行状态进行IF条件判断。
-
CDM迁移数据到DWS时如何选取分布列? - 数据治理中心 DataArts Studio
CDM迁移数据到DWS时如何选取分布列? 在使用CDM迁移数据到数据仓库服务(DWS)或者FusionInsight LibrA,且CDM在DWS端自动创建一个新表时,在创建作业的字段映射界面,需要选择分布列,如图1所示。 图1 选取分布列 由于分布列的选取,对于DWS/FusionInsight
-
重启集群 - 数据治理中心 DataArts Studio
Studio服务进入数据集成界面可以看到。 选择集群操作列中的“更多 > 重启”,进入重启集群确认界面。 图2 重启集群 您可以选择重启CDM服务进程或重启集群VM,选择完成并单击确认后即可完成集群重启操作。 重启CDM服务进程:只重启CDM服务的进程,不会重启集群虚拟机。 重启集
-
如何使用表达式方式获取当前时间? - 数据治理中心 DataArts Studio
如何使用表达式方式获取当前时间? 您可以在字段映射界面使用DateUtils.format(${timestamp()},"yyyy-MM-dd HH:mm:ss")表达式获取当前时间,更多表达式设置方式可以参考表达式转换。 父主题: 数据集成
-
配置FTP/SFTP连接 - 数据治理中心 DataArts Studio
FTP/SFTP连接适用于从线下文件服务器或ECS服务器上迁移文件到数据库。 当前仅支持Linux操作系统的FTP 服务器。 作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户,密码不会立即生效且作业会运行失败。 连接FTP或SFTP服务器时,连接参数相同,如表1所示。
-
与其他云服务的关系 - 数据治理中心 DataArts Studio
与其他云服务的关系 统一身份认证服务 DataArts Studio使用统一身份认证服务(Identity and Access Management,简称IAM)实现认证和鉴权功能。 云审计服务 DataArts Studio使用云审计服务(Cloud Trace Servic
-
如何在IAM中创建细粒度权限策略? - 数据治理中心 DataArts Studio
发责任人、运维管理员设置为管理员角色。 开发者:开发者拥有工作空间内创建、管理工作项的业务操作权限。建议将任务开发、任务处理的用户设置为开发者。 运维者:运维者具备工作空间内运维调度等业务的操作权限,但无法更改工作项及配置。建议将运维管理、状态监控的用户设置为运维者。 访客:访客
-
创建MySQL连接器 - 数据治理中心 DataArts Studio
方式二:单击对应驱动名称右侧操作列的“从sftp复制”,配置sftp连接器名称和驱动文件路径。 在“集群管理”界面,单击集群后的“作业管理”,选择“连接管理 > 新建连接”,进入连接器类型的选择界面,如图1所示。 图1 选择连接器类型 连接器类型选择“MySQL”后单击“下一步”,配置MySQL连接的参数。
-
在ECS上调试好的shell脚本,在DLF中shell脚本执行异常,如何处理? - 数据治理中心 DataArts Studio
在ECS上调试好的shell脚本,在DLF中shell脚本执行异常,如何处理? 问题现象:在ECS上调试好的shell脚本,在DLF中shell脚本执行异常。 脚本内容是通过gsql连接dws查询某库表数据行数的。 ECS调试结果: DLF脚本运行结果: 处理方法: 添加如下两条命令:
-
如何创建通知配置对全量作业都进行结果监控? - 数据治理中心 DataArts Studio
如何创建通知配置对全量作业都进行结果监控? 在DataArts Studio控制台首页,选择对应工作空间的“数据开发”模块,进入数据开发页面。 在数据开发主界面的左侧导航栏,在“运维调度 > 作业监控”中,选择“批作业监控”页签。 勾选需要配置的作业,单击“通知配置”。 图1 创建通知配置
-
创建了Hive到DWS类型的连接,进行CDM传输任务失败时如何处理? - 数据治理中心 DataArts Studio
创建了Hive到DWS类型的连接,进行CDM传输任务失败时如何处理? 建议清空历史数据后再次尝试该任务。在使用CDM迁移作业的时候需要配置清空历史数据,然后再做迁移,可大大降低任务失败的概率。 父主题: 数据集成
-
如何查看DataArts Studio的版本? - 数据治理中心 DataArts Studio
如何查看DataArts Studio的版本? 您可以在DataArts Studio实例卡片中查看DataArts Studio版本,如下图所示。 图1 DataArts Studio实例卡片 父主题: 咨询与计费
-
Spark Python脚本如何引用Python脚本? - 数据治理中心 DataArts Studio
Spark Python脚本如何引用Python脚本? 下图为一个Python脚本: def hello1(odps): sql_str="""select date_ptn ( to_char (
-
规范化的数据如何使用? - 数据治理中心 DataArts Studio
规范化的数据如何使用? 规范化的数据可以作为BI的基本信息,也可以作为上层应用的源数据,也可以接入各类数据可视化报表等。 父主题: 数据架构