检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
编写SQL脚本,从源表table1这张数据表里面获取最大时间值数据。 select max(time) from table1 保存并提交版本。脚本maxtime创建完成。 创建一个Pipeline子作业 在数据开发主界面的左侧导航栏,选择“数据开发 > 作业开发”。 选择CDM
Keytab文件获取方式 MRS集群 MRS HDFS MRS HBase MRS Hive MRS Hudi MRS ClickHouse 针对MRS 3.x版本集群: 登录FusionInsight Manager。 选择“集群 > > 待操作的集群名称 > 概览 > 更多 > 下载客户端”,界面显示“下载集群客户端”对话框。
脚本开发 脚本开发流程 新建脚本 开发脚本 提交版本 发布脚本任务 (可选)管理脚本 父主题: 数据开发
以避免上述两种场景下作业执行失败。 在作业进行周期调度时,该作业的默认用户被删除后,如果使用其他用户对该作业进行版本提交并执行调度,那该作业的执行用户就默认为提交版本的用户。 调度身份的分类 调度身份分为委托和IAM账户两大类。 委托:由于云各服务之间存在业务交互关系,一些云服务
API已发布到该环境。 停用API 在DataArts Studio控制台首页,选择对应工作空间的“数据服务”模块,进入数据服务页面。 在左侧导航栏选择服务版本(例如:专享版),进入总览页。 单击“开发API > API管理”,进入到API管理信息页面。 在待停用的API所在行,单击“更多 > 停用”,弹出“停用”对话框。
SIMPLE:非安全模式选择Simple鉴权。 KERBEROS:安全模式选择Kerberos鉴权。 SIMPLE Hive版本 Hive的版本。根据服务端Hive版本设置。 HIVE_3_X 用户名 选择KERBEROS鉴权时,需要配置MRS Manager的用户名和密码。从HDFS
String 开发环境版本,只读,ID字符串。 prod_version String 生产环境版本,只读,ID字符串。 dev_version_name String 开发环境版本名称,只读。 prod_version_name String 生产环境版本名称,只读。 env_type
开发实时处理单任务MRS Flink SQL作业 开发实时处理单任务MRS Flink Jar作业 开发实时处理单任务DLI Spark作业 调度作业 提交版本 发布作业任务 (可选)管理作业 父主题: 数据开发
Studio管理中心数据连接。 说明: 数据连接配置中必须勾选数据集成选项。 数据连接中使用的Agent代理实际为CDM集群,所用集群建议升级至较新版本(24.4.0B030版本以上),以满足功能特性需求,详情请联系客服或技术支持人员。 参考创建DataArts Studio数据连接。 网络准备 数据库部署在本地IDC
时,可配置编码格式。 utf8 驱动版本 CDM连接关系数据库前,需要先上传所需关系数据库的JDK8版本.jar格式驱动。MySQL的驱动请从https://downloads.mysql.com/archives/c-j/选择5.1.48版本下载,从中获取mysql-connector-java-5
主题管理接口 主题层级接口 目录管理 原子指标接口 衍生指标接口 复合指标接口 维度接口 限定接口 维度表接口 事实表接口 汇总表接口 业务指标接口 版本信息接口 关系建模接口 导入导出接口 自定义项接口 标签接口 质量规则接口
String 开发环境版本,只读,ID字符串。 prod_version String 生产环境版本,只读,ID字符串。 dev_version_name String 开发环境版本名称,只读。 prod_version_name String 生产环境版本名称,只读。 env_type
Spark作业算子,配置算子相关参数,配置指导请参见MRS Spark。 配置调度周期。调度周期设置为分钟。 图1 配置调度周期(分钟) 作业配置完成后,保存并提交版本。 单击“执行调度”,启动作业调度。 在“作业监控”里面查看作业执行结果。 图2 查看被依赖作业的执行结果 创建一个周期调度的天任务作业。(每天07:15执行的天任务作业)
API已发布到该环境。 下线API 在DataArts Studio控制台首页,选择对应工作空间的“数据服务”模块,进入数据服务页面。 在左侧导航栏选择服务版本(例如:专享版),进入总览页。 单击“开发API > API管理”,进入到API管理信息页面。 在待下线的API所在行,单击“更多 > 下线”,弹出“下线API”对话框。
数据库:步骤6中创建的数据库。 资源队列:可使用提供的默认资源队列“default”。 当前由于DLI的“default”队列默认Spark组件版本较低,可能会出现无法支持建表语句执行的报错,这种情况下建议您选择自建队列运行业务。如需“default”队列支持建表语句执行,可联系DLI服务客服或技术支持人员协助解决。
单击,进入“集群列表”页面新建MRS集群。 前往MRS管理控制台进行新建。 说明: MRS Flink Job目前支持的MRS集群版本是MRS 3.2.0-LTS.1及以上版本。 Flink作业名称 是 MRS作业名称,只能由英文字母、数字、中划线和下划线组成,长度不能超过64个字符。 系统支
一个企业项目下只能购买一个DataArts Studio实例。 需要与其他云服务互通时,需要确保与其他云服务的企业项目一致。 版本 基础版 选择需要购买的DataArts Studio版本,版本差异请参见版本规格说明。 说明: 购买非免费版DataArts Studio实例时,会默认包含1个数据集成CDM集
其他信息(宗教信仰、精准定位) 敏感数据的保护方式 敏感数据识别与添加标签 从海量数据中将数据进行分类分级,方便进行不同粒度和级别的安全管理。 数据泄露检测与防护 如果出现频繁访问敏感数据的异常行为,可以及时进行风险告警。 数据静态脱敏、数据水印 对于已标记特定安全级别的敏感数据,可在对外提供数据时进行脱敏或者加水印。
锁,然后再抢锁。 图1 锁定状态转换图 前提条件 已完成脚本开发任务。 解锁脚本 提交脚本会将当前开发态的最新脚本保存并提交为版本,并覆盖之前的脚本版本。为了便于后续其他开发者对此脚本进行修改,建议您在提交脚本后通过“解锁”解除该脚本锁定。 参考访问DataArts Studio实例控制台,登录DataArts
String 开发环境版本,只读,ID字符串。 prod_version String 生产环境版本,只读,ID字符串。 dev_version_name String 开发环境版本名称,只读。 prod_version_name String 生产环境版本名称,只读。 env_type