检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
JDBC驱动 在使用Maven管理项目依赖时,可以通过修改settings.xml文件来配置华为镜像源以获取JDBC驱动。
区域 从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。
自定义镜像 支持,满足业务多样性。 无。 工作流调度 DataArts Studio-DLF调度。 自建大数据生态的调度工具,如Airflow。 企业级多租户 基于表的权限管理,可以精细化到列权限。 基于文件的权限管理。 高性能 性能 基于软硬件一体化的深度垂直优化。
拉取Superset Docker镜像: docker pull apache/superset 启动Superset容器: docker run -p 8088:8088 apache/superset 启动Superset容器,并将容器的8088端口映射到宿主机的8088端口。
Spark3.3.1基础镜像内置了3.1.62版本的huaweicloud-sdk-core。 准备环境 已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。
Flink1.15基础镜像内置了3.1.62版本的huaweicloud-sdk-core。 准备环境 已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码中“pom文件配置”说明。
仅Spark作业支持使用自定义镜像。了解自定义镜像。 DLI套餐包使用约束限制 表4 DLI套餐包使用约束限制 限制项 说明 区域限制 套餐包购买后区域固定无法更换,购买的套餐只能在绑定的区域使用,不能在非绑定区域使用。 使用限制 套餐包购买后不支持退订。
Spark 3.1.1 依赖包 表1 Spark 3.1.1 依赖包 依赖包名称 accessors-smart-1.2.jar hive-shims-scheduler-3.1.0-h0.cbu.mrs.321.r10.jar metrics-graphite-4.1.1.jar
spark.dli.user.modules modules - spark.dli.user.image image 提交作业使用的自定义镜像,仅容器集群支持该参数,默认不设置。
SQL作业为例: 配置参数 hoodie.tableName.consume.mode=INCREMENTAL // 必须设置当前表读取为增量读取模式 hoodie.tableName.consume.start.timestamp=20201227153030 // 指定初始增量拉取
支持多种计算引擎,提供IUD接口,在HDFS的数据集上提供了插入更新和增量拉取的功能。
偏移量参数 从Kafka拉取数据时的初始偏移量。本示例当前选择为:最新。 最新:最大偏移量,即拉取最新的数据。 最早:最小偏移量,即拉取最早的数据。 已提交:拉取已提交的数据。 时间范围:拉取时间范围内的数据。 是否持久运行 用户自定义是否永久运行。当前示例选择为:否。
1111011 rand() → double 返回0到1之间的随机小数 select rand();-- 0.049510824616263105 cbrt(x) → double 返回x的立方根 SELECT cbrt(27.0); -- 3 e() → double 返回欧拉常数
connector.lookup.max-retries 否 维表配置,数据拉取最大重试次数,默认为3。 示例 RDS表用于与输入流连接。
connector.lookup.max-retries 否 维表配置,数据拉取最大重试次数,默认为3。 示例 RDS表用于与输入流连接。
hoodie.datasource.query.type", "incremental") // 指定查询类型为增量查询 .option("hoodie.datasource.read.begin.instanttime", startTime) // 指定初始增量拉取
如果手动关闭了debezium.connect.keep.alive,一旦发生拉取Binlog线程与MySQL服务器的连接连接异常,拉取Binlog线程不会尝试自动重连,这可能导致无法正常从源端拉取binlog日志。
connector.read.partition.column、connector.read.partition.upper-bound、 connector.read.partition.upper-bound必须同时存在或者同时不存在 connector.read.fetch-size 否 每次从数据库拉取数据的行数
lookup.max-retries 否 维表配置,数据拉取最大重试次数,默认为3。 pwd_auth_name 否 DLI侧创建的Password类型的跨源认证名称。
app_uv 可调整为 COUNT(DISTINCT user_id) FILTER(WHERE flag IN ('android', 'iphone')) AS app_uv 维表join优化 维表join根据左表进入的每条记录join关联键,先在缓存中匹配,如果匹配不到,则从远程拉取