搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业的其他依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

业。 general：通用队列类型，用于运行Flink、Spark Jar作业。说明：如果不指定类型，则默认为“sql”。 description 否 String 队列的描述信息。 cu_count 是 Integer 与队列绑定的最小计算单元个数。设置值当前只支持16，64，256。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

单击查看增强型跨源连接详细信息。支持查看以下信息：是否支持IPv6：如果创建增强型跨源连接时您选择的子网是开启IPv6的，则您创建的增强型跨源连接也是支持IPv6的。主机信息：访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。详细信息请参考修改弹性资源池的主机信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

"description": "Big 2-wheel scooter", "weight": 5.18 }, "after": { "id": 111, "name": "scooter", "description": "Big

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
设置多版本备份数据保留周期 - 数据湖探索 DLI

retention.days”调整保留周期。保留周期外的多版本数据后续在执行insert overwrite或者truncate语句时会自动进行清理。在添加列或者修改分区表时，也可以设置表属性“dli.multi.version.retention.days”调整保留周期。开启和关闭多版本功

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

\"bc764cd8ddf7a0cff126f51c16239658\",\n \"ship_strategy\" : \"FORWARD\",\n \"exchange\" : \"pipelined_bounded\"\n } ],\n \"optimizer_properties\"

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
ALTER COLUMN - 数据湖探索 DLI
ALTER COLUMN - 数据湖探索 DLI

omment、空约束，当前不支持修改列类型、列位置。注意事项目前不支持修改列类型。目前不支持修改已存在列的顺序。目前不支持指定顺序添加列。命令语法 ALTER TABLE tableName ALTER [COLUMN] col_name [COMMENT] col_comment

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明
pyspark样例代码 - 数据湖探索 DLI

table 'person')".stripMargin) 插入数据 1 sparkSession.sql("INSERT INTO TABLE person VALUES ('John', 30),('Peter', 45)".stripMargin) 查询数据 1 sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

redis操作参数参数描述 host 需要连接的redis集群的IP。获取方式为：登录华为云官网，之后搜索redis，进入“分布式缓存服务”,接着选择“缓存管理”，根据主机名称需要的IP，可选择其中任意一个IP进行复制即可（其中也包含了port信息），请参考图1。 port 访问端口。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
在DLI控制台创建数据库和表 - 数据湖探索 DLI

Parquet：DLI支持读取不压缩、snappy压缩、gzip压缩的parquet数据。 CSV：DLI支持读取不压缩、gzip压缩的csv数据。 ORC：DLI支持读取不压缩、snappy压缩的orc数据。 JSON：DLI支持读取不压缩、gzip压缩的json数据。 Avro：DLI支持读取不压缩的avro数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
DLI对接LakeFormation - 数据湖探索 DLI

3.3.1 委托使用Spark 3.3.1及以上版本的引擎执行作业时，需要您先在IAM页面创建相关委托，并在此处添加新建的委托信息。选择该参数后系统将自动为您的作业添加以下配置： spark.dli.job.agency.name=agency 委托权限示例请参考创建DLI自定义委托权限和常见场景的委托权限策略。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
创建作业模板 - 数据湖探索 DLI

SPARK：Spark模板。 name 是 String 模板名称。 body 是 String 模板内容。 group 否 String 模板分组名称。 description 否 String 模板描述信息。 language 否 String 语言。响应参数表3 响应参数参数参数类型说明 id

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
创建DLI表关联RDS - 数据湖探索 DLI

创建增强型跨源连接后，使用RDS提供的"内网域名"或者内网地址和数据库端口访问，MySQL格式为"协议头://内网IP:内网端口"，PostGre格式为"协议头://内网IP:内网端口/数据库名"。例如："jdbc:mysql://192.168.0.193:3306"或者"jdbc:postgresql://192

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

cache的最大行数，如果超过该值，缓存中最先添加的条目将被标记为过期。默认情况下，lookup cache是未开启的。具体请参考Lookup Cache功能介绍。 lookup.cache.ttl 否无 Duration lookup cache中每一行记录的最大存活时间，如果超过该时间，缓存中最先添加的条目将被标记为过期。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

对未分区表进行流式读取时，要求将每个文件以原子方式写入目标目录。分区表的流式读取要求在 hive 元存储的视图中以原子方式添加每个分区。否则，将使用添加到现有分区的新数据。流式读取不支持 Flink DDL 中的水印语法。这些表不能用于窗口运算符。语法格式 1 2 3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
UNNEST - 数据湖探索 DLI
UNNEST - 数据湖探索 DLI

被展开成多列，行数与最高基数参数相同（其他列用空填充）。UNNEST可以选择使用WITH ORDINALITY子句，在这种情况下，会在末尾添加一个额外的ORDINALITY列。UNNEST通常与JOIN一起使用，可以引用JOIN左侧关系中的列。使用单独一列 SELECT student

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Spark作业开发类 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？父主题： Spark作业相类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

K对请求进行签名，签名过程会自动往请求中添加Authorization（签名认证信息）和X-Sdk-Date（请求发送的时间）请求头。例如，对于IAM获取用户Token接口，由于不需要认证，所以只添加“Content-Type”即可，添加消息头后的请求如下所示。 POST https://iam

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

origin_zip, sum( package_weight ) FROM shipping GROUP BY ROLLUP ( origin_state, origin_zip ); --等同于 SELECT origin_state, origin_zip, sum(

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

自建队列购买方式如下：购买队列请参考创建队列。弹性资源池购买方式如下：具体弹性资源池的购买和添加队列操作可以参考《数据湖探索用户指南》中的“创建弹性资源池”和“弹性资源池添加队列”相关章节。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题

总条数： 479

上一页
1
...
5
6
7
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

ALTER COLUMN - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

创建作业模板 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

UNNEST - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线