搜索_华为云

Spark SQL语法概览 - 数据湖探索 DLI

自定义函数相关语法创建函数删除函数显示函数详情显示所有函数数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

UpsertKafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
CREATE TABLE LIKE - 数据湖探索 DLI
CREATE TABLE LIKE - 数据湖探索 DLI

order01 INCLUDING PROPERTIES; 创建表orders_like02，它将包含表order02定义的列，并将表的存储格式设置为‘TEXTFILE’ CREATE TABLE orders_like02 like order02 STORED AS TEXTFILE;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
pyspark样例代码 - 数据湖探索 DLI

mysql.jdbc.Driver" 参数说明请参考表1。设置数据 1 dataList = sparkSession.sparkContext.parallelize([(123, "Katie", 19)]) 设置schema 1 2 3 schema = StructTy

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
提交SQL作业（废弃） - 数据湖探索 DLI

preferSortMergeJoin（是否优先使用SortMergeJoin） dli.sql.autoBroadcastJoinThreshold（自动使用BroadcastJoin的数据量阈值） dli.sql.caseSensitive（sql语句是否大小写敏感） dli.sql.shuffle

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
查询批处理作业详情 - 数据湖探索 DLI

不填写，则使用默认的spark组件版本号2.3.2。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。关

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
导出DLI表数据至OBS中 - 数据湖探索 DLI

随导出创建指定路径：指定的导出目录必须不存在，如果指定目录已经存在，系统将返回错误信息，无法执行导出操作。覆盖指定路径：在指定目录下新建文件，会删除已有文件。表头:无/有设置导出数据是否含表头。单击“确定”即可导出数据。（可选）您可以在“作业管理”>“SQL作业”页面查看导出作业的“状态”、“执行语句”等信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
CREATE TABLE AS - 数据湖探索 DLI
CREATE TABLE AS - 数据湖探索 DLI

创建包含SELECT查询结果的新表。使用CREATE TABLE创建空表。使用IF NOT EXISTS子句时，如果表已经存在则不会报错。可选WITH子句可用于设置新创建的表的属性，如表的存储位置（location）、是不是外表（external）等。示例用指定列的查询结果创建新表orders_column_aliased：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

上述示例中，因为CSS安全集群关闭了https访问，所以“es.net.ssl”参数要设置为“false”。“es.net.http.auth.user”以及“es.net.http.auth.pass”为创建集群时设置的账号和密码。插入数据 1 sparkSession.sql("insert

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
创建弹性资源池 - 数据湖探索 DLI

新建的弹性资源池名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。说明：若名称中包含大写字母，将会自动转换为小写字母。 description 否 String 描述信息。长度限制：256个字符以内。 cidr_in_vpc 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
增强型跨源连接标签管理 - 数据湖探索 DLI

在对应连接的“操作”列，选择“更多”>“标签”。进入标签管理页面，显示当前连接的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。标签键和标签值设置完成后，单击“添加”，将标签加入到输入框中。图1 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
常用操作与系统权限关系 - 数据湖探索 DLI

ALTER_TABLE_RECOVER_PARTITION 恢复表分区 √ × √ √ ALTER_TABLE_SET_LOCATION 设置分区路径 √ × √ √ GRANT_PRIVILEGE 表的赋权 √ × √ √ REVOKE_PRIVILEGE 表权限的回收 √ ×

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
初始化DLI客户端 - 数据湖探索 DLI

险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称 projectId ：项目ID 通过以下方式可

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
查询批处理作业列表 - 数据湖探索 DLI

queue 否 String 批处理作业所在队列。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。 req_body

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查看队列定时扩缩容计划（废弃） - 数据湖探索 DLI

有效期开始时间（13位时间戳）。 valid_date_end 否 Long 有效期结束时间（13位时间戳）。 activate 否 Boolean 当前设置的扩缩容计划是否激活，默认为“true”，表示激活。 last_execute_time 否 Long 当前扩缩容计划最近一次执行的时间。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。图11 创建程序包创建DLI的UDTF函数。登录DLI管理控

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

Boolean 当解析异常时，是跳过当前字段或行，还是抛出错误失败（默认为 false，即抛出错误失败）。如果忽略字段的解析异常，则会将该字段值设置为null。 canal-json.timestamp-format.standard 否 'SQL' String 指定输入和输出时间戳

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
初始化DLI客户端 - 数据湖探索 DLI

险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称 projectId ：项目ID 通过以下方式可

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

多IO。 batch.size.entries 单次batch插入entry的条数上限，默认为1000。如果单条数据非常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS

总条数： 742

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL语法概览 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

CREATE TABLE LIKE - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

查询批处理作业详情 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

CREATE TABLE AS - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

常用操作与系统权限关系 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

查询批处理作业列表 - 数据湖探索 DLI

查看队列定时扩缩容计划（废弃） - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线