搜索_华为云

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

以command命名DataFrameWriter触发的查询在Spark 3.2.x版本中，当DataFrameWriter触发的查询执行被发送给QueryExecutionListener时，这些查询的名称总是被设置为command。而在Spark 3.1及更早版本中，这些查询的名称可能是save、ins

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
初始化DLI客户端 - 数据湖探索 DLI

regionName ：所属区域名称 projectId ：项目ID 通过以下方式可获取AK/SK，项目ID及对应的region信息。登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

p'时需配置。 connector.properties.* 否配置kafka任意原生属性。示例从Kafka中读取编码格式为csv，对象为kafkaSource的表。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

*/”强制做broadcastjoin。如果有，则需要去掉该标识。设置spark.sql.autoBroadcastJoinThreshold=-1，具体操作如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，在对应报错作业的“操作”列，单击“编辑”进入到SQL编辑器页面。单击“设置”，在参数设置中选择“spark

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
DROP TABLE - 数据湖探索 DLI
DROP TABLE - 数据湖探索 DLI

TABLE IF EXISTS db0.delta_table0; 系统响应执行成功，元数据中表将被删除，无法通过show和describe查询该表。父主题： Delta DDL语法说明

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
初始化DLI客户端 - 数据湖探索 DLI

regionName ：所属区域名称 projectId ：项目ID 通过以下方式可获取AK/SK，项目ID及对应的region信息。登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
URL函数 - 数据湖探索 DLI
URL函数 - 数据湖探索 DLI

name=xxx&age=25#teacher'); -- http url_extract_query(url)→ varchar 描述：提取url中的查询字符串。 select url_extract_query('http://www.example.com:80/stu/index.html

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

tastore是否存在，如果该数据库存在则会导致Spark作业执行失败。因此当Spark3.x的作业日志中如果出现一条访问catalog查询该数据库，并提示数据库不存在是为了确保Spark作业正常运行，无需执行其他操作。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
pyspark样例代码 - 数据湖探索 DLI

values(2,'John',24)") 查询数据 1 jdbcDF = sparkSession.sql("select * from dli_to_dws").show() 操作结果提交Spark作业将写好的python代码文件上传至OBS桶中。在Spark作业编辑器中选择

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
SHOW SCHEMAS（DATABASES） - 数据湖探索 DLI

--等价写法: SHOW SCHEMAS IN hive LIKE 't%'; 如果匹配字符串中有字符与通配符冲突，可以指定转义字符来标识，示例为查询hive这个catalog下，schema_name前缀为“pm_”的所有schema，转义字符为“/”： SHOW SCHEMAS IN

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
迁移数据场景概述 - 数据湖探索 DLI

数据迁移数据类型映射将其他云服务或业务平台数据迁移到DLI ，或者将DLI数据迁移到其他云服务或业务平台时，涉及到源和目的端数据类型的转换和映射，根据表2可以获取到源和目的端的数据类型映射关系。表2 数据类型映射表 MySQL Hive DWS Oracle PostgreSQL Hologres

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

要获得VPC（虚拟私有云）的VPC Administrator权限。客户未给VPC服务授权导致DLI跨源连接报错找不到子网。处理步骤登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

) CUBE ( column [, ...] ) ROLLUP ( column [, ...] ) 描述从零个或多个表中检索行数据。查询stu表的内容。 SELECT id,name FROM stu; 父主题： DQL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
创建并使用跨源链接 - 数据湖探索 DLI

onnections/{connection_id} {project_id}信息请从获取项目ID获取。查询参数说明详情，请参见创建数据库（废弃）。请求示例描述：查询项目ID为48cc2c48765f481480c7db940d6409d1下连接ID为2a620c33-56

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级在“ 设置 > 参数配置”中配置如下参数，其中x为优先级取值。 spark.sql.dli.job.priority=x 登录DLI管理控制台。单击“作业管理 > SQL作业”。选择待配置的作业，单击操作列下的编辑。在“ 设置 > 参数配置”中配置spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
设置Spark作业优先级 - 数据湖探索 DLI

效。 Spark作业操作步骤在“Spark参数”中配置如下参数，其中x为优先级取值。 spark.dli.job.priority=x 登录DLI管理控制台。单击“作业管理 > Spark作业”。选择待配置的作业，单击操作列下的编辑。在“Spark参数”中配置spark.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
流生态作业开发指引 - 数据湖探索 DLI

自拓展生态：云服务生态 DLI服务在Stream SQL中支持与其他服务的连通。用户可以直接使用SQL从这些服务中读写数据，如DIS、OBS、CloudTable、MRS、RDS、SMN、DCS等。开源生态通过对等连接建立与其他VPC的网络连接后，用户可以在DLI的租户独享

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

sparkSession.sparkContext sc.addFile("krb5.conf的obs地址") sc.addFile("user.keytab的obs地址") Thread.sleep(10) val krb5_startfile =

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

WITH ( 'connector' = 'filesystem', 'format' = 'orc', 'path' = 'obs://xx' ); insert into sink select * from kafkaSource; 向kafka的作为source的topic中插入下列数据：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

访问DDS集群密码。插入数据 sparkSession.sql("insert into test_dds values('3', 'Ann',23)") 查询数据 sparkSession.sql("select * from test_dds").show() 操作结果通过DataFrame

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo

总条数： 1107

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

DROP TABLE - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

URL函数 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

SHOW SCHEMAS（DATABASES） - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线