搜索_华为云

新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

Integer 模板ID。如果“template_id”和“sql_body”都不为空，优先选择“sql_body”的内容；如果“template_id”不为空，“sql_body”为空，选择“template_id”的内容填充“sql_body”。 queue_name 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
pyspark样例代码 - 数据湖探索 DLI

索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择Spark版本为2.3.2（即将下线）或2.4.5提交作业时

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
OVER - 数据湖探索 DLI
OVER - 数据湖探索 DLI

ORDER BY：决定窗口函数求值的顺序。可以用一个或多个键排序。通过ASC或DESC决定升序或降序。窗口由WINDOW子句指定。如果不指定，默认窗口等同于ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW，即窗口从表或分区（如果OVER子句中用PARTITION

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
自定义函数类型推导 - 数据湖探索 DLI

LATERAL 和TABLE 两个关键字。 CROSS JOIN：对于左表的每一行数据，假设UDTF不产生输出，则这一行不进行输出。 LEFT JOIN：对于左表的每一行数据，假设UDTF不产生输出，这一行仍会输出，UDTF相关字段用null填充。 CREATE FUNCTION udtf_test

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
查看表属性 - 数据湖探索 DLI
查看表属性 - 数据湖探索 DLI

表添加key/value的属性。参数说明表1 参数说明参数描述 table_name 表名称。 property_name 命令中不指定property_name时，将返回所有属性及其值；命令中指定property_name时，将返回该特定property_name所对应的值。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
更新Flink Jar作业 - 数据湖探索 DLI

Integer 用户为作业选择的CU数量。默认值为“2”。 manager_cu_number 否 Integer 用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。默认值为“1”。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

如何自定义SMN主题，请参见《消息通知服务用户指南》中“创建主题”章节。检查IAM权限。如果SMN主题已经存在，但仍然提示不存在，请进入统一身份认证服务（IAM），选择对应子账户所在的用户组，确保该用户组已添加相应Region的SMN策略。确认主题名称和区域。确保您在DLI中配置的SMN主题名称和区域

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

ATE TABLE tb_avro STORED AS AVRO AS SELECT 1”则会报schema解析异常。此问题的原因是如果不指定列名，则会把SELECT后的内容同时作为列名和插入值，而AVRO格式的表不支持列名为数字，所以会报解析schema异常错误。您可以通过“CREATE

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
查询资源实例数量 - 数据湖探索 DLI

请求参数表2 请求Body参数参数是否必选参数类型描述 without_any_tag 否 Boolean 是否不包含任意一个标签。默认值false。 true：不包含任意一个标签。 false：指定标签。 tags 否 Array of objects 包含标签。请参考tags。

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
自定义函数类型推导 - 数据湖探索 DLI

LATERAL 和TABLE 两个关键字。 CROSS JOIN：对于左表的每一行数据，假设UDTF不产生输出，则这一行不进行输出。 LEFT JOIN：对于左表的每一行数据，假设UDTF不产生输出，这一行仍会输出，UDTF相关字段用null填充。 CREATE FUNCTION udtf_test

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

登录DLI管理控制台，单击“作业管理 > SQL作业”，在对应报错作业的“操作”列，单击“编辑”进入到SQL编辑器页面。单击“设置”，在参数设置中选择“spark.sql.autoBroadcastJoinThreshold”参数，其值设置为“-1”。重新单击“执行”，运行该作业，观察作业运行结果。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

hoodie.tableName.consume.end.timestamp=20210308212318 // 指定增量拉取结束commit，如果不指定的话采用最新的commit 随后执行SQL select * from tableName where `_hoodie_commit_

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
导出查询结果 - 数据湖探索 DLI

compress 否 String 导出数据的压缩格式，目前支持gzip，bzip2和deflate压缩方式；默认值为none，表示不压缩。 data_type 是 String 导出数据的存储格式，目前API支持csv和json格式。 queue_name 否 String

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

图2 编辑驱动连接表2 驱动相关参数说明参数说明驱动名称命名为便于识别的名称，例如GaussDB Driver。驱动类型驱动类型选择Generic。类名类名 URL模板 DLI JDBC驱动连接的格式： DLI JDBC驱动连接配置示例请参考•DLIJDBC驱动连接

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
新建Flink Jar作业 - 数据湖探索 DLI

Integer 用户为作业选择的CU数量。 manager_cu_number 否 Integer 用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。 log_enabled

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi锁配置说明 - 数据湖探索 DLI

er 关闭Hudi锁，或者使用其他的锁实现类时，存在数据丢失/异常的风险。在任何情况下，DLI不对因关闭Hudi锁，或者使用与元数据服务不匹配的锁实现类，而直接或间接导致的任何形式的损失或损害承担责任，包括但不限于商业利润损失、业务中断、数据丢失或其他财务损失。父主题： Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
pyspark样例代码 - 数据湖探索 DLI

如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

jdbcSource; 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
增强型跨源连接概述 - 数据湖探索 DLI

检测连通性要求检测跨源连接的连通性时对IP约束限制如下： IP必须为合法的IP地址，用“.”分隔的4个十进制数，范围是0-255。测试时IP地址后可选择添加端口，用":"隔开，端口最大限制5位，端口范围：0~65535。例如192.168.xx.xx或者192.168.xx.xx:8181。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
常见场景的委托权限策略 - 数据湖探索 DLI

dli_data_clean_agency。请在设置委托的授权范围时分别对OBS权限和DLI权限授权范围： OBS权限请选择“全局服务资源” DLI权限选择“指定区域项目资源” { "Version": "1.1", "Statement": [

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限

总条数： 565

上一页
1
...
20
21
22
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建SQL作业 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

OVER - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

查看表属性 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

查询资源实例数量 - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

Hudi锁配置说明 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

常见场景的委托权限策略 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线