搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过DataFrame API访问认证用的password硬编码到代码中或者明文存储都有很大的安全风

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
CREATE SCHEMA - 数据湖探索 DLI
CREATE SCHEMA - 数据湖探索 DLI

rty_value,...)] 描述创建一个空的schema。schema是表、视图以及其他数据库对象的容器。当指定可选参数IF NOT EXISTS时，如果系统已经存在同名的schema，将不会报错。示例创建一个名为web的schema： CREATE SCHEMA web;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

账号A将1创建的增强型跨源连接授权给账号B使用。账号A在增强型跨源连接的列表页面，单击操作列下的“更多 > 权限管理”。选择赋权，输入账号B所在的项目ID，将该连接共享给账号B，授予账号B使用连接访问共享VPC资源的权限。获取项目ID请参考获取项目ID。账号B在共享的增强型跨源连接上绑定DLI弹性资源池。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

实现海量数据的秒级交互式查询。 DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应： HetuEngine通过自动优化资源与负载的配比，能够对TB

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的OpenTSDB和MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

置导入数据的类型，例如将data_type设置为csv。csv数据的具体格式通可过options参数设置，例如：csv的分隔符，转义符等。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
配置Hudi数据列默认值 - 数据湖探索 DLI

历史数据的默认值与列第一次设置的默认值一致，多次修改列的默认值不会影响历史数据的查询结果。设置默认值后rollback不能回滚默认值配置。 Spark SQL暂不支持查看列默认值信息，可以通过执行show create table SQL查看。不支持默认缺省列的写入方式，写入时必须指定列名。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
语法支持类型 - 数据湖探索 DLI

WITH LOCAL TIME ZONE，INTERVAL，ARRAY，MULTISET，MAP，ROW 在SQL语法中这些类型用于定义表中列的数据类型。父主题： SQL语法约束与定义

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义
语法支持类型 - 数据湖探索 DLI

WITH LOCAL TIME ZONE，INTERVAL，ARRAY，MULTISET，MAP，ROW 在SQL语法中这些类型用于定义表中列的数据类型。父主题： SQL语法约束与定义

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义
跨源认证概述 - 数据湖探索 DLI

Kerberos类型的跨源认证：适用于开启Kerberos认证的MRS安全集群。 Kafka_SSL类型的跨源认证：适用于开启SSL的Kafka。 Password类型的跨源认证：适用于DWS、RDS、DDS、DCS数据源。跨源认证类型 DLI支持四种类型的跨源认证，不同的数据源按需选择相应的认证类型。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
pyspark样例代码 - 数据湖探索 DLI

前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。通过DataFrame API 访问 import相关依赖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
查询指定资源类型的标签信息 - 数据湖探索 DLI

查询指定资源类型的标签信息功能介绍该接口用于查询指定资源类型的标签信息，即指定项目中资源类型的所有资源标签集合。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
DLI弹性资源池与队列简介 - 数据湖探索 DLI

弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。适用场景：适合业务量有明显波动的场合，如周期性的数据批处理任务或实时数据处理需求。支持的队列类型：

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Hudi常见配置参数 - 数据湖探索 DLI

有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite.insert.split.size 插入写入并行度。为单个分区的总共插入次数。写出100MB的文件，至少1KB大小的记录，意味着

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

cu_number 否 Integer 用户为作业选择的CU数。默认值为“2”。 CU数量为DLI的计算单元数量和管理单元数量总和，CU也是DLI的计费单位，1CU=1核4G。当前配置的CU数量为运行作业时所需的CU数，不能超过其绑定队列的CU数量。管理单元参数设置详见：manager_cu_number。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

端口信息”。若使用经典型跨源，填写经典型跨源返回的连接地址，管理控制台操作请参考《数据湖探索用户指南》。 metric 所创建的dli表对应的OpenTSDB中的指标名称。 tags metric对应的标签，用于归类、过滤、快速检索等操作，可以是1到8个，以“，”分隔，包括对应metric下的所有tagk的值。通过SQL

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
创建并管理SQL作业模板 - 数据湖探索 DLI

创建并管理SQL作业模板创建SQL作业模板使用SQL作业模板开发并提交SQL作业 DLI预置的SQL模板中TPC-H样例数据说明父主题：使用DLI提交SQL作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

也可以设置hoodie.datasource.write.operation的来控制insert语句的写入方式，可选包括bulk_insert、insert、upsert。（注意：会覆盖配置的hoodie.sql.insert.mode的结果） hoodie.datasource.write.operation

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明

总条数： 640

上一页
1
...
23
24
25
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

CREATE SCHEMA - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

语法支持类型 - 数据湖探索 DLI

语法支持类型 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查询指定资源类型的标签信息 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建并管理SQL作业模板 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线