搜索_华为云

使用DLI分析电商BI报表 - 数据湖探索 DLI

某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据（脱敏后）为基础，利用数据湖探索来分析用户和商品的各种数

 帮助中心 > 数据湖探索 DLI > 最佳实践
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列> 找到作业的所属队列> 更多> 测试地址连通性 > 输入kafka的地址 > 测试）。如果能连

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
查询队列详情 - 数据湖探索 DLI

String 创建队列的用户。 create_time 否 Long 创建队列的时间。是单位为“毫秒”的时间戳。 queueType 否 String 队列类型。 sql general all 如果不指定，默认为“sql”。 cuCount 否 Integer 与该队列绑定的计算单元数。即当前队列的CU数。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
DLI SDK与API的对应关系 - 数据湖探索 DLI

DLI SDK与API的对应关系 OBS授权表1 OBS授权相关API&SDK的对应关系表 Class Method Java Method Python Method API Authorize OBS授权 authorizeBucket - POST /v1.0/{proj

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

parallel_number 否 Integer 最大并行度。并行数为作业每个算子的并行数，适度增加并行数会提高作业整体算力，但也须考虑线程增多带来的切换开销，上限是计算单元CU数的4倍，最佳实践为计算单元CU数的1-2倍。 tm_cus 否 Integer 单个taskManagerCU数量。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
提交SQL作业（推荐） - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
对象存储OBS结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

buckets：Hudi表中每个分区划分桶的个数，每个分区内的数据通过Hash方式放入每个桶内。建表或第一次写入数据时设置后不能修改，否则更新数据会存在异常。 hoodie.bucket.index.hash.field：进行分桶时计算Hash值的字段，必须为主键的子集，默认为Hudi表的主键。该参数不填则默认为recordkey

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

pendencies.jar”。在使用JDBC的机器中，将上一步解压的文件“huaweicloud-dli-jdbc-1.1.1-jar-with-dependencies.jar”添加至Java工程的“classpath”路径下。 DLI JDBC提供两种身份认证模式连接到D

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
DLI数据库和表类 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ join表时没有添加on条件，造成笛卡尔积查询

 帮助中心 > 数据湖探索 DLI > 常见问题
超出套餐包额度的使用量怎么收费？ - 数据湖探索 DLI

超出套餐包额度的使用量怎么收费？购买了套餐包时，按需使用过程中优先抵扣套餐包的额度，超过额度的使用量按照按需计费。套餐包需结合重置周期使用，如重置周期为月，且按订购周期重置，即如果用户1月5日订购套餐包资源，之后每个月的5日同一时间重置套餐包资源。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
怎样查看套餐包资源的使用情况？ - 数据湖探索 DLI

怎样查看套餐包资源的使用情况？购买套餐包后，随着套餐包的使用您可以随时查看套餐包使用情况，了解套餐包详情。操作步骤登录华为云费用中心。选择“资源包”。在“资源包列表”页签中单击目标资源包名称/ID，查看套餐包的详细信息。图1 查看套餐包资源使用情况父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
显示所有角色和用户的绑定关系 - 数据湖探索 DLI

显示所有角色和用户的绑定关系功能描述在当前database显示角色与某用户的绑定关系。语法格式 1 SHOW PRINCIPALS ROLE; 关键字无。注意事项变量ROLE必须存在。示例 1 SHOW PRINCIPALS role1; 父主题：数据权限相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
查询作业状态 - 数据湖探索 DLI

Insert作业执行过程中扫描到的错误记录数。 input_size Long 作业执行过程中扫描文件的大小，单位字节。 result_count Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name String 记录其操作的表所在的数据库名称。类

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
查询作业详细信息 - 数据湖探索 DLI

是 String 提交作业的用户。 start_time 是 Long 作业开始的时间。是单位为“毫秒”的时间戳。 duration 是 Long 作业执行的时间间隔，单位毫秒。 export_mode 否 String 导出数据或保存查询结果时，指定的导出模式。范围为“Err

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
获取分区信息列表（废弃） - 数据湖探索 DLI

每页显示的返回信息的个数，默认值为100。 offset 否 Integer 偏移量。 filter 否 String 筛选条件，目前只支持“=”条件筛选，例如：name=name1，表示筛选出分区中name=name1的数据，name为分区列名称，name1为分区列的值。key和value不区分大小写。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
查看队列的基本信息 - 数据湖探索 DLI

在列表页面上方的搜索区域，您可以名称和标签筛选需要的队列资源。单击查看队列的详细信息。关于队列引擎相关字段的含义：执行引擎：负责执行队列中任务的引擎类型。默认版本：执行引擎的默认配置版本，或者是在没有指定特定版本时系统将使用的版本。支持版本：执行引擎支持的所有版本列表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
资源标签相关API - 数据湖探索 DLI

资源标签相关API 批量添加资源标签批量删除资源标签查询资源实例数量查询资源实例列表查询指定资源类型的标签信息查询指定资源实例的标签信息

 帮助中心 > 数据湖探索 DLI > API参考

总条数： 1281

上一页
1
...
15
16
17
...
65
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI分析电商BI报表 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

DLI数据库和表类 - 数据湖探索 DLI

超出套餐包额度的使用量怎么收费？ - 数据湖探索 DLI

怎样查看套餐包资源的使用情况？ - 数据湖探索 DLI

显示所有角色和用户的绑定关系 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

查询作业详细信息 - 数据湖探索 DLI

获取分区信息列表（废弃） - 数据湖探索 DLI

查看队列的基本信息 - 数据湖探索 DLI

资源标签相关API - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线