搜索_华为云

查看指定数据库 - 数据湖探索 DLI

描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。注意事项如果所要查看的数据库不存在，则系统报错。示例已参考示例中描述创建对应的数据库，如testdb。查看testdb数据库的相关信息。 1 DESCRIBE DATABASE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

overwrite覆盖分区表数据的时候，覆盖了全量数据？当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
提交SQL作业（推荐） - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
删除数据库 - 数据湖探索 DLI
删除数据库 - 数据湖探索 DLI

使用该功能。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。示例已参考示例中描述创建对应的数据库，如testdb。若存在testdb数据库，则删除数据库testdb。 1 DROP DATABASE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
使用DataSource语法创建OBS表 - 数据湖探索 DLI

CTAS建表语句不能指定表的属性。 OBS目录下包含子目录的场景：创建表时，若指定路径为OBS上的目录，且该目录下包含子目录（或嵌套子目录），则子目录下的所有文件类型及其内容也是表内容。您需要保证所指定的目录及其子目录下所有文件类型和建表语句中指定的存储格式一致，所有文件内容和表中的字段一致，否则查询将报错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

示例说明：创建一个名为student的分区表，该分区表使用院系编号（facultyNo）和班级编号（classNo）进行分区，该student表会同时按照不同的院系编号（facultyNo）和不同的班级编号（classNo）分区。在实际的使用过程中，您可以选择合适的分区字段并将其添加到PARTITIONED

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

别为：一种为"yyyy-MM"即保存年份和月份，精度到月份，它的range参数可以为YEAR或者YEAR To Month。一种为天时间"dd HH:mm:sss.fff"，用来保存天数、小时、分钟、秒和毫秒，精度最低到毫秒。它的range参数可以为DAY、MINUTE、DAY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

为新的“通用队列”。重新购买“通用队列”。将在旧的“Spark队列”中的作业迁移到新的“通用型队列”中，即在提交Spark作业时指定新的队列。释放旧的“Spark队列”，即删除或退订队列。父主题： DLI弹性资源池和队列类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

db_name 需要执行INSERT命令的表所在数据库的名称。 table_name 需要执行INSERT命令的表的名称。 part_spec 指定详细的分区信息。若分区字段为多个字段，需要包含所有的字段，但是可以不包含对应的值，系统会匹配上对应的分区。单表分区数最多允许100000个。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。 DLI 在创建SQL作业前需购买队列，使用DLI的队列资源时，按照队列CU时进行计费。

帮助中心 > 数据湖探索 DLI > 最佳实践
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

REPLACE，或者替换所有作业中的函数F1为F2。需要重启Spark SQL队列后新创建的自定义函数F2生效需要重启Spark SQL队列，影响当前运行的作业。重启队列后，影响F1原有功能，F1的功能变为和F2一样。场景二在原有程序包类的基础上新增了类，新创建的函数指定为新增的类，包名不变。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 DLI支持存储哪些格式的数据？ DLI支持如下数据格式： Parquet CSV ORC Json Avro DLI服务的数据可以存储在哪些地方？ OBS：SQL作业，Spark作业，Flink作业使用的数据均可以存储在OBS服务中，降低存储成本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
左半连接 - 数据湖探索 DLI
左半连接 - 数据湖探索 DLI

注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。此处的attr_expr_list中所涉及的字段只能是左表中的字段，否则会出错。示例返回选课学生的姓名及其所选的课程编号。 1 2 SELECT student_info.name, student_info

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

容，显著提升扩缩容的成功率和操作效率。在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和必须小于等于弹性资源池的最小CU数。在全天的任意一个时间段内，弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。同一队列不同扩缩容策略的时间段区间不能有交集。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
查询所有数据库（废弃） - 数据湖探索 DLI

table_number 否 Integer 数据库中表的个数。 description 否 String 数据库相关的描述信息。 enterprise_project_id 是 String 企业项目ID，“0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
什么是DLI分区表的列赋权？ - 数据湖探索 DLI

什么是DLI分区表的列赋权？用户无法对分区表的分区列进行权限操作。当用户对分区表的任意一列非分区列有权限，则默认对分区列有权限。当查看用户在分区表上的权限的时候，不会显示对分区列有权限。父主题： DLI权限管理类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。 DLI 在创建SQL作业前需购买队列，使用DLI的队列资源时，按照队列CU时进行计费。如购买按

 帮助中心 > 数据湖探索 DLI > 最佳实践
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
显示所有角色和用户的绑定关系 - 数据湖探索 DLI

显示所有角色和用户的绑定关系功能描述在当前database显示角色与某用户的绑定关系。语法格式 1 SHOW PRINCIPALS ROLE; 关键字无。注意事项变量ROLE必须存在。示例 1 SHOW PRINCIPALS role1; 父主题：数据权限相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
添加分区（只支持OBS表） - 数据湖探索 DLI

向表中添加分区时，此表和分区列（建表时PARTITIONED BY指定的列）必须已存在，而所要添加的分区不能重复添加，否则将出错。已添加的分区可通过IF NOT EXISTS避免报错。若分区表是按照多个字段进行分区的，添加分区时需要指定所有的分区字段，指定字段的顺序可任意。 “pa

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关

总条数： 1040

上一页
1
2
3
4
5
...
52
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看指定数据库 - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

删除数据库 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

左半连接 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

查询所有数据库（废弃） - 数据湖探索 DLI

什么是DLI分区表的列赋权？ - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

显示所有角色和用户的绑定关系 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线