搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

插入数据 1 sparkSession.sql("insert into dli_to_dws values(2,'John',24)") 查询数据 1 jdbcDF = sparkSession.sql("select * from dli_to_dws").show() 操作结果

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

tastore是否存在，如果该数据库存在则会导致Spark作业执行失败。因此当Spark3.x的作业日志中如果出现一条访问catalog查询该数据库，并提示数据库不存在是为了确保Spark作业正常运行，无需执行其他操作。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
CREATE TABLE AS - 数据湖探索 DLI
CREATE TABLE AS - 数据湖探索 DLI

创建包含SELECT查询结果的新表。使用CREATE TABLE创建空表。使用IF NOT EXISTS子句时，如果表已经存在则不会报错。可选WITH子句可用于设置新创建的表的属性，如表的存储位置（location）、是不是外表（external）等。示例用指定列的查询结果创建新

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建DLI表关联DDS - 数据湖探索 DLI

创建DLI表关联DDS 功能描述使用CREATE TABLE命令创建DLI表并关联DDS上已有的collection。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
URL函数 - 数据湖探索 DLI
URL函数 - 数据湖探索 DLI

name=xxx&age=25#teacher'); -- http url_extract_query(url)→ varchar 描述：提取url中的查询字符串。 select url_extract_query('http://www.example.com:80/stu/index.html

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
SHOW SCHEMAS（DATABASES） - 数据湖探索 DLI

--等价写法: SHOW SCHEMAS IN hive LIKE 't%'; 如果匹配字符串中有字符与通配符冲突，可以指定转义字符来标识，示例为查询hive这个catalog下，schema_name前缀为“pm_”的所有schema，转义字符为“/”： SHOW SCHEMAS IN

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

计费概述数据湖探索DLI的计费由不同的计费项组成，不同的计费项有不同的计费模式，如图1所示。图1 DLI的计费组成计费项 DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。

帮助中心 > 数据湖探索 DLI > 计费说明
pyspark样例代码 - 数据湖探索 DLI

创建CSS跨源表的参数详情可参考表1。插入数据 1 sparkSession.sql("insert into css_table values(3,'tom')") 查询数据 1 2 jdbcDF = sparkSession.sql("select * from css_table") jdbcDF.show()

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
迁移数据场景概述 - 数据湖探索 DLI

迁移数据场景概述为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Python开发环境配置 - 数据湖探索 DLI

Python开发环境配置操作场景在安装和使用Python SDK前，确保您已经完成开发环境的基本配置。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

) CUBE ( column [, ...] ) ROLLUP ( column [, ...] ) 描述从零个或多个表中检索行数据。查询stu表的内容。 SELECT id,name FROM stu; 父主题： DQL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

sparkSession.sql("insert into css_table values(13, 'John'),(22, 'Bob')") 查询数据。 1 2 val dataFrame = sparkSession.sql("select * from css_table") dataFrame

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
还原Delta表到早期状态 - 数据湖探索 DLI

timestamp_expression 时间戳，不能晚于当前时间，格式'yyyy-MM-ddTHH:mm:ss.SSS' version_code 1.3.1中查询结果中的版本号示例 RESTORE delta_table0 TO TIMESTAMP AS OF '2020-10-18T22:15:12

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

\"[PROCESS, UDF]\",\n \"input_operators_id\" : [ ]\n } ]\n}" } 为了便于查看返回体信息，我们将stream_graph格式化后如下所示： "jid": "65b6a7b0c1ad95b1722a92b49d2f6eba"

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
JOINS - 数据湖探索 DLI
JOINS - 数据湖探索 DLI

nation ,region WHERE nation.name=region.name; OUTER JOIN OUTER JOIN返回符合查询条件的行的同时也返回不符合的行，分为以下三类：左外连接：LEFT JOIN或LEFT OUTER JOIN，表示以左表（nation）为

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
按列GROUP BY - 数据湖探索 DLI
按列GROUP BY - 数据湖探索 DLI

以使用多个聚合函数，比如count()，sum()，聚合函数中可以包含其他字段。多列GROUP BY：指GROUP BY子句中不止一列，查询语句将按照GROUP BY的所有字段分组，所有字段都相同的记录将被放在同一组中，同样，GROUP BY中出现的字段必须在attr_expr

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

原因分析 DLI源表对应字段cir为double类型。图1 创建源表目标表对应字段类型为decimal(9,6)。图2 创建目标表查询源表数据，发现导致问题产生的记录ctr值为1675，整数位（4位）超出所定义的decimal精度（9 – 6 = 3位），导致double

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。如果进一步处理采样输出，则可能会影响总查询时间。 SELECT * FROM users TABLESAMPLE BERNOULLI (50); SYSTEM 此采样方法将表划分为

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
SHOW TABLES - 数据湖探索 DLI
SHOW TABLES - 数据湖探索 DLI

Table ------------- show_table1 show_table2 (2 rows) --同时满足多个条件，查询default中'show_'开头或者'in'开头的表 show tables in default like 'show$_%|in%'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明 mongo只支持增强型跨源。只能使用包年包月队列。 DDS即文档数据库服务，兼容MongoDB协议。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo

总条数： 1059

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

CREATE TABLE AS - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

URL函数 - 数据湖探索 DLI

SHOW SCHEMAS（DATABASES） - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

还原Delta表到早期状态 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

JOINS - 数据湖探索 DLI

按列GROUP BY - 数据湖探索 DLI

通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

SHOW TABLES - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线