检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
一般情况下,列的数值复杂度高于5万,可以被认定为高复杂度,则需要排除掉字典编码,该参数为可选参数。 说明: 在非字典列中,只支持String和Timestamp数据类型。 DICTIONARY_INCLUDE 设置指定列生成字典,适用于数值复杂度低的列,可以提升字典列上的groupby性
count(column_name) from table_name”。 JDBC超时限制 Hive提供的JDBC实现有超时限制,默认是5分钟,用户可以通过java.sql.DriverManager.setLoginTimeout(int seconds)设置,seconds的单位为秒。
/tmp/hdfs_meta.txt:导出的元数据信息保存在本地的路径。 如果源集群与目标集群网络互通,且以管理员身份运行hadoop distcp命令进行数据拷贝,可以添加参数“-p”让distcp在拷贝数据的同时在目标集群上分别恢复相应文件的元数据信息,因此在这种场景下可直接跳过本步骤。 Hive元数据导出
TBLPROPERTIES CarbonData table属性列表。 注意事项 以下是表格属性的使用。 Block大小 单个表的数据文件block大小可以通过TBLPROPERTIES进行定义,系统会选择数据文件实际大小和设置的blocksize大小中的较大值,作为该数据文件在HDFS上存储
TBLPROPERTIES CarbonData table属性列表。 注意事项 以下是表格属性的使用。 Block大小 单个表的数据文件block大小可以通过TBLPROPERTIES进行定义,系统会选择数据文件实际大小和设置的blocksize大小中的较大值,作为该数据文件在HDFS上存储
步周期所设置的时间后再尝试登录。 未开启Kerberos认证时,由于Ranger并不从Manager同步用户数据,因此,仅有admin用户可以登录Ranger,暂时不支持其他用户登录。 父主题: Ranger常见问题
信息,需要等待同步周期所设置的时间后再尝试登录。 非安全模式下,由于Ranger并不从Manager同步用户数据,因此,仅有admin用户可以登录Ranger,暂时不支持其他用户登录。 父主题: Ranger常见问题
SQL查询样例代码说明。 连接Phoenix: source /opt/client/bigdata_env kinit MRS集群用户(MRS集群用户可以是内置用户hbase,或者已加入hbase组中的其他用户,未开启Kerberos认证集群略过该命令) cd $PHOENIX_HOME bin/sqlline
datasource.opentsdb.host配置多个地址时,是否使用随机种子。配置为否时,所有在相同节点的executor会连接相同的host,这样可以配合spark.blacklist.enabled=true来实现Task容错。 false(默认) 示例 在spark-sql,spar
synconclose”为“false”,虽然性能很高,但是断电之后,存储在缓存中的数据会丢失。将“dfs.datanode.synconclose”设置为“true”,可以解决此问题,但对性能有很大影响。请根据具体的应用场景决定是否开启该参数。 父主题: HDFS常见问题
更新,导致即使显式调用Hive relogin也无法得到刷新。 解决措施: 通常情况下,在发现Hive connection不可用的时候,可以关闭该connection,重新创建一个connection继续执行。 父主题: Hive应用开发常见问题
外部的时间更新,导致即使显式调用relogin也无法得到刷新。 解决措施: 通常情况下,在发现JDBC connection不可用的时候,可以关闭该connection,重新创建一个connection继续执行。 父主题: Spark应用开发常见问题
更新,导致即使显式调用Hive relogin也无法得到刷新。 解决措施: 通常情况下,在发现Hive connection不可用的时候,可以关闭该connection,重新创建一个connection继续执行。 父主题: Hive应用开发常见问题
synconclose”为“false”,虽然性能很高,但是断电之后,存储在缓存中的数据会丢失。将“dfs.datanode.synconclose”设置为“true”,可以解决此问题,但对性能有很大影响。请根据具体的应用场景决定是否开启该参数。 父主题: HDFS常见问题
ecutor再来申请这个executor的shuffle结果就会报文件找不到。 因此,遇到这样的问题需要确认是否executor异常退出,可以根据spark任务页面的executors便签页查看是否有dead状态的executor,查看各个dead状态的executor日志,确认
根据场景开发工程 提供样例工程,帮助用户快速了解ClickHouse各部件的编程接口。 导入并配置ClickHouse样例工程 运行程序及查询结果 用户可以直接通过运行结果查看应用程序运行情况。 在本地Windows环境中调测ClickHouse应用(MRS 3.3.0之前版本) 在Linux
应用完全自助OLAP的高性能查询。 表命名规范 数据库表名称命名规则: 在数据库中,表名命名要求在当前数据库内唯一。 表名要求以字符开始,可以包含字符(a~z,A~Z)、数字(0~9)及下划线(_)。 父主题: ClickHouse宽表设计
test_db.carbon RENAME TO test_db.carbondata; 系统响应 CarbonData库中的文件夹将显示新表名称,可以通过运行SHOW TABLES显示新表名称。 父主题: CarbonData语法参考
Exception Timeout或者SocketTimeout Exception异常。 调优建议: 将ZooKeeper实例个数调整为5个及以上,可以通过设置peerType=observer来增加observer的数目。 通过控制单个任务并发的map数或减少每个节点下运行task的内存,降低节点负载。
根据场景开发工程 提供样例工程,帮助用户快速了解ClickHouse各部件的编程接口。 导入并配置ClickHouse样例工程 运行程序及查询结果 用户可以直接通过运行结果查看应用程序运行情况。 在本地Windows环境中调测ClickHouse应用(MRS 3.3.0之前版本) 在Linux