安装hawq ERROR: failed to list directory hdfs://linux1:8020/hawq_data or it is not empty?

  1. 数据表分区尽量采用数值类型字段如Date类型转换为距离的绝对天数。
  2. SQL语法:尽量避免between and 的使用(查看查询计划影响不大),多个子查询时尽量使用CTE(with v as…)查询
  3. 根据表的数据量以及大多数查询的类型设计数据分布策略(随机分布or哈希分布)以及bucketnum参数设置。
  4. 冷热数据存储到不同schema相同的表中尽量减小热数据所在表的分区数(通过动态增加和删除分区)。
  5. 执行分析查询计划找到SQL的性能瓶颈,有针对性的优化
  6. 采取措施尽量提升查询数据的本地化比率。

2.哈希分布表的相关参数:


3.可以使用pg_partitions视图查找有关分区设计的信息例如,查看销售表的分区设计:

下表和视图显示有关分区表的信息

汾区表A目录中有默认哈希桶数目的segfile,但大小都为0而其字表(如a1)目录中有默认哈希桶数目的segfile,且有文件

可以显示扫描的分区名称。

??Explain analyze和explain语句不同explain analyze会真正执行查询,并得到查询执行过程中的统计数据explain analyze的结果对了解查询执行的具体情况以及了解查询性能问题产生的原洇有很大帮助。

 
 
 












HAWQ查看表大小: //不包含分区表
 
 
 

我要回帖

 

随机推荐