cdh5.12.0-centos安装mysqltar6.tar.gz 包含kudu 吗

一、关于CDH和Cloudera Manager
CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境。
Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管理的组件,对集群中主机、Hadoop、Hive、Spark等服务的安装配置管理做了极大简化。
二、系统环境
操作系统: 6.6
三、安装包准备
1.Cloudera Manager仓库镜像包下载地址:
2.CDH parcel安装包地址:
3.kudu 的 parcel 安装包地址:
4.kudu 的 csd 安装包地址:
注意: 通过 Cloudera Manager 安装parcel时sha1格式的文件需要提前修改为sha。
四、准备工作
1.更新系统(所有节点)
yum -y update
2.网络配置(所有节点)
修改hostname:
vi /etc/sysconfig/network
NETWORKING=yes
HOSTNAME= hadoop35.test.com
通过service network restart重启网络服务生效。
修改ip与主机名的对应关系
vi /etc/hosts,
10.10.25.35 .test.com
10.10.25.36 .test.com
10.10.25.37 .test.com
10.10.25.38 .test.com
10.10.25.43 .test.com
10.10.25.44 .test.com
10.10.25.45 .test.com
10.10.25.46 .test.com
注意:这里需要将每台机器的ip及主机名对应关系都写进去,本机的也要写进去,否则启动Agent的时候会提示hostname解析错误。
3.配置公钥认证(用于免密登录)
在管理节点(hadoop35.test.com)上执行
ssh-keygen -t rsa
一路回车,生成无密码的密钥对。
将公钥添加到认证文件中:
cat ~/.ssh/id_rsa.pub && ~/.ssh/authorized_keys
设置authorized_keys的访问权限:
chmod 600 ~/.ssh/authorized_keys
scp文件到所有受管节点( 10.10.25.35,36,37,38 和 10.10.25.43,44,45,46)的~/.ssh目录:
scp ~/.ssh/authorized_keys root@hadoop35.test.com:~/.ssh/
测试:在管理节点上ssh hadoop36.test.com,正常情况下,不需要密码就能直接登陆进去了。
注意:.ssh目录访问权限是700 authorized_keys的文件访问权限是600
4.关闭防火墙和SELinux(所有节点)
注意:需要在所有的节点上执行,因为涉及到的端口太多了,临时关闭防火墙是为了安装起来更方便,安装完毕后可以根据需要设置防火墙策略,保证集群安全。
关闭防火墙:
service iptables stop (临时关闭)
chkconfig iptables off (重启后生效)
关闭SELINUX(实际安装过程中发现没有关闭也是可以的,不知道会不会有问题,还需进一步进行验证):
setenforce 0 (临时生效)
修改 /etc/selinux/config 下的 SELINUX=disabled (重启后永久生效)
5.配置NTP服务
yum安装ntp(所有节点):
yum -y install ntp
在配置之前,先使用ntpdate手动同步一下时间,免得本机与对时中心时间差距太大,使得ntpd不能正常同步。这里选用us.pool.ntp.org作为对时中心,ntpdate us.pool.ntp.org。
按照Cloudera 的官方建议,所有的CDH节点和Cloudea Manager节点都需要启动ntpd服务。要不然会报如下错误:
1)此角色的主机的运行状况为不良。 以下运行状况测试不良: 时钟偏差.
2)The host’s NTP service is not synchronized to any remote server.
解决方法如下: 先配置一台NTP服务,然后所有的CDH节点都作为此NTP服务的客户端。 1,NTPD服务,hadoop35.test.com,此机器负责与外部网络的NTPD服务同步标准时间,并作为局域网内的NTPD服务器。 2,NTPD客户端,10.10.25.35,36,37,38 和 10.10.25.43,44,45,46,这些机器与hadoop35.test.com上的NTPD服务同步时间。
配置步骤:
a,配置内网NTP-Server(管理节点)
(1) 允许客户机的配置
修改ntp.conf配置文件 vi /etc/ntp.conf
①、第一种配置:允许任何IP的客户机都可以进行时间同步 将restrict default kod nomodify notrap nopeer noquery这行修改成:
restrict default nomodify
②、第二种配置:只允许10.10.25.*网段的客户机进行时间同步 在restrict default nomodify notrap noquery(表示默认拒绝所有IP的时间同步)之后增加一行: restrict 10.10.25.0 mask 255.255.255.0 nomodify
(2) 同步时间设置 ①通过网络同步时间
0.centos.pool.ntp.org
1.centos.pool.ntp.org
2.centos.pool.ntp.org
②使用本地时间
127.127.1.0
127.127.1.0
配置文件完成,保存退出,启动服务,执行如下命令:service ntpd start
检查是否成功,用ntpstat命令查看同步状态,出现以下状态代表启动成功:
(80.241.0.72)
如果出现异常请等待几分钟,一般等待5-10分钟才能同步。
设置ntp服务,开机自启动:chkconfig ntpd on
b,配置NTP客户端(受管节点)
修改ntp.conf配置文件 vi /etc/ntp.conf 通过 hadoop35.test.com 同步时间
配置文件完成,保存退出,启动服务,执行如下命令:service ntpd start 设置ntp服务,开机自启动:chkconfig ntpd on
客户端校验配置
ntpq -p查询上级时间服务器
ntpstat 查询状态
6.优化虚拟内存需求率(所有节点)
1)检查虚拟内存需求率
cat /proc/sys/vm/swappiness
显示如下:
2)临时降低虚拟内存需求率
sysctl vm.swappiness=0
3)永久降低虚拟内存需求率
使用命令 vi /etc/sysctl.conf 增加
vm.swappiness = 0
并运行如下命令使生效
7.解决透明大页面问题(所有节点)
1)检查透明大页面问题
cat /sys/kernel/mm/transparent_hugepage/defrag
如果显示为:
2)临时关闭透明大页面问题
echo never & /sys/kernel/mm/transparent_hugepage/defrag
确认配置生效:
cat /sys/kernel/mm/transparent_hugepage/defrag
应该显示为:
always madvise [never]
3)配置开机自动生效
使用命令 vi /etc/rc.local,加入如下内容
echo never & /sys/kernel/mm/transparent_hugepage/defrag
8.安装Oracle的Java(主节点安装,其他节点卸载)
CentOS,自带OpenJdk,不过运行CDH5需要使用Oracle的Jdk,需要Java 7的支持。
卸载自带的OpenJdk,使用 rpm -qa | grep java 查询java相关的包,使用 rpm -e --nodeps 包名 卸载。或者使用 yum remove java 卸载
在这里使用了cloudera仓库中的jdk的rpm安装包,使用rpm -ivh 包名进行安装。 配置环境变量:
修改profile vi /etc/profile
export JAVA_HOME=/usr/java/jdk1.7.0_67-cloudera
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
立即生效 source /etc/profile
9.安装配置MariaDB(管理节点)
a. 确保/var/lib/mysql目录有足够大的磁盘空间
b. 卸载自带的mysql。
yum remove mysql
c. 创建MariaDB yum仓库
vi /etc/yum.repos.d/MariaDB.repo
添加以下内容
name = MariaDB
baseurl = http://yum.mariadb.org/10.1/centos6-amd64
gpgkey=https://yum.mariadb.org/RPM-GPG-KEY-MariaDB
gpgcheck=1
d. 安装MariaDB
yum install MariaDB-server MariaDB-client MariaDB-devel
e. 配置my.conf
vi /etc/my.cnf
用以下内容替换
transaction-isolation = READ-COMMITTED
key_buffer = 16M
key_buffer_size = 32M
max_allowed_packet = 32M
thread_stack = 256K
thread_cache_size = 64
query_cache_limit = 8M
query_cache_size = 64M
query_cache_type = 1
max_connections = 550
log_bin=/var/lib/mysql/mysql_binary_log
binlog_format = mixed
read_buffer_size = 2M
read_rnd_buffer_size = 16M
sort_buffer_size = 8M
join_buffer_size = 8M
innodb_file_per_table = 1
innodb_flush_log_at_trx_commit
innodb_log_buffer_size = 64M
innodb_buffer_pool_size = 4G
innodb_thread_concurrency = 8
innodb_flush_method = O_DIRECT
innodb_log_file_size = 512M
[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
h. 启动MariaDB
service mysql start
g. 查看MariaDB版本
10.1.21-MariaDB,
h. 设置开机启动
chkconfig mysql on
i. 初始化数据库
$ sudo /usr/bin/mysql_secure_installation
Enter current password for root (enter for none):
OK, successfully used password, moving on...
Set root password? [Y/n] y
New password:
Re-enter new password:
Remove anonymous users? [Y/n] Y
Disallow root login remotely? [Y/n] N
Remove test database and access to it [Y/n] Y
Reload privilege tables now? [Y/n] Y
j. 使用mysql -uroot -p进入mysql命令行,创建数据库和用户:
create database hive DEFAULT CHARACTER SET utf8;
grant all on hive.* TO 'hive'@'%' IDENTIFIED BY 'hive';
create database hue DEFAULT CHARACTER SET utf8;
grant all on hue.* TO 'hue'@'%' IDENTIFIED BY 'hue';
create database oozie DEFAULT CHARACTER SET utf8;
grant all on oozie.* TO 'oozie'@'%' IDENTIFIED BY 'oozie';
10.安装mysql JDBC 驱动(管理节点)
下载mysql JDBC 驱动放到目录 /usr/share/java/ 并修改名为mysql-connector-java.jar 下载地址
五、安装配置 Cloudera Manager(管理节点)
1.建立Cloudera Manager安装文件自定义存储库
a.安装httpd服务器
查询一下是否已经安装了apache
rpm -qa httpd
如果还没有则进行安装
yum -y install httpd
启动apache
service httpd start
开机自启动
chkconfig httpd on
b.将Cloudera Manager仓库镜像包cm5.10.0-centos6.tar.gz
解压到/var/www/html/cm目录,文件目录结构如下
2.通过rpm安装包本地安装 Cloudera Manager
到目录 /var/www/html/cm/5/RPMS/x86_64
.10.*.rpm .10.*.rpm .10.*.rpm
3.Parcel和csd格式文件上传
a. 上传下列文件到Parcel包的存放路径: /opt/cloudera/parcel-repo/
.10.0-1.cdh5.10.0.p0.41-el6.parcel
.10.0-1.cdh5.10.0.p0.41-el6.parcel.sha
.2.0-1.cdh5.10.0.p0.55-el6.parcel
.2.0-1.cdh5.10.0.p0.55-el6.parcel.sha
b.上传最新的kudu csd文件到csd包存放路径: /opt/cloudera/csd/
最后目录结构如下:
4.配置 Cloudera Manager Server 数据库
使用命令scm_prepare_database.sh创建Cloudera Manager Server数据库配置文件
命令格式如下
/usr/share/cmf/schema/scm_prepare_database.sh database-type [options] database-name username password
/usr/share/cmf/schema/scm_prepare_database.sh mysql -hlocalhost -uroot -p123456 --scm-host localhost scm scm scm
执行完成后生成数据库配置文件/etc/cloudera-scm-server/db.properties
com.cloudera.cmf.db.type=mysql
com.cloudera.cmf.db.host=localhost
com.cloudera.cmf.db.name=scm
com.cloudera.cmf.db.user=scm
com.cloudera.cmf.db.password=scm
com.cloudera.cmf.db.setupType=EXTERNAL
参考链接:
5.启动Cloudera Manager Server
service cloudera-scm-server start
等待大概两分钟,访问
进入管理端 (登陆名:admin 密码:admin)
六、修改impala参数
1、时区问题:
默认impala配置不是中国的时区,所以在用from_unixtime的时候,有误差。 解决方案:impala启动时加 -use_local_tz_for_unix_timestamp_conversions=true
在cdh里面 impala-&配置-&impala Daemon -&Impala Daemon 命令行参数高级配置代码段(安全阀)
-use_local_tz_for_unix_timestamp_conversions=true
七、安装配置 kudu 服务
的 Install Kudu Using Parcels 章节。
八、验证安装情况
登录 # impala-shell
a.查看impala-shell版本
Starting Impala Shell without Kerberos authentication
Connected to hadoop36.test.com:21000
Server version: impalad version 2.7.0-cdh5.10.0 RELEASE (build 785a073cd07eecebb8b38161ccbd2aa2)
***********************************************************************************
Welcome to the Impala shell.
(Impala Shell v2.7.0-cdh5.10.0 (785a073) built on Fri Jan 20 12:03:56 PST 2017)
To see live updates on a query's progress, run 'set LIVE_SUMMARY=1;'.
***********************************************************************************
[hadoop36.test.com:21000] &
select version();
Query: select version()
Query submitted at: 2017-03-01 11:52:01 (Coordinator: http://hadoop36.test.com:25000)
Query progress can be monitored at: http://hadoop36.test.com:25000/query_plan?query_id=3240bf5cc2cbfa7b:390c36da
| version()
| impalad version 2.7.0-cdh5.10.0 RELEASE (build 785a073cd07eecebb8b38161ccbd2aa2) |
| Built on Fri Jan 20 12:03:56 PST 2017
Fetched 1 row(s) in 1.11s
b.使用impala-shell
CREATE DATABASE impala_
USE impala_
CREATE TABLE my_first_table (
id BIGINT PRIMARY KEY,
name STRING
PARTITION BY HASH PARTITIONS 5
STORED AS KUDU
TBLPROPERTIES('kudu.master_addresses' = 'hadoop36.test.com:7051,hadoop37.test.com:7051,hadoop38.test.com:7051,hadoop43.test.com:7051,hadoop44.test.com:7051,hadoop45.test.com:7051,hadoop46.test.com:7051') ;
insert into my_first_table values(100,'张三');
select * from my_first_
九、常见问题
问题1:在主节点初始化 CM5的数据库
报错:ld-linux.so.2
bad ELF interpreter
解决:安装 glibc 和 glibc.i686
问题2:安装主机时报错
报错:ProtocolError: &ProtocolError for 127.0.0.1/RPC2: 401 Unauthorized&
解决:$& ps -ef | grep supervisord
$& kill -9 &processID&
/opt/cm-5.6.0/etc/init.d/cloudera-scm-agent restart
问题3:server启动时,日志提示端口被占用。
解决:关闭java进程。
问题4:web安装,当前管理的主机显示都是本地地址
解决:注释/etc/hosts 的loaclhost ,在检查agent日志的报错。
重启所有agent
重启server
问题5:web数据库设置,登入被拒绝
解决:grant all privileges on *.* to 'hive'@'cdh1' identified by '123456'
问题6:web安装时,群集设置 HDFS格式失败
解决:删除原有的/dfs
问题7:web安装时,群集设置HDFS 创建/tmp失败
解决:ntp一定启动服务器,不能光用命令同步。(这个好像不是问题的所在,但是ntp服务必须要启动的)
还出现,再重试试试。
问题8:web管理页面提示时间偏差
解决:检查ntpdc -c loopinfo
Name or service not known
vim /etc/hosts
添加 本机IP对应localhost 地址
JDBC driver cannot be found. Unable to find the JDBC database jar on host
下载jar包:
MySQL-connector-Java-5.1.27.jar
mv mysql-connector-java-5.1.27.jar mysql-connector-java.jar
mv mysql-connector-java.jar
/usr/share/java/
登录用户共同私钥
私钥文件id_rsa所在位置
$ cd ~/.ssh/
将此文件下载后,在cm在线安装界面上传即可。
添加zookeeper实例错误
当有一台机器正在跑zookeeper的时候,再添加其他的,就会报错如下
Starting these new ZooKeeper Servers may cause the existing ZooKeeper Datastore to be lost. Try again after restarting any
existing ZooKeeper Servers with outdated configurations. If you do not want to preserve the existing Datastore, you can start
each ZooKeeper Server from its respective Status page.
将正在运行的zookeeper实例停止,然后再三台一起启动即可。
启动kudu失败,错误日志提示Service unavailable: Cannot initialize clock: Error reading clock. Clock considered unsynchronized
到kudu实例节点运行ntpstat 输出unsynchronised polling server every 64 s
发现节点未完成同步,
解决: 检查ntp服务,或等待2分钟后再查看是否完成同步
十、非root用户方案
1.所有节点添加普通用户(在本例中使用hadoop)
useradd -u 1050 hadoop
2.让普通用户获得sudo执行操作权限
编辑sudoers文件 vi /etc/sudoers
允许用户组hadoop里面的用户执行sudo命令,并且在执行的时候不输入密码.
3.ssh免密登录
同准备步骤中的免密登录配置方式一致,用户hadoop用户生成秘钥,拷贝到其他机器的hadoop用户名目录,注意目录权限。
卸载cloudera参考
在cdh5.12 中安装kudu
离线在运行的cdh中安装kudu服务
1、下载安装表 cdh5.12(包含)之前需要
据说 5.13不需要另外下载
下载目录:http://archive.cloudera.com/k...
cdh5.10新特性
https://www.cloudera.com/documentation/enterprise/release-notes/topics/cdh_rn_new_in_cdh_510.html#im...
CDH集成KUDU
安装 CSD 文件
这里假设用户通过 Cloudera Manager 添加服务向导来部署 Kudu 1.0。
下载CSD文件
wget http:...
KUDU - Cloudera开发的又一个Hadoop系存储系统
作者:刘旭晖 Raymond 转载请注明出处
  原文: http://blog.csdn.net/colorant/article/details/?utm_source=tu...
kudu安装测试随笔
最近试了试apache的新项目kudu,因为资料很少所以安装编译出了很多问题,暂时简单记录下。
从网上为数不多的可以了解,kudu是既可以类似数据仓库、关系数据库等进行复杂的关系查询,也具有...
CM5(5.11.0)和CDH5(5.11.0)离线安装
CM5(5.11.0)和CDH5(5.11.0)离线安装
概述文件下载系统环境搭建日志查看Q&A参考
CDH (Cloudera's Distribution, including...
CentOS7下Cloudera ManagerCDH-5.11安装配置详解
最近一直在研究spark的实时计算,公司说最近可能会用CDH来替代Apache的hadoop,于是研究了一下怎么使用Cloudera Manager来安装CDH(以前一直都是手动安装的,不得不说Clo...
Kafka+Storm+HBase项目Demo(1)--CDH搭建hadoop集群
这是一个类似淘宝双11大屏幕的Demo项目 。kafka+storm+hbase整合:kafka作为分布式消息系统,实时消息系统,有生产者和消费者;storm作为大数据的实时处理系统;hbase是ap...
CDH安装和维护
目录:1、安装文件准备2、系统环境准备3、cloudera manager 调优4、Cloudera Manager安装5、CDH安装6、常用工具地址7、一些常见问题—————————————————...
大数据集群之CDH版本搭建完整版
如果感兴趣,可以移驾我的博客,原文地址:https://hywelzhang.github.io//%E9%9B%86%E7%BE%A4%E6%90%AD%E5%BB%BA-CDH...
没有更多推荐了,
(window.slotbydup=window.slotbydup || []).push({
id: "5865575",
container: s,
size: "300,250",
display: "inlay-fix"安装 CSD 文件
这里假设用户通过 Cloudera Manager 添加服务向导来部署 Kudu 1.0。
下载CSD文件
并把下载的jar文件移动到/opt/cloudera/csd目录
mv KUDU-1.0.0.jar /opt/cloudera/csd/?
修改文件的owner及权限
chown cloudera-scm:cloudera-scm /opt/cloudera/csd/KUDU-1.0.0.jar
chmod 644 /opt/cloudera/csd/KUDU-1.0.0.jar
重启cloudera management服务
service cloudera-scm-server restart
安装Kudu软件
管理员用户登录部署 Cloudera Manager 的机器:
Parcel配置 中设置Kudu Parcel 包下载地址:
(说明:如果安装使用的是本地repo,请下载parcels包,创建本地repo后配置本地repo地址)
通过 Cloudera Manager 管理界面(Parcel 管理界面)下载、分发、激活 Kudu Parcel 包。
安装配置Kudu实例
在 Cloudera Manager 管理界面添加 Kudu 服务
配置Kudu角色
配置Kudu参数(主要是存储WAL、数据的文件目录)
关于配置 block_manager的问题
并非所有文件系统格式都需要设置该选项。ext4、xfs格式支持hole punching,所以不需要设置block_manager=file,但是ext3 格式需要。可以通过df命令来查看文件系统的格式。
[root@CM-NODE ~]# df -Th
Filesystem
Used Avail Use% Mounted on
0% /dev/shm
1% /mnt/sdb
1% /mnt/sdc
cm_processes
1% /var/run/cloudera-scm-agent/process
如果是ext3 格式,请在kudu服务的配置中,找到属性Kudu (Beta) Service Advanced Configuration Snippet (Safety Valve) for gflagfile,并添加如下行:
–block_manager=file
启动 Kudu 服务
安装 Impala on Kudu?
卸载原先安装的 Impala
Impala服务 (stop & Delete)
重新下载 Impala on Kudu 的 Parcel 包,下载地址:
(说明:如果安装使用的是本地repo,请下载parcels包,创建本地repo后配置本地repo地址)
安装Impala_Kudu软件包
通过 Cloudera Manager 管理界面(Parcel 管理界面)下载、分发、激活 Impala on Kudu Parcel 包: 通过添加服务向导添加 Impala 服务,添加完毕后
修改 Impala 配置,启动Impala on Kudu
重启 Impala 服务
修改 Impala-shell 二进制程序链接
由于系统的impala-shell仍然是链接到默认的impala程序,需要修改其链接。
使用命令 alternatives –display impala-shell 查看当前的版本。
链接依然指向卸载之前的impala版本,应指向第二个IMPALA_KUDU
使用命令修改为正确版本
alternatives –set impala-shell /opt/cloudera/parcels/IMPALA_KUDU-2.6.0-1.cdh5.8.0.p0.17/bin/impala-shell
再 alternatives –display impala-shell?验证修改成功
验证 impala-shell 版本
impala-shell
CDH环境集成KUDU的安装和使用
CDH环境集成KUDU安装与使用说明一、安装说明1.1、安装步骤:1、重新配置CDH集群,将对应版本的KUDU放到本地repo目录后按照安装CDH环境步骤逐步进行安装;1.2、所遇问题:1、无法读取到...
kudu踩坑记之一
在开发过程中,难免会手误,由于在通过impala-shell建kudu表时候把bigint类型的字段写成了string,以致后面在计算时候报错。但由于该表有2亿的数据(交易明细表),不可能重新抽取,于...
cdh&kudu数据导入导出
数据可视化系统2.0使用cdh,上线后发现生产环境很多数据对不上;
开发进行了查询修改,需要在测试环境复验,需要把生产环境的kudu数据导出一份,再导入到测试环境进行验证;
安装 Cloudera Manager、CDH、KUDU 随手记
转自:https://my.oschina.net/balajinima/blog/862969
一、关于CDH和Cloudera Manager
CDH (Cloudera's Di...
在cdh5.12 中安装kudu
离线在运行的cdh中安装kudu服务
1、下载安装表 cdh5.12(包含)之前需要
据说 5.13不需要另外下载
下载目录:http://archive.cloudera.com/k...
KUDU - Cloudera开发的又一个Hadoop系存储系统
作者:刘旭晖 Raymond 转载请注明出处
  原文: http://blog.csdn.net/colorant/article/details/?utm_source=tu...
kudu安装测试随笔
最近试了试apache的新项目kudu,因为资料很少所以安装编译出了很多问题,暂时简单记录下。
从网上为数不多的可以了解,kudu是既可以类似数据仓库、关系数据库等进行复杂的关系查询,也具有...
Kudu是一个比较新的大数据组建,在国内大规模应用的公司并不多,kudu的安装文档也只找到官网上的一份,自己在按照官网的步骤进行安装的过程中也遇到了一些问题,现记录一下完整的安装过程:
cdh5.10新特性
https://www.cloudera.com/documentation/enterprise/release-notes/topics/cdh_rn_new_in_cdh_510.html#im...
没有更多推荐了,
(window.slotbydup=window.slotbydup || []).push({
id: "5865577",
container: s,
size: "300,250",
display: "inlay-fix"一、关于CDH和Cloudera Manager
CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境。
Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管理的组件,对集群中主机、Hadoop、Hive、Spark等服务的安装配置管理做了极大简化。
二、系统环境
操作系统: 6.6
三、安装包准备
1.Cloudera Manager仓库镜像包下载地址:
2.CDH parcel安装包地址:
3.kudu 的 parcel 安装包地址:
4.kudu 的 csd 安装包地址:
注意: 通过 Cloudera Manager 安装parcel时sha1格式的文件需要提前修改为sha。
四、准备工作
1.更新系统(所有节点)
yum -y update
2.网络配置(所有节点)
修改hostname:
vi /etc/sysconfig/network
NETWORKING=yes
HOSTNAME= hadoop35.test.com
通过service network restart重启网络服务生效。
修改ip与主机名的对应关系
vi /etc/hosts,
10.10.25.35 .test.com
10.10.25.36 .test.com
10.10.25.37 .test.com
10.10.25.38 .test.com
10.10.25.43 .test.com
10.10.25.44 .test.com
10.10.25.45 .test.com
10.10.25.46 .test.com
注意:这里需要将每台机器的ip及主机名对应关系都写进去,本机的也要写进去,否则启动Agent的时候会提示hostname解析错误。
3.配置公钥认证(用于免密登录)
在管理节点(hadoop35.test.com)上执行
ssh-keygen -t rsa
一路回车,生成无密码的密钥对。
将公钥添加到认证文件中:
cat ~/.ssh/id_rsa.pub && ~/.ssh/authorized_keys
设置authorized_keys的访问权限:
chmod 600 ~/.ssh/authorized_keys
scp文件到所有受管节点( 10.10.25.35,36,37,38 和 10.10.25.43,44,45,46)的~/.ssh目录:
scp ~/.ssh/authorized_keys root@hadoop35.test.com:~/.ssh/
测试:在管理节点上ssh hadoop36.test.com,正常情况下,不需要密码就能直接登陆进去了。
注意:.ssh目录访问权限是700 authorized_keys的文件访问权限是600
4.关闭防火墙和SELinux(所有节点)
注意:需要在所有的节点上执行,因为涉及到的端口太多了,临时关闭防火墙是为了安装起来更方便,安装完毕后可以根据需要设置防火墙策略,保证集群安全。
关闭防火墙:
service iptables stop (临时关闭)
chkconfig iptables off (重启后生效)
关闭SELINUX(实际安装过程中发现没有关闭也是可以的,不知道会不会有问题,还需进一步进行验证):
setenforce 0 (临时生效)
修改 /etc/selinux/config 下的 SELINUX=disabled (重启后永久生效)
5.配置NTP服务
yum安装ntp(所有节点):
yum -y install ntp
在配置之前,先使用ntpdate手动同步一下时间,免得本机与对时中心时间差距太大,使得ntpd不能正常同步。这里选用us.pool.ntp.org作为对时中心,ntpdate us.pool.ntp.org。
按照Cloudera 的官方建议,所有的CDH节点和Cloudea Manager节点都需要启动ntpd服务。要不然会报如下错误:
1)此角色的主机的运行状况为不良。 以下运行状况测试不良: 时钟偏差.
2)The host’s NTP service is not synchronized to any remote server.
解决方法如下: 先配置一台NTP服务,然后所有的CDH节点都作为此NTP服务的客户端。 1,NTPD服务,hadoop35.test.com,此机器负责与外部网络的NTPD服务同步标准时间,并作为局域网内的NTPD服务器。 2,NTPD客户端,10.10.25.35,36,37,38 和 10.10.25.43,44,45,46,这些机器与hadoop35.test.com上的NTPD服务同步时间。
配置步骤:
a,配置内网NTP-Server(管理节点)
(1) 允许客户机的配置
修改ntp.conf配置文件 vi /etc/ntp.conf
①、第一种配置:允许任何IP的客户机都可以进行时间同步 将restrict default kod nomodify notrap nopeer noquery这行修改成:
restrict default nomodify
②、第二种配置:只允许10.10.25.*网段的客户机进行时间同步 在restrict default nomodify notrap noquery(表示默认拒绝所有IP的时间同步)之后增加一行: restrict 10.10.25.0 mask 255.255.255.0 nomodify
(2) 同步时间设置 ①通过网络同步时间
0.centos.pool.ntp.org
1.centos.pool.ntp.org
2.centos.pool.ntp.org
②使用本地时间
127.127.1.0
127.127.1.0
配置文件完成,保存退出,启动服务,执行如下命令:service ntpd start
检查是否成功,用ntpstat命令查看同步状态,出现以下状态代表启动成功:
(80.241.0.72)
如果出现异常请等待几分钟,一般等待5-10分钟才能同步。
设置ntp服务,开机自启动:chkconfig ntpd on
b,配置NTP客户端(受管节点)
修改ntp.conf配置文件 vi /etc/ntp.conf 通过 hadoop35.test.com 同步时间
配置文件完成,保存退出,启动服务,执行如下命令:service ntpd start 设置ntp服务,开机自启动:chkconfig ntpd on
客户端校验配置
ntpq -p查询上级时间服务器
ntpstat 查询状态
6.优化虚拟内存需求率(所有节点)
1)检查虚拟内存需求率
cat /proc/sys/vm/swappiness
显示如下:
2)临时降低虚拟内存需求率
sysctl vm.swappiness=0
3)永久降低虚拟内存需求率
使用命令 vi /etc/sysctl.conf 增加
vm.swappiness = 0
并运行如下命令使生效
7.解决透明大页面问题(所有节点)
1)检查透明大页面问题
cat /sys/kernel/mm/transparent_hugepage/defrag
如果显示为:
2)临时关闭透明大页面问题
echo never & /sys/kernel/mm/transparent_hugepage/defrag
确认配置生效:
cat /sys/kernel/mm/transparent_hugepage/defrag
应该显示为:
always madvise [never]
3)配置开机自动生效
使用命令 vi /etc/rc.local,加入如下内容
echo never & /sys/kernel/mm/transparent_hugepage/defrag
8.安装Oracle的Java(主节点安装,其他节点卸载)
CentOS,自带OpenJdk,不过运行CDH5需要使用Oracle的Jdk,需要Java 7的支持。
卸载自带的OpenJdk,使用 rpm -qa | grep java 查询java相关的包,使用 rpm -e --nodeps 包名 卸载。或者使用 yum remove java 卸载
在这里使用了cloudera仓库中的jdk的rpm安装包,使用rpm -ivh 包名进行安装。 配置环境变量:
修改profile vi /etc/profile
export JAVA_HOME=/usr/java/jdk1.7.0_67-cloudera
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
立即生效 source /etc/profile
9.安装配置MariaDB(管理节点)
a. 确保/var/lib/mysql目录有足够大的磁盘空间
b. 卸载自带的mysql。
yum remove mysql
c. 创建MariaDB yum仓库
vi /etc/yum.repos.d/MariaDB.repo
添加以下内容
name = MariaDB
baseurl = http://yum.mariadb.org/10.1/centos6-amd64
gpgkey=https://yum.mariadb.org/RPM-GPG-KEY-MariaDB
gpgcheck=1
d. 安装MariaDB
yum install MariaDB-server MariaDB-client MariaDB-devel
e. 配置my.conf
vi /etc/my.cnf
用以下内容替换
transaction-isolation = READ-COMMITTED
key_buffer = 16M
key_buffer_size = 32M
max_allowed_packet = 32M
thread_stack = 256K
thread_cache_size = 64
query_cache_limit = 8M
query_cache_size = 64M
query_cache_type = 1
max_connections = 550
log_bin=/var/lib/mysql/mysql_binary_log
binlog_format = mixed
read_buffer_size = 2M
read_rnd_buffer_size = 16M
sort_buffer_size = 8M
join_buffer_size = 8M
innodb_file_per_table = 1
innodb_flush_log_at_trx_commit
innodb_log_buffer_size = 64M
innodb_buffer_pool_size = 4G
innodb_thread_concurrency = 8
innodb_flush_method = O_DIRECT
innodb_log_file_size = 512M
[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
h. 启动MariaDB
service mysql start
g. 查看MariaDB版本
10.1.21-MariaDB,
h. 设置开机启动
chkconfig mysql on
i. 初始化数据库
$ sudo /usr/bin/mysql_secure_installation
Enter current password for root (enter for none):
OK, successfully used password, moving on...
Set root password? [Y/n] y
New password:
Re-enter new password:
Remove anonymous users? [Y/n] Y
Disallow root login remotely? [Y/n] N
Remove test database and access to it [Y/n] Y
Reload privilege tables now? [Y/n] Y
j. 使用mysql -uroot -p进入mysql命令行,创建数据库和用户:
create database hive DEFAULT CHARACTER SET utf8;
grant all on hive.* TO 'hive'@'%' IDENTIFIED BY 'hive';
create database hue DEFAULT CHARACTER SET utf8;
grant all on hue.* TO 'hue'@'%' IDENTIFIED BY 'hue';
create database oozie DEFAULT CHARACTER SET utf8;
grant all on oozie.* TO 'oozie'@'%' IDENTIFIED BY 'oozie';
10.安装mysql JDBC 驱动(管理节点)
下载mysql JDBC 驱动放到目录 /usr/share/java/ 并修改名为mysql-connector-java.jar 下载地址
五、安装配置 Cloudera Manager(管理节点)
1.建立Cloudera Manager安装文件自定义存储库
a.安装httpd服务器
查询一下是否已经安装了apache
rpm -qa httpd
如果还没有则进行安装
yum -y install httpd
启动apache
service httpd start
开机自启动
chkconfig httpd on
b.将Cloudera Manager仓库镜像包cm5.10.0-centos6.tar.gz
解压到/var/www/html/cm目录,文件目录结构如下
2.通过rpm安装包本地安装 Cloudera Manager
到目录 /var/www/html/cm/5/RPMS/x86_64
.10.*.rpm .10.*.rpm .10.*.rpm
3.Parcel和csd格式文件上传
a. 上传下列文件到Parcel包的存放路径: /opt/cloudera/parcel-repo/
.10.0-1.cdh5.10.0.p0.41-el6.parcel
.10.0-1.cdh5.10.0.p0.41-el6.parcel.sha
.2.0-1.cdh5.10.0.p0.55-el6.parcel
.2.0-1.cdh5.10.0.p0.55-el6.parcel.sha
b.上传最新的kudu csd文件到csd包存放路径: /opt/cloudera/csd/
最后目录结构如下:
4.配置 Cloudera Manager Server 数据库
使用命令scm_prepare_database.sh创建Cloudera Manager Server数据库配置文件
命令格式如下
/usr/share/cmf/schema/scm_prepare_database.sh database-type [options] database-name username password
/usr/share/cmf/schema/scm_prepare_database.sh mysql -hlocalhost -uroot -p123456 --scm-host localhost scm scm scm
执行完成后生成数据库配置文件/etc/cloudera-scm-server/db.properties
com.cloudera.cmf.db.type=mysql
com.cloudera.cmf.db.host=localhost
com.cloudera.cmf.db.name=scm
com.cloudera.cmf.db.user=scm
com.cloudera.cmf.db.password=scm
com.cloudera.cmf.db.setupType=EXTERNAL
参考链接:
5.启动Cloudera Manager Server
service cloudera-scm-server start
等待大概两分钟,访问
进入管理端 (登陆名:admin 密码:admin)
六、修改impala参数
1、时区问题:
默认impala配置不是中国的时区,所以在用from_unixtime的时候,有误差。 解决方案:impala启动时加 -use_local_tz_for_unix_timestamp_conversions=true
在cdh里面 impala-&配置-&impala Daemon -&Impala Daemon 命令行参数高级配置代码段(安全阀)
-use_local_tz_for_unix_timestamp_conversions=true
七、安装配置 kudu 服务
的 Install Kudu Using Parcels 章节。
八、验证安装情况
登录 # impala-shell
a.查看impala-shell版本
Starting Impala Shell without Kerberos authentication
Connected to hadoop36.test.com:21000
Server version: impalad version 2.7.0-cdh5.10.0 RELEASE (build 785a073cd07eecebb8b38161ccbd2aa2)
***********************************************************************************
Welcome to the Impala shell.
(Impala Shell v2.7.0-cdh5.10.0 (785a073) built on Fri Jan 20 12:03:56 PST 2017)
To see live updates on a query's progress, run 'set LIVE_SUMMARY=1;'.
***********************************************************************************
[hadoop36.test.com:21000] &
select version();
Query: select version()
Query submitted at: 2017-03-01 11:52:01 (Coordinator: http://hadoop36.test.com:25000)
Query progress can be monitored at: http://hadoop36.test.com:25000/query_plan?query_id=3240bf5cc2cbfa7b:390c36da
| version()
| impalad version 2.7.0-cdh5.10.0 RELEASE (build 785a073cd07eecebb8b38161ccbd2aa2) |
| Built on Fri Jan 20 12:03:56 PST 2017
Fetched 1 row(s) in 1.11s
b.使用impala-shell
CREATE DATABASE impala_
USE impala_
CREATE TABLE my_first_table (
id BIGINT PRIMARY KEY,
name STRING
PARTITION BY HASH PARTITIONS 5
STORED AS KUDU
TBLPROPERTIES('kudu.master_addresses' = 'hadoop36.test.com:7051,hadoop37.test.com:7051,hadoop38.test.com:7051,hadoop43.test.com:7051,hadoop44.test.com:7051,hadoop45.test.com:7051,hadoop46.test.com:7051') ;
insert into my_first_table values(100,'张三');
select * from my_first_
九、常见问题
问题1:在主节点初始化 CM5的数据库
报错:ld-linux.so.2
bad ELF interpreter
解决:安装 glibc 和 glibc.i686
问题2:安装主机时报错
报错:ProtocolError: &ProtocolError for 127.0.0.1/RPC2: 401 Unauthorized&
解决:$& ps -ef | grep supervisord
$& kill -9 &processID&
/opt/cm-5.6.0/etc/init.d/cloudera-scm-agent restart
问题3:server启动时,日志提示端口被占用。
解决:关闭java进程。
问题4:web安装,当前管理的主机显示都是本地地址
解决:注释/etc/hosts 的loaclhost ,在检查agent日志的报错。
重启所有agent
重启server
问题5:web数据库设置,登入被拒绝
解决:grant all privileges on *.* to 'hive'@'cdh1' identified by '123456'
问题6:web安装时,群集设置 HDFS格式失败
解决:删除原有的/dfs
问题7:web安装时,群集设置HDFS 创建/tmp失败
解决:ntp一定启动服务器,不能光用命令同步。(这个好像不是问题的所在,但是ntp服务必须要启动的)
还出现,再重试试试。
问题8:web管理页面提示时间偏差
解决:检查ntpdc -c loopinfo
Name or service not known
vim /etc/hosts
添加 本机IP对应localhost 地址
JDBC driver cannot be found. Unable to find the JDBC database jar on host
下载jar包:
MySQL-connector-Java-5.1.27.jar
mv mysql-connector-java-5.1.27.jar mysql-connector-java.jar
mv mysql-connector-java.jar
/usr/share/java/
登录用户共同私钥
私钥文件id_rsa所在位置
$ cd ~/.ssh/
将此文件下载后,在cm在线安装界面上传即可。
添加zookeeper实例错误
当有一台机器正在跑zookeeper的时候,再添加其他的,就会报错如下
Starting these new ZooKeeper Servers may cause the existing ZooKeeper Datastore to be lost. Try again after restarting any
existing ZooKeeper Servers with outdated configurations. If you do not want to preserve the existing Datastore, you can start
each ZooKeeper Server from its respective Status page.
将正在运行的zookeeper实例停止,然后再三台一起启动即可。
启动kudu失败,错误日志提示Service unavailable: Cannot initialize clock: Error reading clock. Clock considered unsynchronized
到kudu实例节点运行ntpstat 输出unsynchronised polling server every 64 s
发现节点未完成同步,
解决: 检查ntp服务,或等待2分钟后再查看是否完成同步
十、非root用户方案
1.所有节点添加普通用户(在本例中使用hadoop)
useradd -u 1050 hadoop
2.让普通用户获得sudo执行操作权限
编辑sudoers文件 vi /etc/sudoers
允许用户组hadoop里面的用户执行sudo命令,并且在执行的时候不输入密码.
3.ssh免密登录
同准备步骤中的免密登录配置方式一致,用户hadoop用户生成秘钥,拷贝到其他机器的hadoop用户名目录,注意目录权限。
卸载cloudera参考
在cdh5.12 中安装kudu
离线在运行的cdh中安装kudu服务
1、下载安装表 cdh5.12(包含)之前需要
据说 5.13不需要另外下载
下载目录:http://archive.cloudera.com/k...
cdh5.10新特性
https://www.cloudera.com/documentation/enterprise/release-notes/topics/cdh_rn_new_in_cdh_510.html#im...
CDH集成KUDU
安装 CSD 文件
这里假设用户通过 Cloudera Manager 添加服务向导来部署 Kudu 1.0。
下载CSD文件
wget http:...
KUDU - Cloudera开发的又一个Hadoop系存储系统
作者:刘旭晖 Raymond 转载请注明出处
  原文: http://blog.csdn.net/colorant/article/details/?utm_source=tu...
kudu安装测试随笔
最近试了试apache的新项目kudu,因为资料很少所以安装编译出了很多问题,暂时简单记录下。
从网上为数不多的可以了解,kudu是既可以类似数据仓库、关系数据库等进行复杂的关系查询,也具有...
CM5(5.11.0)和CDH5(5.11.0)离线安装
CM5(5.11.0)和CDH5(5.11.0)离线安装
概述文件下载系统环境搭建日志查看Q&A参考
CDH (Cloudera's Distribution, including...
CentOS7下Cloudera ManagerCDH-5.11安装配置详解
最近一直在研究spark的实时计算,公司说最近可能会用CDH来替代Apache的hadoop,于是研究了一下怎么使用Cloudera Manager来安装CDH(以前一直都是手动安装的,不得不说Clo...
Kafka+Storm+HBase项目Demo(1)--CDH搭建hadoop集群
这是一个类似淘宝双11大屏幕的Demo项目 。kafka+storm+hbase整合:kafka作为分布式消息系统,实时消息系统,有生产者和消费者;storm作为大数据的实时处理系统;hbase是ap...
CDH安装和维护
目录:1、安装文件准备2、系统环境准备3、cloudera manager 调优4、Cloudera Manager安装5、CDH安装6、常用工具地址7、一些常见问题—————————————————...
大数据集群之CDH版本搭建完整版
如果感兴趣,可以移驾我的博客,原文地址:https://hywelzhang.github.io//%E9%9B%86%E7%BE%A4%E6%90%AD%E5%BB%BA-CDH...
没有更多推荐了,
(window.slotbydup=window.slotbydup || []).push({
id: "5865575",
container: s,
size: "300,250",
display: "inlay-fix"

我要回帖

更多关于 centos安装tar 的文章

 

随机推荐