Hive数据库:嵌入、本地、远程全攻略(下)

先介绍一下本地模式和远程模式:

当使用本地模式时,Hive将其元数据存储在本地数据库(例如MySQL)中,使其成为一个独立的数据处理系统。在本地模式中,Hive的配置文件(hive-site.xml)中的连接URL指向本地数据库,而不是嵌入式模式中使用的Derby数据库。此模式适用于小规模的数据处理需求,通常在单个节点上运行。

在远程模式下,Hive被配置为通过Thrift服务与远程的Hive服务器进行通信。这允许将Hive设置为分布式系统,其中Hive客户端和Hive服务器可以分布在不同的节点上。在这种情况下,Hive客户端通过Thrift协议与Hive服务器通信,执行查询和操作。远程模式适用于需要处理大规模数据集的场景,可以充分利用分布式计算资源。

1.本地模式的安装与配置:

该模式需将hive-site.xml中的ConnectionURL指向mysql,并配置好驱动名、数据库连接账号,在slave1下

(1)、Hive的配置:

1.配置hive-site.xml:

vi  hive-site.xml

    hive.metastore.warehouse.dir  
    /warehousedir/home  
 

         javax.jdo.option.ConnectionURL jdbc:mysql://192.168.222.174:3306/hive?createDatabaseIfNotExist=true


    javax.jdo.option.ConnectionDriverName
    com.mysql.jdbc.Driver


    javax.jdo.option.ConnectionUserName
    root


    javax.jdo.option.ConnectionPassword
    123456


    hive.metastore.schema.verification
    false

(前提:要启动hadoop:cd/usr/hadoop/hadoop-2.7.3 接着sbin/start-all.sh)

2.启动hive:

bin/hive  –service 

3.远程模式的安装与配置:

(slave2安装mysql,hive做本地模式;slave1作为hive server;slave2作为客户端)

(1)slave2中安装mysql

1. (安装MySQL的引导包)

(1). yum install -y wget   

(2). wget -I -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm  

(3). ls查看,若没有则重新安装一次) 

2. 安装文件:rpm -ivh mysql57-community-release-el7-8.noarch.rpm

3. 安装MySQL服务器:yum -y install mysql-community-server

4. 安装补丁:rpm –import https://repo.mysql.com/RPM-GPG-KEY-mysql-2022)

5. 重载被MySQL安装修改了的文件:systemctl daemon-reload

6. 首次启动MySQL:systemctl start  mysqld.service

查看MySQL的运行状态:systemctl status  mysqld.service

7. 修改数据库密码及密码规则:

(1). 查密码:grep “password” /var/log/mysqld.log (查看的是临时密码)

(2). 登录MySQL:mysql -uroot –p  (-p后面加临时密码,临时密码与

p之间没有间隔)

(3). 修改密码规则:set global validate_password_policy=0;

                set global validate_password_mixed_case_count=0;

                set global validate_password_number_count=3;

                set global validate_password_special_char_count=0;

                set global validate_password_length=1;

(4). 修改密码:ALTER USER ‘root’@’localhost’ IDENTIFIED BY ‘123456’;

(5). quit 或\q退出后重新登录;

8. 让别的服务器远程访问mysql:

(1).提高权限:create user ‘root’@‘%’ identified by’123456′;

                     GRANT ALL PRIVILEGES ON *.* TO ‘root’@‘%’WITH GRANT OPTION;

(2).刷新权限:flush privileges;

(3).修改mysql数据库中的user表:update user set host = ‘%’ where user = ‘root’; (若已经改好则会出错,用Ctrl+c退出即可)

(4).验证是否修改好:use mysql;

                         select host, user from user;

(2)将hive2.1.1传到master:/opt/soft

mkdir  /usr/hive

tar  -zxvf   /opt/soft/hive-2.1.1-bin.tar.gz  -C   /usr/hive

(4)配置环境变量:

vi /etc/profile:

#hive

export HIVE_HOME=/usr/hive/apache-hive-2.1.1-bin

export PATH=$PATH:$HIVE_HOME/bin

(5) 解决jar包依赖和版本冲突

(在master)cp /usr/hive/apache-hive-2.1.1-bin/lib/jline-2.12.jar /usr/hadoop/hadoop-2.7.3/share/hadoop/yarn/lib/

上传mysql-connector-java-5.1.7-bin.jar包至/usr/hive/apache-hive-2.1.1-bin/lib

(5)分发给其他三台

scp  –r  /usr/hive master:/usr

(6)配置hive-env.sh:

cd $HIVE_HOME/conf

cp  hive-env.sh.template   hive-env.sh

vi  hive-env.sh

HADOOP_HOME=/usr/hadoop/hadoop-2.7.3

(7)配置hive-site.xml:

vi  hive-site.xml

(1).slave1 作为服务端(处理元数据):

hive-site.xml配置如下:


    hive.metastore.warehouse.dir
    /warehousedir/home


  javax.jdo.option.ConnectionURL
jdbc:mysql://slave2:3306/hive?createDatabaseIfNotExist=true&useSSL=false


  javax.jdo.option.ConnectionDriverName
  com.mysql.jdbc.Driver


  javax.jdo.option.ConnectionUserName
  root


  javax.jdo.option.ConnectionPassword
  123456


  hive.metastore.schema.verification
 false


  datanucleus.schema.autoCreateAll
  true


    hive.exec.scratchdir
    /tmp/hive


    hive.exec.local.scratchdir
    /tmp/hive/local


    hive.downloaded.resources.dir
/tmp/hive/resources

(2)slave2 作为客户端配置hive   


    hive.metastore.warehouse.dir 
    /warehousedir/home 


    hive.metastore.local 
    false 


    hive.metastore.uris 
    thrift://slave1:9083 


    hive.exec.scratchdir
    /tmp/hive
  
  
    hive.exec.local.scratchdir
    /tmp/hive/local
  
  
    hive.downloaded.resources.dir
    /tmp/hive/resources
  

(8)初始化数据库(或不需要)
schematool -dbType mysql -initSchema

(9)启动hive

(slave1)bin/hive –service metastore

(slave2)bin/hive

在slave2中打开hive,此时通过slave1 远程调用mysql,slave1处于元数据服务挂起状态

至此,本地部署和远程部署已全部完成

xml文件也已全部打包好,放在文章顶部,需要者自取

本文来自网络,不代表协通编程立场,如若转载,请注明出处:https://net2asp.com/acc39e1e62.html