Hive初体验
首先,确保启动了Metastore服务
{runjar就是metastore ;hadoop要先启动 }

可以执行:
bin/hive
进入到Hive Shell 环境中,可以直接执行SQL的语句;
·创建表(hive里面的字符串就是string)(没有指定数据库都会放到default里面)
create table test(id int ,name string,gender string);

·插入数据:
insert into test values(1,'张三','男'),(2,'李四','男'),(3,'王五','女');

·查询数据:
select gender,count(*)as cnt from test group by gender;

数据的本体存放在:
hadoop fs -cat /user/hive/warehouse/test/*

本文来自网络,不代表协通编程立场,如若转载,请注明出处:https://net2asp.com/1dd5c45e4a.html
相关推荐
-
RabbitMQ快速实战
目录 什么是消息队列? 消息队列的优势 应用解耦 异步提速 削峰填谷 总结 主流MQ产品特点比较 Rabbitmq快速上手 创建用户admin Exchange和Queue Con…
1天前 -
hadoop+MySQL离线与实时的离线与实时的电影推荐系统10338-计算机毕业设计项目选题推荐(免费领源码)
摘 要 随着互联网与移动互联网迅速普及,网络上的电影娱乐信息数量相当庞大,人们对获取感兴趣的电影娱乐信息的需求越来越大,个性化的离线与实时的电影推荐系统 成为一个热门。…
1天前 -
【FLINK】Kafka数据源通过Flink-cdc进行实时数据同步
何为FLINK-CDC? CDC是Change Data Capture的缩写,中文意思是变更数据获取,flink-cdc的作用是,通过flink捕获数据源的事务变动操作记录,包括…
1天前 -
@RabbitListener(quques=“ “)用法注意(RabbitMq)
当我们使用@RabbitListener监听指定的Rabbit队列消息时。 注解里需要常量,不可以用动态变量。 所以我们在配置文件里获得的变量,不可以直接使用。 例如 @Value…
大数据 1天前 -
RabbitMq Consumer thread error, thread abort.异常导致服务关闭问题
问题描述 在使用rabbitMq消费者使用simple模式进行监听时,服务突然自动关闭,事前没有任何的cpu或者内存的报警。 查看关闭服务前的日志发现OOM异常 Consumer …
1天前 -
Springboot:kafka运行成功,报错InvalidTopicException
官方说法:The client has attempted to perform an operation on an invalid topic. For example the…
1天前 -
k8s之flink的几种创建方式
在此之前需要部署一下私人docker仓库,教程搭建 Docker 镜像仓库 注意:每台节点的daemon.json都需要配置”insecure-registries&#…
大数据 1天前 -
RabbitMQ基础知识
一.什么是RabbitMQ RabbitMQ是一个开源的、高性能的消息队列系统,用于在应用程序之间实现异步通信。它实现了AMQP(Advanced Message Qu…
1天前 -
大创项目推荐 疫情数据分析与3D可视化 – python 大数据
文章目录 0 前言 1 课题背景 2 实现效果 3 设计原理 4 部分代码 5 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 大数据全国…
1天前
