hadoop
-
Hive创建分区表并插入数据
业务中经常会遇到这种需求:数据每天全量更新,但是要求月底将数据单独保存一份以供后期查询某月节点的信息。这时就要考虑用到Hive的分区表实现,即按照月份创建分区表,相当于新的月份数据…
-
【dbeaver】win环境的kerberos认证和Clouders/cdh集群中Kerberos认证使用Dbeaver连接Hive、Impala和Phoenix
一、配置Mit kerberos 1.1 下载安装MIT KERBEROS客户端 MIT KERBEROS 下载较新的版本即可。 下载之后一路默认安装即可。注意:不要修改软件安装位…
-
简单讲讲在一台机器上用docker部署hadoop HDFS
为什么写这篇文章? 老东西叫我用vmvare部署hadoop,我觉得这简直蠢毙了,让我们用docker和docker-compose来快速的过一遍如何使用docker-compos…
-
Hadoop-MapReduce-MRAppMaster启动篇
一、源码下载 下面是hadoop官方源码下载地址,我下载的是hadoop-3.2.4,那就一起来看下吧 Index of /dist/hadoop/core 二、上下文 在上一篇…
-
HBase高手之路4-Shell操作
文章目录 HBase高手之路3—HBase的shell操作 一、hbase的shell命令汇总 二、需求 三、表的操作 1.进入shell命令行 2.创建表 3.查看表的定义 4.…
-
大数据实战——基于Hadoop的Mapreduce编程实践案例的设计与实现
基于Hadoop的Mapreduce编程实践案例的设计与实现 一、数据排序案例的设计与实现 1.1设计思路 1.2实践过程 1.3成果展示+数据可视化分析 二、求数据平均值案例的设…
-
Hadoop3.x学习笔记
文章目录 一、Hadoop入门 1、Hadoop概述 1.1 简介 1.2 hadoop优势 1.3 hadoop组成 1.4 大数据技术生态体系 2、环境准备(重点) 2.1 模…
-
[hive] 窗口函数 ROW
文章目录 `ROW_NUMBER() ` 示例 窗口函数 ROW_NUMBER() 在 Hive SQL 中,ROW_NUMBER()是一个用于生成行号的窗口函数。 它可以为查询结…
-
在win10上安装配置Hadoop的环境变量
一、背景 在windows10系统中运行seatunnel 二、安装部署 2.1. 下载 Hadoop包 从 Apache Hadoop 官网下载最新版本的 Hadoop,版本号保…
-
数仓工具—Hive进阶之StorageHandler(23)
Storage Handler 引入Storage Handler,Hive用户使用SQL的方式读写外部数据源, 例如ElasticSearch、 Kafka、HBase等数据源的…
-
基于hadoop+hive的全国天气大数据可视化平台
【大数据分析毕设之S2023102基于Hadoop+hive的全国天气大数据分析可视化平台(hive+sqoop+hdfs+E chart)】 https://www.bilibi…
-
大数据之Hadoop3简单入门(一)(通俗易懂)
目录 一. 大数据基础概论 1.1 何为大数据 2.1 大数据特点(4V) 2.1.1 Volume(大量) 2.2.2 Velocity(高速) 2.2.3 Varity(多样)…
-
[hadoop全分布部署]安装Hadoop、配置Hadoop 配置文件②
👨🎓👨🎓博主:发量不足 个人简介:耐心,自信来源于你强大的思想和知识基础!! 📑📑…
-
Spark编程基础期末复习
选择题 1. spark 的四大组件下面哪个不是 (D) A.Spark Streaming B Mlib C Graphx D Spark R 2.下面哪个端口不是 spark …
-
Presto的介绍、使用和原理架构
文章目录 简介 介绍 优缺点 Presto和hive的对比 Presto、Impala性能比较 原理 架构 整体架构 sql执行步骤 具体分析 资源和调度 查询调度 **资源管理*…
