hive
-
基于hadoop+hive的全国天气大数据可视化平台
【大数据分析毕设之S2023102基于Hadoop+hive的全国天气大数据分析可视化平台(hive+sqoop+hdfs+E chart)】 https://www.bilibi…
-
Hive01
Hive的安装 上传安装包 解压 tar zxvf apache-hive-3.1.2-bin.tar.gz mv apache-hive-3.1.2-bin hive 解决Hiv…
-
5. Hive的三种去重方法
文章目录 Hive的三种去重方法 1. distinct 2. group by 3. row_number() 4. 三者的效率对比 参考链接 Hive的三种去重方法 1. di…
-
Presto的介绍、使用和原理架构
文章目录 简介 介绍 优缺点 Presto和hive的对比 Presto、Impala性能比较 原理 架构 整体架构 sql执行步骤 具体分析 资源和调度 查询调度 **资源管理*…
-
【Hadoop】图解 Hadoop 生态系统及其组件
图解 Hadoop 生态系统及其组件 1.HDFS2.MapReduce3.YARN4.Hive5.Pig6.Mahout7.HBase8.Zookeeper9.Sqoop10.F…
-
Hive 的权限管理
目录 编辑 一、Hive权限简介 1.1 hive中的用户与组 1.1.1 用户 1.1.2 组 1.1.3 角色 1.2 使用场景 1.2.1 hive cli 1.2.2 h…
-
解决Hive在DataGrip 中注释乱码问题
注释属于元数据的一部分,同样存储在mysql的metastore库中,如果metastore库的字符集不支持中文,就会导致中文显示乱码。 不建议修改Hive元数据库的编码,此处我们…
-
Hive解析Json数组超全讲解
Hive解析Json数组超全讲解 在Hive中会有很多数据是用Json格式来存储的,如开发人员对APP上的页面进行埋点时,会将多个字段存放在一个json数组中,因此数据平台调用数据…
-
hive lag() 和lead()函数
LAG 和 LEAD函数简介 Hive 中的 LAG 和 LEAD 函数时,通常用于在结果集中获取同一列在前一行(LAG)或后一行(LEAD)的值。这在分析时间序列数据、计算变化率…
-
数据仓库命名规范详解
一、数仓中为什么要在数据开发过程中强调遵守数仓开发命名规范呢? 养成良好的编程习惯 写出清楚、易懂、易维护的程序代码 提高代码质量与沟通效率 减少编码中的不必要的错误 二、数仓开发…
-
Hive之set参数大全-1
A 控制是否允许在需要时按需加载用户定义函数(UDF) hive.allow.udf.load.on.demand 是 Apache Hive 中的一个配置属性,用于控制是否允许在…
-
使用Sqoop将Hive数据导出到TiDB
关系型数据库与大数据平台之间的数据传输之前写过一些 使用Sqoop将数据在HDFS与MySQL互导 使用Sqoop将SQL Server视图中数据导入Hive 使用DataX将Hi…
-
Hive实战 — 电子商务消费行为分析
目录 数据结构 Customer表 Transaction表 Store表 Review表 上传数据 创建目录用于存放数据 把本地文件上传到HDFS上 创建外部表 创建数据库 创…
-
Hive之lead函数详解
例如如下语句: drop table if exists temp03; create table temp03 as select card_no, deal_date, dea…
-
一百八十八、Hive——HiveSQL查询表中的日期是星期几(亲测,附截图)
一、目的 指标需要查询以工作日和周末维度的数据统计,因此需要根据数据的日期判断这一天属于星期几,周一到周五为工作日,周六到周日为周末 二、SQL查询 (一)SQL语句 select…
