hive
-
HiveSQL
目录 HiveSQL DDL操作数据库 准备操作 操作数据库 HiveSQL DDL–hive表映射HDFS文件 HQL DDL语句–完整建表格式 内部表和…
-
Hive学习:Hive如何进行update?
Hive DML 一、插入(insert) 二、更新(update) 三、删除(delete) 一、插入(insert) 和关系型数据库语法类似 INSERT INTO table…
-
Hivesql解析多层Json数据
首先介绍下背景:在之前的一次需求中,需要将mongo表数据导入Hive表使用,导入Hive表时,mongo表数据被存成了一行行的Json格式的字符串,后续使用需要解析出Json中的…
-
HIVE调优方式(大全)
压缩方式: HIVE压缩方式: 概述:压缩方式就类似于windows的压缩包,可以降低传输,提高磁盘利用率. 区分压缩协议好坏的参考纬度: 1.压缩比,即:压缩后文件大小 2.解压…
-
Hive中数组array的相关应用
array():创建一个数组。split(string,delimiter):按指定字符分隔字符串成数组。 select array(1,3,5) c1,split(‘a,c,b’…
-
HIVE SQL 中 HQL 语句理解
简介: HQL DQL指的是 数据查询语句, 主要是对 表数据进行查询操作的. 和mysql对比: MySQL中 单表查询语句 完整格式如下: select di…
-
窗口函数简介与总结
目录 什么是窗口函数 窗口函数的实现原理 窗口函数使用场景 常用的窗口函数有: 1. 窗口排序函数:ROW_NUMBER()、RANK()、DENSE_RANK(); 2. 窗口…
-
基于华为MRS3.2.0实时Flink消费Kafka落盘至HDFS的Hive外部表的调度方案
文章目录 1 Kafka 1.1 Kerberos安全模式的认证与环境准备 1.2 创建一个测试主题 1.3 消费主题的接收测试 2 Flink 1.1 Kerberos安全模式的…
-
FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me
当hive-site.xml以及mysql等都配置好时,格式化元数据库进入hive,仍然报未格式化元数据库的错 hive> show databases; FAILED: Hive…
-
【hive 】时间差(天、小时、分、秒)和常用时间格式转
unix_timestamp()是hive系统时间,格式是timestamp,精确到秒。 unix_timestamp(ymdhms)是把时间转换成timestamp格式,是201…
-
[DataX引擎配置错误,该问题通常是由于DataX安装错误引起,请联系您的运维解决 .]. – 在有总bps限速条件下,单个channel的bps值不能为空,也不能为非正数
目录 一、背景 二、报错 三、定位原因 四、解决办法 1.修改文件datax/conf/core.json 2.json内容中删除总限速的配置 五、参数说明 六、DataX提速优化…
-
【DolphinScheduler】datax读取hive分区表时,空分区、分区无数据任务报错问题解决
问题背景: 最近在使用海豚调度DolphinScheduler的Datax组件时,遇到这么一个问题:之前给客户使用海豚做的离线数仓的分层搭建,一直都运行好好的,过了个元旦,这几天突…
-
hive的应用场景
网站日志分析: 假设你运营一个大型网站,你可以将网站产生的日志数据导入到Hive中,然后通过执行Hive查询分析用户行为、访问模式、热门内容等。这有助于优化网站性能和改善用户体验。…
-
HIVE(三)+ 教育项目
目录 目录 分桶表 函数 空字符段赋值函数 CASE WHEN THEN ELSE END 多列变一列 一行变多行 窗口函数(开窗函数) 自定义函数 压缩和存储 文件存储格式 离…
-
iceberg对比hive优势
1.事务性 从事务性上来说,iceberg具有更高的数据质量。 因为iceberg本质是一种table format,屏蔽了底层的存储细节,写入数据时候需要严格按照schema写入…
