hive | 第19页 | 协通编程

在 docker 中快速启动 Apache Hive

介绍在伪分布式模式下，在Docker容器内运行Apache Hive，可以提供以下功能：快速启动/调试/为Hive准备测试环境。快速开始 1. 拉取镜像从DockerHub：…

大数据 1天前

大数据

SparkSQL

第1章 SparkSQL 概述 1.1 SparkSQL 是什么 Spark SQL 是 Spark 用于结构化数据(structured data)处理的 Spark 模块。 1…

1天前

大数据

二百一十九、Hive——HQL报错：Caused by: java.util.regex.PatternSyntaxException: Illegal repetition near index 1

一、目的在海豚调度HQL的脚本任务时报错，Caused by: java.util.regex.PatternSyntaxException: Illegal repetitio…

1天前

【flink番外篇】15、Flink维表实战之6种实现方式-维表来源于第三方数据源

Flink 系列文章一、Flink 专栏 Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。 1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。…

大数据 1天前

Hive中的常用concat函数——concat函数、concat

1、concat() 1.1、用法：concat(str1,str2,str3,…) 连接参数的函数，返回结果为连接参数的字符串。如果有一个参数为NULL，则返回的结果为NULL。…

大数据 1天前

大数据

【DBeaver】驱动添加-Hive和星环

驱动 Hive驱动 hive驱动可以直接去官网下载官网地址，填一下个人信息。如果想直接下载可以去我上次的资源下地址，需要用zip解压。星环驱动星环驱动是我第一次接触，是国产的…

1天前

Hive csv文件导入Hive

一、如何把csv文件导入Hive (1) 在Hive中建立与csv相对应的表 create table if not exists tmp.tmp_wenxin_20231123 …

大数据 1天前

Hive 数仓及数仓设计方案

数仓(Data Warehouse) 数据仓库存在的意义在于对企业的所有数据进行汇总，为企业各个部门提供一个统一、规范的出口。做数仓就是做方案，是用数据治理企业的方案。数据仓库的…

大数据 1天前

大数据

安装hive中初始化元数据库失败，显示Failed to get schema version

我在搭建数据仓库的时候，安装hive包初始化元数据库失败。在网上找了几种方法都没解决成功，然后我又重新看了一下问题，问题当中还显示了：无法使用MySQL以‘root‘@‘local…

1天前

大数据

基于Hadoop的豆瓣电影的数据抓取、数据清洗、大数据分析（hdfs、flume、hive、mysql等）、大屏可视化

目录项目介绍研究背景国内外研究现状分析研究目的研究意义研究总体设计数据获取网络爬虫介绍豆瓣电影数据的采集数据预处理数据导入及环境配置 Flume介绍 Hive…

1天前

大数据

【hive】hive数据类型及数据类型转换的注意事项

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、hive数据类型 1、数值型数据类型 2、字符型数据类型 3、日期型数据类型 4、其他数据类型 5、…

1天前

大数据

MySQL实现数据炸裂拆分(类似Hive的explode函数的拆分数组功能)

MySQL实现数据炸裂拆分(类似Hive的”explode”函数的拆分数组功能) 需求背景背景描述在Hive中，”explode&#82…

1天前

大数据

HIVE窗口函数

什么是窗口函数 hive中开窗函数通过over关键字声明；窗口函数，准确地说，函数在窗口中的应用；比如sum函数不仅可在group by后聚合，在可在窗口中应用； hive中gro…

1天前

大数据

Hive创建外部表详细步骤

① 在hive中执行HDFS命令：创建/data目录 hive命令终端输入： hive> dfs -mkdir -p /data; 或者在linux命令终端输入： hdfs …

1天前

大数据

Hive实战：网址去重

文章目录一、实战概述二、提出任务三、完成任务（一）准备数据 1、在虚拟机上创建文本文件 2、上传文件到HDFS指定目录（二）实现步骤 1、启动Hive Metastore…

1天前