数据仓库
-
[hive] 窗口函数 ROW
文章目录 `ROW_NUMBER() ` 示例 窗口函数 ROW_NUMBER() 在 Hive SQL 中,ROW_NUMBER()是一个用于生成行号的窗口函数。 它可以为查询结…
-
【湖仓一体化】存OR算之争?SPL 我都要
在互联网技术飞速发展的今天,数据已经成为了最为宝贵的资源之一。数据的产生、收集和分析,已经成为了科技公司最为重要的一环。到底什么是湖仓一体?它和数据仓库、数据湖的关系是什么?为什么…
-
数仓工具—Hive进阶之StorageHandler(23)
Storage Handler 引入Storage Handler,Hive用户使用SQL的方式读写外部数据源, 例如ElasticSearch、 Kafka、HBase等数据源的…
-
【数据仓库】Windows源码安装DataEase,DataEase二次开发
上文记录了DataEase入门使用指南,本文主要记录Windows下源码安装及二次开发步骤【数据仓库】BI看板DataEase入坑指南_wenchun001的博客-CSDN博客 …
-
Hive 的权限管理
目录 编辑 一、Hive权限简介 1.1 hive中的用户与组 1.1.1 用户 1.1.2 组 1.1.3 角色 1.2 使用场景 1.2.1 hive cli 1.2.2 h…
-
解决Hive在DataGrip 中注释乱码问题
注释属于元数据的一部分,同样存储在mysql的metastore库中,如果metastore库的字符集不支持中文,就会导致中文显示乱码。 不建议修改Hive元数据库的编码,此处我们…
-
数据仓库 基本信息
数据仓库基本理论 数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策…
-
大数据处理架构详解:Lambda架构、Kappa架构、流批一体、Dataflow模型、实时数仓
前言 本文隶属于专栏《大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见大数据理论体系 姊妹篇 《分布式数据…
-
数据仓库系列:StarRocks 入门培训教程
文章目录 1. 什么是StarRocks? 1.1. 适用场景 1.2. [产品特性](https://docs.starrocks.io/zh-cn/latest/introdu…
-
数据仓库命名规范详解
一、数仓中为什么要在数据开发过程中强调遵守数仓开发命名规范呢? 养成良好的编程习惯 写出清楚、易懂、易维护的程序代码 提高代码质量与沟通效率 减少编码中的不必要的错误 二、数仓开发…
-
Hive之lead函数详解
例如如下语句: drop table if exists temp03; create table temp03 as select card_no, deal_date, dea…
-
一百八十八、Hive——HiveSQL查询表中的日期是星期几(亲测,附截图)
一、目的 指标需要查询以工作日和周末维度的数据统计,因此需要根据数据的日期判断这一天属于星期几,周一到周五为工作日,周六到周日为周末 二、SQL查询 (一)SQL语句 select…
-
浅识数据库与数据仓库的区别
通常我们会认为数据库与数据仓库都是用来存储数据的一个库,好像并没有什么明显区别,下面就从几个方面简单认识一下两者的区别。 从名称角度区分 数据库(Database):用来存储一些基…
-
开源、云原生且实时分析型的现代数据仓库DataBend的介绍,及其与其它开源文件存储的结合使用实例
DataBend介绍 Databend 是一个开源、云原生且实时分析型的现代数据仓库,旨在提供高效的数据存储和处理能力。它采用 Rust 语言开发,并支持 Apache Arrow…
-
Spark代码案例
一、SparkSQL案例(电影数据统计) 数据源:http://files.grouplens.org/datasets/movielens/ml-100k/u.data 复制网页…
