数据仓库
-
银行数据仓库体系实践(1)–银行数据仓库简介
银行数据仓库简介 数据仓库之父比尔(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立数据仓库》)一书中所提…
-
[DataX引擎配置错误,该问题通常是由于DataX安装错误引起,请联系您的运维解决 .]. – 在有总bps限速条件下,单个channel的bps值不能为空,也不能为非正数
目录 一、背景 二、报错 三、定位原因 四、解决办法 1.修改文件datax/conf/core.json 2.json内容中删除总限速的配置 五、参数说明 六、DataX提速优化…
-
【DolphinScheduler】datax读取hive分区表时,空分区、分区无数据任务报错问题解决
问题背景: 最近在使用海豚调度DolphinScheduler的Datax组件时,遇到这么一个问题:之前给客户使用海豚做的离线数仓的分层搭建,一直都运行好好的,过了个元旦,这几天突…
-
hive的应用场景
网站日志分析: 假设你运营一个大型网站,你可以将网站产生的日志数据导入到Hive中,然后通过执行Hive查询分析用户行为、访问模式、热门内容等。这有助于优化网站性能和改善用户体验。…
-
HIVE(三)+ 教育项目
目录 目录 分桶表 函数 空字符段赋值函数 CASE WHEN THEN ELSE END 多列变一列 一行变多行 窗口函数(开窗函数) 自定义函数 压缩和存储 文件存储格式 离…
-
2023年最新交通航线(飞机、高铁)信息数据合集(含经纬度匹配)
中国高铁航线数据库Chinese High-speed Rail and Airline Database,CRAD)是一个专门收集和管理航空公司和高铁公司交通航线信息的数据仓库。…
-
Hive中的常用concat函数——concat函数、concat
1、concat() 1.1、用法:concat(str1,str2,str3,…) 连接参数的函数,返回结果为连接参数的字符串。如果有一个参数为NULL,则返回的结果为NULL。…
-
【DBeaver】驱动添加-Hive和星环
驱动 Hive驱动 hive驱动可以直接去官网下载官网地址,填一下个人信息。 如果想直接下载可以去我上次的资源下地址,需要用zip解压。 星环驱动 星环驱动是我第一次接触,是国产的…
-
kettle系列(2)kettle连接sql sever
在系列(1)已经介绍过kettle以及使用了,这次就直接正题 kettle使用,进行sql sever连接 版本: kettle 7.1 sql sever 2022 环境: …
-
Hive csv文件导入Hive
一、如何把csv文件导入Hive (1) 在Hive中建立与csv相对应的表 create table if not exists tmp.tmp_wenxin_20231123 …
-
postgresql 内核源码分析 btree索引的增删查代码基本原理流程分析,索引膨胀的原因在这里
B-Tree索引代码流程分析 专栏内容: postgresql内核源码分析 手写数据库toadb 并发编程 开源贡献: toadb开源库 个人主页:我的主页 管理社区:开源数据…
-
Hive 数仓及数仓设计方案
数仓(Data Warehouse) 数据仓库存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供一个统一、规范的出口。做数仓就是做方案,是用数据治理企业的方案。 数据仓库的…
-
【hive】hive数据类型及数据类型转换的注意事项
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、hive数据类型 1、数值型数据类型 2、字符型数据类型 3、日期型数据类型 4、其他数据类型 5、…
-
HIVE窗口函数
什么是窗口函数 hive中开窗函数通过over关键字声明;窗口函数,准确地说,函数在窗口中的应用;比如sum函数不仅可在group by后聚合,在可在窗口中应用; hive中gro…
-
Hive创建外部表详细步骤
① 在hive中执行HDFS命令:创建/data目录 hive命令终端输入: hive> dfs -mkdir -p /data; 或者在linux命令终端输入: hdfs …
