数据仓库 | 协通编程

【译】OpenMetadata 与 DataHub：架构、功能、集成等方面的比较

原文地址：OpenMetadata vs. DataHub: Compare Architecture, Capabilities, Integrations & More…

后端 1天前

大数据

银行数据仓库体系实践（2）–系统架构

UML对系统架构的定义是：系统的组织结构，包括系统分解的组成部分，它们的关联性，交互，机制和指导原则，例如对系统群就是定义各子系统的功能和职责，如贷款系统群可能分为…

1天前

大数据

Hive常见报错与解决方案

背景公司近期上火山云，hive、hadoop、tez等都有较大的版本升级，继而引发了一系列的报错。现将遇到的报错内容以及相应解决方法列出来，供大家参考。关于版本：组件升级…

1天前

大数据

GBASE南大通用 GCDW&阿里云计算巢：自动化部署云原生数据仓库

目前，GBASE南大通用已与阿里云计算巢合作，双方融合各自技术优势，助力企业用户实现云上数据仓库的自动化部署，让用户在云端获取数据仓库服务“更简单”，让用户在云端使用数据仓库服务“…

1天前

数据仓库的安全性与合规性

1.背景介绍数据仓库是企业和组织中的核心资产之一，它存储了大量的敏感数据和商业秘密。随着数据仓库的发展和应用范围的扩大，数据仓库的安全性和合规性变得越来越重要。数据仓库的安全性涉…

大数据 1天前

数据仓库的数据模型与设计：关系图形化构建

1.背景介绍数据仓库是一种用于存储和管理大量历史数据的系统，它的主要目的是为数据分析和报告提供支持。数据仓库通常包含大量的表格数据，这些数据需要进行复杂的查询和分析。为了实现高效…

大数据 1天前

大数据

阿里云-数据仓库-全链路大数据开发治理平台-DataWorks的数字世界

一、前言上文我讲到阿里云-数据仓库-数据分析开发神器-ODPS ，今天我带领大家一起走进神器的成长环境及它的数据世界。二、 DataWorks是什么 DataWorks基于M…

1天前

大数据

一文了解数据库vs数据仓库vs数据湖

大家好，我是K&D，一名10年以上大数据架构&研发经验从业者，目前主要从事云原生大数据方向设计，擅长云原生技术、数据架构、数据平台构建、大数据组件性能调优以下是本…

1天前

大数据

springboot+mybatis+echarts +mysql制作数据可视化大屏

作者水平低，如有错误，恳请指正！谢谢！！！！！目录一、数据源二、所需工具三、项目框架搭建 3.1新建springboot项目 3.1.1进入官网 3.1.2创建项目四、后…

1天前

2024.1.5 Hadoop阶段,各组件工作原理,八股文,面试题

目录 1 . 简述下分布式和集群的区别 2. Hadoop的三大组件是什么? 3. 请简述hive元数据服务配置的三种模式? 4. 数据库与数据仓库的区别? 5. 简述下数据仓库经…

大数据 1天前

大数据

Hive学习（13）lag和lead函数取偏移量

hive里面lag函数在数据处理和分析中，窗口函数是一种重要的技术，用于在数据集中执行聚合和分析操作。Hive作为一种大数据处理框架，也提供了窗口函数的支持。在Hive中，Lag…

1天前

大数据

hiveSql解析DolphinScheduler调度系统7位crontab表达式

背景先说下我们数仓大致的数据链路。各个业务系统的数据库 -> hive -> doris -> 报表/邮件/系统 hive里ods层几乎所有的数据都依赖于从业…

1天前

数据流的存储与管理：构建高效的数据仓库

1.背景介绍数据仓库是现代企业和组织中不可或缺的一部分，它们需要有效地存储、管理和分析大量的数据。随着数据的增长和复杂性，构建高效的数据仓库变得越来越重要。在这篇文章中，我们将讨…

大数据 1天前

Hive中处理中文乱码问题的解决方法

中文乱码是在处理大数据时经常遇到的问题之一，尤其是在使用Hive进行数据分析和查询时。本文将介绍一些解决Hive中文乱码问题的方法，并提供相应的源代码示例。设置Hive的字符集编…

大数据 1天前

Hive insert插入数据与with子查询

1. insert into 与 insert overwrite区别 insert into 与 insert overwrite 都可以向hive表中插入数据，但是insert…

大数据 1天前