大数据
-
Flink Job 执行流程
Flink On Yarn 模式 基于Yarn层面的架构类似 Spark on Yarn模式,都是由Client提交App到RM上面去运行,然后 RM分配第一个containe…
-
Kafka(一)使用Docker Compose安装单机Kafka以及Kafka UI
文章目录 Kafka中涉及到的术语 Kafka镜像选择 Kafka UI镜像选择 Docker Compose文件 Kafka配置项说明 KRaft vs Zookeeper 和K…
-
Hadoop的启动和停止命令
一,当我们遇到hadoop无法集群启动namenode或者Datanode的时候我们可以选择单个强制命令来分别启动他们 (1)单个启动namenode的指令如下 sbin/hado…
-
大数据OLAP引擎发展原因及特性分析
前言:谈到当下应用最广的大数据技术,很多人都会说是数据分析;而体现大数据分析能力的则是OLAP。在大数据高速发展时期,多个技术团队基于OLAP的应用需求,开发出多种OLAP技术,如…
-
【项目实战】基于Hadoop大数据电商平台用户行为分析与可视化系统Hive、Spark计算机程序开发
注意:该项目只展示部分功能,如需了解,评论区咨询即可。 本文目录 1 设计背景 2设计意义 3 系统展示 3.1 页面展示 3.2 视频展示 4 更多推荐 5 部分功能代码 1 设…
-
Navicat连接MySQL教程及常见问题解决方法
“Navicat”是一套可创建多个连接的数据库管理工具,用以方便管理不同类型的数据库,Navicat 的功能足以满足专业开发人员的所有需求,对数据库服务器初学者来说又简单易操作。且…
-
数据优化的数据湖:构建高效的数据仓库解决方案
1.背景介绍 数据湖和数据仓库都是用于存储和管理大规模数据的解决方案,但它们之间存在一些关键的区别。数据湖是一种无结构化或半结构化的数据存储,允许数据在存储过程中保持原始格式,而数…
-
Hadoop分布式安装部署
Hadoop分布式安装部署软件 VMware Workstation Pro17 CentOS7 Hadoop-3.3.6 jdk1.8.0_391 第一步:创建虚拟机 修改网络配…
-
map 和 flatMap 的区别
一、map 和 flatMap 对应的源码 ① map方法 Stream map(Function mapper); ② flatMap方法 Stream flatMap(Func…
-
Flink实时电商数仓之DWS层
需求分析 关键词 统计关键词出现的频率IK分词进行分词需要引入IK分词器,使用它时需要引入相关的依赖。它能够将搜索的关键字按照日常的使用习惯进行拆分。比如将苹果iphone 手机,…
-
hadoop课后题带答案(期末考试复习)
csdn上没标答案粗体,为了方便复习,资源文档链接放这https://download.csdn.net/download/qq_53891711/87591420 一、填空题 1…
-
大数据与人工智能的伦理与技术:如何平衡利益与风险
1.背景介绍 大数据和人工智能(AI)已经成为当今世界的核心技术,它们在各个领域的应用都不断拓展,为人们带来了巨大的便利和价值。然而,与其他技术不同,大数据和人工智能具有一定程度的…
-
Elasticsearch数据搜索原理
Elasticsearch 是一个开源的、基于 Lucene 的分布式搜索和分析引擎,设计用于云计算环境中,能够实现实时的、可扩展的搜索、分析和探索全文和结构化数据。它具有高度的可…
-
【MySQL】如何使用图形化界面DataGrip操作数据库
🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 💫个人格言:“没有罗马,那就自己创…
-
【postgresql 基础入门】表的操作,表结构查看、修改字段类型、增加删除字段、重命名表,对表的操作总是比别人棋高一着
表的操作 专栏内容: postgresql内核源码分析 手写数据库toadb 并发编程 开源贡献: toadb开源库 个人主页:我的主页 管理社区:开源数据库 座右铭:天行健,…
