大数据
-
大数据学习的第一课-大数据概论和技术原理
目录 大数据概论 大数据概念 为什么会有大数据 大数据的4v特征 大数据的来源 云计算与大数据 大数据发展历史 大数据技术原理 大数据的存储技…
-
大数据开源框架之基于Spark的气象数据处理与分析
Spark配置请看: (30条消息) 大数据开源框架环境搭建(七)——Spark完全分布式集群的安装部署_木子一个Lee的博客-CSDN博客 目录 实验说明: 实验要求: 实验步骤…
-
Flink 数据序列化
为 Flink 量身定制的序列化框架 大家都知道现在大数据生态非常火,大多数技术组件都是运行在JVM上的,Flink也是运行在JVM上,基于JVM的数据分析引擎都需要将大量的数据存…
-
【Hadoop】HA高可用搭建保姆级教程(大二学长的万字笔记)
知识目录 一、写在前面🎈 二、集群准备🍟 2.1 集群规划 2.2 集群解释 三、说明🔑 3.1 主机名说明 3.2 用户名说明 3…
-
【云原生 | 27】Docker部署运行开源消息队列实现RabbitMQ
作者简介:🏅云计算领域优质创作者🏅新星计划第三季python赛道第一名🏅 阿里云ACE认证高级工程师🏅 ✒️个人主页…
-
大数据AI在游戏开发领域的革命
1.背景介绍 随着互联网和数字技术的发展,游戏行业已经成为了一个非常繁荣的产业。随着游戏的多样性和复杂性的增加,游戏开发者需要更有创新力和智能的方法来设计和优化游戏。这就是大数据A…
-
ES查询常用语法
目录 1. ElasticSearch之查询返回结果各字段含义 2. match 查询 3. term查询 4. terms 查询 5. range 范围 6. 布尔查询 6.1 …
-
【Hadoop】完全分布式集群搭建
知识目录 一、前言 二、配置三台虚拟机 2.1 克隆三台虚拟机 2.2 配置克隆的虚拟机 2.3 使用Xshell连接虚拟机 2.4 配置SSH免密登录 三、Hadoop集群准备 …
-
Flink中的窗口
一 窗口的概述 如下图所示,在Flink中,窗口可以把流切割成有限大小的多个“存储桶”(bucket);每个数据都会分发到对应的桶中,当到达窗口结束时间时,就对每个桶中收集的数…
-
构建大数据环境:Hadoop、MySQL、Hive、Scala和Spark的安装与配置
前言 在当今的数据驱动时代,构建一个强大的大数据环境对于企业和组织来说至关重要。本文将介绍如何安装和配置Hadoop、MySQL、Hive、Scala和Spark,以搭建一个完整的…
-
掌握大数据–Hive全面指南
1.Hive简介 2.Hive部署方式 3.Hive的架构图 4.Hive初体验 5.Hive SQL语法–DDL操作数据库 1.Hive简介 Apache Hive是…
-
Flink1.14新版KafkaSource和KafkaSink实践使用(自定义反序列化器、Topic选择器、序列化器、分区器)
前言 在官方文档的描述中,API FlinkKafkaConsumer和FlinkKafkaProducer将在后续版本陆续弃用、移除,所以在未来生产中有版本升级的情况下,新API…
-
ES常用查询命令
一、基本命令 1、获取所有_cat命令 curl -X GET localhost:9200/_cat 2、获取es集群服务健康状态 curl -X GET localhost:9…
-
【SQL应知应会】表分区(二)• Oracle版
欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流 本文收录于SQL应知应会专栏,本专栏主要用于记录对于数据库的一些学习,有基础也有进阶,有MySQL…
-
ElasticStack日志分析平台-ES 集群、Kibana与Kafka
一、Elasticsearch 1、介绍: Elasticsearch 是一个开源的分布式搜索和分析引擎,Logstash 和 Beats 收集的数据可以存储在 Elasticse…
