分布式
-
XXL-JOB详解(整合springboot)保姆级教程
文章目录 XXL-JOB简介 XXL-JOB是什么 为什么需要任务调度平台,而不用传统的 Timer 与 Quartz 为什么选择XXL-JOB,不选择elasticjob ==学…
-
Protobuf协议初级详解(python使用)从安装到序列化-反序列化
教程 一、前言 二、效果 三、教程 1)安装 2)使用 1.创建.proto文件 2.proto语法 3.protoc.exe文件编译.proto语法文件 4.序列化 5.反序列化…
-
一文让你学明白Hadoop《大数据技术之Hadoop》详细知识总结
思维导图: 一:Hadoop的简介 简介: Hadoop是由Apache基金会所开发的一个开源的分布式存储和处理大数据的框架,可以在计算机集群中进行大规模数据集的的存储和处理,并提…
-
windows环境下安装zookeeper
安装 下载地址:Apache Downloads 注意:zookeeper的安装路径不要有中文,建议也不要有空格 文件路径如下: 生成并修改zoo.cfg文件 复制zookeepe…
-
Couchbase高可用与分布式
1.背景介绍 1. 背景介绍 Couchbase是一款高性能、高可用、分布式的NoSQL数据库系统,基于Memcached和Apache CouchDB的技术。它具有强大的数据存储…
-
HBase的数据压缩与存储效率实践
1.背景介绍 1. 背景介绍 HBase是一个分布式、可扩展、高性能的列式存储系统,基于Google的Bigtable设计。它是Hadoop生态系统的一部分,可以与HDFS、Map…
-
Hadoop 实战 | 词频统计WordCount
词频统计 通过分析大量文本数据中的词频,可以识别常见词汇和短语,从而抽取文本的关键信息和概要,有助于识别文本中频繁出现的关键词,这对于理解文本内容和主题非常关键。同时,通过分析词在…
-
【Kafka系列 02】Kafka 线上集群部署方案
前言 Kafka线上集群部署方案怎么做?既然是集群部署,那必然就要有多个 Kafka 节点机器,且需要仔细地考量各种因素,结合自身的业务需求而制定。下面分别从操作系统、磁盘、磁盘容…
-
【Spark基础】– RDD 转 Dataframe 的三种方式
目录 一、环境说明 二、RDD 转 Dataframe 的方法 1、通过 StructType 创建 Dataframe(强烈推荐使用这种方法)
-
Kafka入门及可视化界面推荐
Kafka 官方文档: https://kafka.apache.org/documentation/ Kafka 中文文档 – ApacheCN 快速开始 vim c…
-
HBase在实时监控场景下的应用
1.背景介绍 HBase是一个分布式、可扩展、高性能的列式存储系统,基于Google的Bigtable设计。它是Hadoop生态系统的一部分,可以与HDFS、MapReduce、Z…
-
Hadoop的DataNode无法启动的解决方案
Hadoop重启一次,里面的数据需要重新导入,发现无法导入数据,查看jps发现是DataNode没有启动,重新启动发现也无法启动,原因是前面重新启动NameNode,里面的文件格式…
-
RabbitMQ的五种消息模型
相关RabbitMQ学习链接: 1.初学RabbitMQ-CSDN博客 2.安装RabbitMQ-CSDN博客 3.SpringBoot整合RabbitMQ-CSDN博客 Rabb…
-
吊炸天的 Kafka 图形化工具 Eagle,必须推荐给你
Kafka是当下非常流行的消息中间件,据官网透露,已有成千上万的公司在使用它。最近实践了一波Kafka,确实很好很强大。今天我们来从三个方面学习下Kafka:Kafaka在Linu…
-
kafka 如何保证消息的顺序消费
在Kafka分布式集群中,要保证消息的顺序消费,您可以采取以下措施: 分区策略:Kafka的主题可以分为多个分区,每个分区内的消息是有序的。因此,首先要确保生产者将相关的消息发送到…
