分布式 | 第8页 | 协通编程

Jave

XXL-JOB详解（整合springboot）保姆级教程

文章目录 XXL-JOB简介 XXL-JOB是什么为什么需要任务调度平台，而不用传统的 Timer 与 Quartz 为什么选择XXL-JOB，不选择elasticjob ==学…

1天前

Python

Protobuf协议初级详解（python使用）从安装到序列化-反序列化

教程一、前言二、效果三、教程 1）安装 2）使用 1.创建.proto文件 2.proto语法 3.protoc.exe文件编译.proto语法文件 4.序列化 5.反序列化…

1天前

大数据

一文让你学明白Hadoop《大数据技术之Hadoop》详细知识总结

思维导图：一：Hadoop的简介简介： Hadoop是由Apache基金会所开发的一个开源的分布式存储和处理大数据的框架，可以在计算机集群中进行大规模数据集的的存储和处理，并提…

1天前

大数据

windows环境下安装zookeeper

安装下载地址：Apache Downloads 注意：zookeeper的安装路径不要有中文，建议也不要有空格文件路径如下：生成并修改zoo.cfg文件复制zookeepe…

1天前

Couchbase高可用与分布式

1.背景介绍 1. 背景介绍 Couchbase是一款高性能、高可用、分布式的NoSQL数据库系统，基于Memcached和Apache CouchDB的技术。它具有强大的数据存储…

大数据 1天前

HBase的数据压缩与存储效率实践

1.背景介绍 1. 背景介绍 HBase是一个分布式、可扩展、高性能的列式存储系统，基于Google的Bigtable设计。它是Hadoop生态系统的一部分，可以与HDFS、Map…

大数据 1天前

Hadoop 实战 | 词频统计WordCount

词频统计通过分析大量文本数据中的词频，可以识别常见词汇和短语，从而抽取文本的关键信息和概要，有助于识别文本中频繁出现的关键词，这对于理解文本内容和主题非常关键。同时，通过分析词在…

大数据 1天前

大数据

【Kafka系列 02】Kafka 线上集群部署方案

前言 Kafka线上集群部署方案怎么做？既然是集群部署，那必然就要有多个 Kafka 节点机器，且需要仔细地考量各种因素，结合自身的业务需求而制定。下面分别从操作系统、磁盘、磁盘容…

1天前

【Spark基础】– RDD 转 Dataframe 的三种方式

目录一、环境说明二、RDD 转 Dataframe 的方法 1、通过 StructType 创建 Dataframe（强烈推荐使用这种方法）

大数据 1天前

Kafka入门及可视化界面推荐

Kafka 官方文档： https://kafka.apache.org/documentation/ Kafka 中文文档 – ApacheCN 快速开始 vim c…

大数据 1天前

HBase在实时监控场景下的应用

1.背景介绍 HBase是一个分布式、可扩展、高性能的列式存储系统，基于Google的Bigtable设计。它是Hadoop生态系统的一部分，可以与HDFS、MapReduce、Z…

大数据 1天前

大数据

Hadoop的DataNode无法启动的解决方案

Hadoop重启一次，里面的数据需要重新导入，发现无法导入数据，查看jps发现是DataNode没有启动，重新启动发现也无法启动，原因是前面重新启动NameNode，里面的文件格式…

1天前

大数据

RabbitMQ的五种消息模型

相关RabbitMQ学习链接： 1.初学RabbitMQ-CSDN博客 2.安装RabbitMQ-CSDN博客 3.SpringBoot整合RabbitMQ-CSDN博客 Rabb…

1天前

大数据

吊炸天的 Kafka 图形化工具 Eagle，必须推荐给你

Kafka是当下非常流行的消息中间件，据官网透露，已有成千上万的公司在使用它。最近实践了一波Kafka，确实很好很强大。今天我们来从三个方面学习下Kafka：Kafaka在Linu…

1天前

kafka 如何保证消息的顺序消费

在Kafka分布式集群中，要保证消息的顺序消费，您可以采取以下措施：分区策略：Kafka的主题可以分为多个分区，每个分区内的消息是有序的。因此，首先要确保生产者将相关的消息发送到…

大数据 1天前