分布式 | 第13页 | 协通编程

大数据

kafka如何避免消息重复消费

Kafka 避免消息重复消费通常依赖于以下策略和机制： 1. Consumer Group ID Kafka使用Consumer Group ID来跟踪每个消费者所读取的消息。确保…

1天前

大数据

RabbitMQ知识

消息队列为什么要使用消息队列 ①解耦在未使用消息队列的系统中，系统间耦合性太强。如下图所示的业务场景，系统A在代码中直接调用系统B和系统C的代码，如果将来D系统接入或者B系统取…

1天前

Kafka实战：消费指定时间范围内的Kafka Topic数据

Kafka实战：消费指定时间范围内的Kafka Topic数据在大数据领域，Kafka是一个广泛使用的分布式流数据平台。它提供了高吞吐量、可扩展性和容错性，使得实时数据流处理变得…

大数据 1天前

大数据

Structured

结构化编程模型输出终端/位置默认情况下，Spark的结构化流支持多种输出方案： 1- console sink: 将结果数据输出到控制台。主要是用在测试中，并且支持3种输出模式…

1天前

大数据

hadoop集群启动master节点jps后没有namenode解决方案

hadoop集群启动jps后没有namenode 启动集群jps后出现： 1.关闭集群 stop-all.sh 2.切换到hadoop的目录下将logs与tmp文件与内容删除并创建…

1天前

Kafka中的group

Kafka是一种高性能、可扩展的分布式消息系统，被广泛应用于大规模数据流处理的场景。在Kafka中，group_id是一个关键概念，用于实现消息的分组消费。本文将详细介绍group…

大数据 1天前

大数据

RabbitMQ 基础

1.初识RabbitMQ 1.1.同步调用我们现在基于OpenFeign的调用都属于是同步调用，那么这种方式存在哪些问题呢？拓展性差性能下降级联失败而要解决这些问题，我们…

1天前

jmeter集成kafka测试

Kafka的使用查看kafka的topic ./kafka-topics –bootstrap-server 10.1.9.84:9092 –list 查…

大数据 1天前

大数据

Win10 环境下 spark 本地环境的搭建

一、安装配置 java 环境（已有 java 环境则跳过）所需文件下载链接：https://pan.baidu.com/s/1OYoeMVHOtcu05jR1mL7LeA …

1天前

HBase与HadoopYARN集成

1.背景介绍 1. 背景介绍 HBase是一个分布式、可扩展、高性能的列式存储系统，基于Google的Bigtable设计。HBase提供了自动分区、自动同步和故障转移等特性，使其…

大数据 1天前

Spark and SparkR: A Comprehensive Guide to R for Spark Development

1.背景介绍 Spark and SparkR: A Comprehensive Guide to R for Spark Development” 是一本详细的指南，…

大数据 1天前

RabbitMQ 常见问题

1. 如何保证消息顺序消费在RabbitMQ中，消息最终会保存在队列中，在同一个队列中，消息是顺序的，保持先进先出的原则，这个由Rabbitmq保证。而不同队列中的消息，Rabb…

大数据 1天前

大数据

Kafka的工作原理

一、Kafka是什么？ Kafka是一个分布式的基于发布/订阅模式的消息队列。分布式消息队列可以看成是将这种先进先出的数据结构独立部署在服务器上，应用程序可以通过远程访问接口使用它…

1天前

大数据

RabbitMQ面试题

RabbitMQ面试题 RabbitMQ的使用场景流量消锋可以通过指定springboot配置参数设置从broker中拉取的消息数量，减少spring与rabbitmq之间的网…

1天前

RabbitMQ 教程

官网地址： RabbitMQ: easy to use, flexible messaging and streaming — RabbitMQ 教程笔记： RabbitMQ 入门…

大数据 1天前