分布式
-
Zookeeper与Eureka集成
1.背景介绍 Zookeeper和Eureka都是分布式系统中常用的组件,它们各自具有不同的功能和应用场景。Zookeeper是一个开源的分布式协调服务,用于管理分布式应用程序的配…
-
案例系列:客户流失预测
文章目录 介绍:使用Spark进行特征工程 使用PySpark的Spark 设置Spark 测试Spark Spark 仪表盘 数据存储 特征工程 一个分区的特征 自定义基元 运行…
-
ClickHouse 与 Hadoop 整合: 大数据分析与集成解决方案
1.背景介绍 大数据技术在过去的几年里已经成为企业和组织中最重要的技术之一。随着数据的规模和复杂性的增加,传统的数据库和数据处理技术已经不能满足需求。因此,新的数据处理技术和系统必…
-
RabbitMQ常见问题及解决方案
目录 一、消息丢失 1、生产者重连 2、生产者确认 3、数据持久化 4、惰性队列 5、消费失败处理 二、消息重复 1、通过业务保证幂等性(优先) 2、通过消息状态去重保证幂等性 三…
-
RabbitMQ登录控制台显示–你与此网站的连接不是私密连接
一、RabbitMQ默认账号 Note: The default administrator username and password are guest and…
-
kafka详解一
kafka详解一 1、消息引擎背景 根据维基百科的定义,消息引擎系统是一组规范。企业利用这组规范在不同系统之间传递语义准确的消息,实现松耦合的异步式数据传递. 即:系统 A 发送消…
-
kafka(一)——简介
简介 Kafka 是一种分布式、支持分区、多副本的消息中间件,支持发布-订阅模式,多用于实时处理大量数据缓存的场景,类似于一个“缓存池”。 架构 Producer:消息生产者; C…
-
保证消息顺序性:Kafka 的策略与挑战
目录 1. 为什么消息顺序性很重要? 2. Kafka 的消息顺序性挑战 2.1 分区与并行性 2.2 生产者与网络延迟 2.3 消费者群组 3. 保证消息顺序性的策略 3.1 单…
-
kafka乱序消费可能的原因和解决方案
Kafka乱序消费可能的原因有以下几个: 分区顺序:Kafka中的消息按照分区进行存储和分发,每个分区内的消息是有序的,但不同分区之间的消息顺序是无法保证的。如果消费者在多个分区上…
-
搭建hadoop初次格式化 格式化了很多次报错解决方案(亲测好用)
在搭建完hadoop集群时,初次启动HDFS集群,需要对主节点进行格式化操作,其本质是清理和做一些准备工作,因为此时的HDFS在物理上还是存在的。而且主节点格式化操作只能进行一次。…
-
分布式微服务springboot+springcloud基于java的课程教学资源下载视频播放管理系统 Eureka
要掌握有关系统的基本理论,如 Java语言、 MySQL数据库等,并对其进行全面的分析。为了给系统打下坚实的技术基础,本系统采用了 MySQL数据库的架构,在开始这项工作前,首先要…
-
RabbitMQ-交换机
文章目录 一、交换机是什么? 1.路由键 2.绑定键 二、交换机的类型 1.直连交换机:Direct exchange 规则 理解 2.主题交换机:Topic exchange 规…
-
关于RabbitMQ如何增加用户名,设置权限
1.安装erl和rabbitmq;这些都可以在网上找到,安装完成之后,配置成服务,将erl和mq配置到环境变量中去。 安装方法可参考:在Windows下安装RabbitMQ_rab…
-
[PySpark学习]RDD的转换(Transformation)与动作算子(Action)
一、RDD概念 RDD(英文全称Resilient Distributed Dataset),即弹性分布式数据集是spark中引入的一个数据结构,是Spark中最基本的数据抽象,代…
-
一篇文章带你学会Hadoop-3.3.4集群部署
目录 编辑 一、Hadoop集群部署 二、基础设施配置 2.1 设置网络 2.1.1 设置主机名称 2.1.2 设置hosts配置文件 2.1.3 关闭防火墙 2.1.4 关…
