flink sql作业报错Timeout of 60000ms expired before the position for partition xxx could be determined

1天前 • 大数据

问题：

新增流作业，将kafka集群的数据通过flink sql写入hdfs,所有的flink作业均出现订阅的topic某个分区超时；且topic的partition数量等于flink 可用的slot数

在这里插入图片描述

原因：

消费不到kakfa的topic数据，首先看网络问题

（1）通过kafka-topics.sh命令找到topic分区所对应的leader和Isr 在这里插入图片描述

（2）连接kafka对应的zookeeper客户端，找到kafka连接超时分区的leader对应的服务器ip

在这里插入图片描述

(3)查看页面，找到出现异常的taskmanager所对应的域名,通过ping和telnet命令测试是否网络正常，发现不通，生产环境存在2套网络,(一套管理ip、一套服务ip)，域名映射出错

解决：

打通此节点和cdh集群之间的网络，配置正确的域名映射

本文来自网络，不代表协通编程立场，如若转载，请注明出处：https://net2asp.com/9aa0dee86c.html

赞 (0)

clickhouse数据库删除数据的五种方式

« 上一篇 1天前

Elasticsearch：使用 LangChain 文档拆分器进行文档分块

下一篇 » 1天前

大数据

Kafka面试套路这么多，读完大神的Kafka核心手册，足以秒杀面试官

在热招的Java架构师岗位面试中，Kafka 面试题被面试官选中的几率非常大，也是HR 的杀手锏和狠招，一般来讲，面试题有以下几种： Kafka 为什么这么快？如何对 Kafka…

1天前
大数据

【愚公系列】2024年02月大数据教学课程 021-zookeeper的使用

🏆 作者简介，愚公搬代码 🏆《头衔》：华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云…

1天前
大数据

Zookeeper之手写一个分布式锁

前言我之前写了一篇快速上手ZK的文章：https://blog.csdn.net/qq_38974073/article/details/135293106 本篇最要是进一步加深…

1天前
大数据

RabbitMQ如何保证消息不丢失

1. 丢失原因分析观察整个 RabbitMQ 消息发送过程：从上述流程我们可以得知：消息从生产者到达消费者，经过两次网络传输，并且在 RabbitMQ 服务器中进行路由。因此…

1天前
大数据

Hadoop-生产调优

第1章 HDFS-核心参数 1.1 NameNode内存生产配置 1）NameNode 内存计算每个文件块大概占用 150 byte，一台服务器 128G 内存为例，能存储多少文…

1天前
大数据

基于hadoop+spark的大规模日志的一种处理方案

概述： CDN服务平台上有为客户提供访问日志下载的功能，主要是为了满足在给CDN客户提供服务的过程中，要对所有的记录访问日志，按照客户定制的格式化需求以小时为粒度（或者…

1天前
实时Flink大数据分析平台的数据流时间窗口操作

1.背景介绍在大数据时代，实时分析和处理数据变得越来越重要。Apache Flink是一个流处理框架，它可以处理大规模的实时数据流，并提供高性能和低延迟的数据处理能力。在Flin…

大数据 1天前
Spark生态系统与大数据处理

1.背景介绍 Spark生态系统是一个基于Hadoop生态系统的扩展，旨在解决大数据处理中的一些问题。Spark生态系统包括Spark Streaming、Spark SQL、ML…

大数据 1天前
Iceberg从入门到精通系列之二十二：Spark DDL

Iceberg从入门到精通系列之二十二：Spark DDL 一、Spark DDL 二、Spark DDL-创建表三、Spark DDL-PARTITIONED BY 四、Spa…

大数据 1天前
Spark与AWS：云计算中的Spark

1.背景介绍在当今的大数据时代，数据处理和分析的需求日益增长。Apache Spark作为一个开源的大数据处理框架，因其出色的处理速度和易用性，已经成为大数据处理的首选工具。而云…

大数据 1天前