大数据 | 第12页 | 协通编程

Flink状态容错savepoint与checkpoint

本文目录 Checkpoints State Backends Savepoints Checkpoints 与 Savepoints区别 Flink可以保证exactly onc…

大数据 1天前

大数据

kylin集群负载均衡(kylin3,hbaseRIF问题)

hbase历险记目录 hbase历险记寻找问题分析原因解决方案方案1（资源问题、失败）方案2（成功）寻找问题不知道你是不是有这样的疑惑。我kylin…

1天前

CDH大数据平台 22Cloudera Manager Console之azkaban与freeIPA、Kerberos等组合配置(markdown新版三)

?个人主页：@与自己作战 ?作者简介：CSDN@博客专家、CSDN@大数据领域优质创作者、CSDN@内容合伙人、阿里云@专家博主 ?希望大佬们多多支持，携手共进 ? 如果文章对你有…

大数据 1天前

大数据

Hadoop详解

Hadoop 概念就是一个大数据解决方案。它提供了一套分布式系统基础架构。核心内容包含 hdfs 和mapreduce。hadoop2.0 以后引入 yarn. hdfs 是提…

1天前

Spark之Dynamic Resource Allocation

文章目录 Dynamic Resource Allocation 请求策略移除策略移除存在的问题相关参数 Dynamic Resource Allocation Spark提…

大数据 1天前

大数据

基于Hologres+Flink的曹操出行实时数仓建设作者：林震｜曹操出行实时计算负责人

作者：林震｜曹操出行实时计算负责人曹操出行业务背景介绍曹操出行创立于2015年5月21日，是吉利控股集团布局“新能源汽车共享生态”的战略性投资业务，以“科技重塑绿色共享出行”为…

1天前

大数据

Flink实现kafka到kafka、kafka到doris的精准一次消费

1 流程图 2 Flink来源表建模 –来源-城市topic CREATE TABLE NJ_QL_JC_SSJC_SOURCE ( record string ) WITH (…

1天前

大数据

Flink进阶篇-CDC 原理、实践和优化&采集到Doris中

简介基于doris官方用doris构建实时仓库的思路，从flinkcdc到doris实时数仓的实践。原文 Apache Flink X Apache Doris 构建极速易用…

1天前

深入解析java.lang.IllegalStateException异常

异常概述什么是异常异常是程序在执行过程中遇到的错误或异常情况。在Java中，异常是指在程序运行期间发生的错误，它可以打破程序的正常流程，并且可能导致程序终止。异常的分类异常…

Jave 1天前

数据库

Elasticsearch之聚合查询介绍与使用（附RestAPI代码案例）

前言：大家好，我是小威，24届毕业生，在一家满意的公司实习。本篇文章将介绍Elasticsearch搜索引擎之聚合查询的介绍与使用，这块内容不作为面试中的重点。如果文章有什么需要…

1天前

Hadoop的任务调度与资源管理

1.背景介绍 Hadoop是一个分布式文件系统和分布式计算框架，由Google的MapReduce和Google File System(GFS)技术启发。Hadoop的核心组件有…

大数据 1天前

大数据

Flink进阶篇-CDC 原理、实践和优化&采集到Doris中

简介基于doris官方用doris构建实时仓库的思路，从flinkcdc到doris实时数仓的实践。原文 Apache Flink X Apache Doris 构建极速易用…

1天前

ES-聚合查询

1. 概念聚合（aggs）不同于普通查询，是目前学到的第二种大的查询分类，第一种即“query”，因此在代码中的第一层嵌套由“query”变为了“aggs”。用于进行聚合的字段必…

大数据 1天前

Hive 的 UDF 函数（Python 版本）

Hive 的 UDF 函数（Python 版本）一、UDF 是什么 Hive 中支持很多的函数，可以极大的方便我们的工作。但是系统内置的函数虽然很多，却不能满足我们所有的需求。在…

大数据 1天前

Hadoop分布式集群安装

上一篇大数据文章讲解了在单机上搭建Hadoop-Yarn 伪分布式集群的安装方法，方便大家学习，真实环境不可能只有一台机器，肯定是多节点的集群，大单位还会建设很多H…

大数据 1天前