大数据
-
Flink状态容错savepoint与checkpoint
本文目录 Checkpoints State Backends Savepoints Checkpoints 与 Savepoints区别 Flink可以保证exactly onc…
-
kylin集群负载均衡(kylin3,hbaseRIF问题)
hbase历险记 目录 hbase历险记 寻找问题 分析原因 解决方案 方案1(资源问题、失败) 方案2(成功) 寻找问题 不知道你是不是有这样的疑惑。我kylin…
-
CDH大数据平台 22Cloudera Manager Console之azkaban与freeIPA、Kerberos等组合配置(markdown新版三)
?个人主页:@与自己作战 ?作者简介:CSDN@博客专家、CSDN@大数据领域优质创作者、CSDN@内容合伙人、阿里云@专家博主 ?希望大佬们多多支持,携手共进 ? 如果文章对你有…
-
Hadoop详解
Hadoop 概念 就是一个大数据解决方案。它提供了一套分布式系统基础架构。 核心内容包含 hdfs 和mapreduce。hadoop2.0 以后引入 yarn. hdfs 是提…
-
Spark之Dynamic Resource Allocation
文章目录 Dynamic Resource Allocation 请求策略 移除策略 移除存在的问题 相关参数 Dynamic Resource Allocation Spark提…
-
基于Hologres+Flink的曹操出行实时数仓建设作者:林震|曹操出行实时计算负责人
作者:林震|曹操出行实时计算负责人 曹操出行业务背景介绍 曹操出行创立于2015年5月21日,是吉利控股集团布局“新能源汽车共享生态”的战略性投资业务,以“科技重塑绿色共享出行”为…
-
Flink实现kafka到kafka、kafka到doris的精准一次消费
1 流程图 2 Flink来源表建模 –来源-城市topic CREATE TABLE NJ_QL_JC_SSJC_SOURCE ( record string ) WITH (…
-
Flink进阶篇-CDC 原理、实践和优化&采集到Doris中
简介 基于doris官方用doris构建实时仓库的思路,从flinkcdc到doris实时数仓的实践。 原文 Apache Flink X Apache Doris 构建极速易用…
-
深入解析java.lang.IllegalStateException异常
异常概述 什么是异常 异常是程序在执行过程中遇到的错误或异常情况。在Java中,异常是指在程序运行期间发生的错误,它可以打破程序的正常流程,并且可能导致程序终止。 异常的分类 异常…
-
Elasticsearch之聚合查询介绍与使用(附RestAPI代码案例)
前言:大家好,我是小威,24届毕业生,在一家满意的公司实习。本篇文章将介绍Elasticsearch搜索引擎之聚合查询的介绍与使用,这块内容不作为面试中的重点。 如果文章有什么需要…
-
Hadoop的任务调度与资源管理
1.背景介绍 Hadoop是一个分布式文件系统和分布式计算框架,由Google的MapReduce和Google File System(GFS)技术启发。Hadoop的核心组件有…
-
Flink进阶篇-CDC 原理、实践和优化&采集到Doris中
简介 基于doris官方用doris构建实时仓库的思路,从flinkcdc到doris实时数仓的实践。 原文 Apache Flink X Apache Doris 构建极速易用…
-
ES-聚合查询
1. 概念 聚合(aggs)不同于普通查询,是目前学到的第二种大的查询分类,第一种即“query”,因此在代码中的第一层嵌套由“query”变为了“aggs”。用于进行聚合的字段必…
-
Hive 的 UDF 函数(Python 版本)
Hive 的 UDF 函数(Python 版本) 一、UDF 是什么 Hive 中支持很多的函数,可以极大的方便我们的工作。但是系统内置的函数虽然很多,却不能满足我们所有的需求。在…
-
Hadoop分布式集群安装
上一篇大数据文章讲解了在单机上搭建Hadoop-Yarn 伪分布式集群的安装方法,方便大家学习,真实环境不可能只有一台机器,肯定是多节点的集群,大单位还会建设很多H…
