大数据
-
学完了Hadoop,我总结了这些重点
文章目录 一、Hadoop 组成 Hadoop1.x 、2.x 、3.x 的区别 HDFS架构概述 MapReduce架构概述 YARN架构概述 二、常用端口号 三、常用的配置文件…
-
云计算、大数据、人工智能、物联网、虚拟现实技术、区块链技术(新一代信息技术)学习这一篇够了!
目录 云计算 一、云计算的基本概念 二、云计算的分类 (一) IaaS (二) SaaS (三) PaaS 三、云环境的分类、云计算的四种部署模式 (一)公有云 (二)私有云 (三…
-
【推荐算法】协同过滤算法介绍
一、协同过滤算法的基本原理 协同过滤算法(Collaborative Filtering) 是比较经典常用的推荐算法,它是一种完全依赖用户和物品之间行为关系的推荐算法。我们从它的名…
-
架构必备能力——kafka的选型对比及应用场景
系列文章目录 上手第一关,手把手教你安装kafka与可视化工具kafka-eagle Kafka是什么,以及如何使用SpringBoot对接Kafka 架构必备能力——kafka的…
-
Flink DataStream API CDC同步MySQL数据到StarRocks
一、版本信息 Flink:1.16.1 二代码实现 pom文件如下 4.0.0 com.wys flink 1.0.0 jar 8 8 UTF-8 1.16.1 2.3.0 1.7…
-
如何构建大数据指标分析系统
目录 一、指标分析的基础分析 二、指标分析技术方案 三、结论 前言:技术是为了需求服务。技术的第一性原则是解决问题,不同的技术方案都能实现同样的需求,那在公司原有技术架构上,如何设…
-
大数据开发之Hadoop(完整版+练习)
第 1 章:Hadoop概述 1.1 Hadoop是什么 1、Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 2、主要解决,海量数据的存储和海量数据的分析计算问…
-
Spark RDD的转换
按颜色区分转换: 绿色是单 RDD 窄依赖转换 黑色是多 RDD 窄依赖转换 紫色是 KV 洗牌型转换 黄色是重分区转换 蓝色是特例的转换 单 RDD 窄依赖转换 MapParti…
-
HDFS的基本操作(创建目录或文件、查看目录或文件、上传和拷贝文件到HDFS上、追加数据到HDFS上、从HDFS上下载文件到Linux本地、合并HDFS文件)
文章目录 前言 一、HDFS的相关命令 1、在HDFS创建目录 2、查看当前目录 3、查看目录与子目录 4、查看文件的内容 5、创建文件 6、上传和拷贝文件 7、追加数据到HDFS…
-
基于Java的机票预订的设计与实现(附源码地址)
摘 要 伴随着居民生活水平的提高,人们更加追求物质和精神上的生活,出门旅行便成为一种寻常的休闲活动,随着人们旅行范围遍布全球,航空出游变成为了主流旅行方式。由于目前航班信息种类繁多…
-
大数据Vue项目必备|Window下安装并使用nvm(含卸载node、卸载nvm、全局安装npm)
大数据Vue项目必备|Window下安装并使用nvm(含卸载node、卸载nvm、全局安装npm) 一、卸载旧版本 如果已经安装了node,那么需要先卸载node,如果没有安装那可…
-
Flink 有状态流式处理
传统批次处理方法 【1】持续收取数据(kafka等),以window时间作为划分,划分一个一个的批次档案(按照时间或者大小等); 【2】周期性执行批次运算(Spark/Stom等)…
-
Spark二、Spark技术栈之Spark Core
Spark Core spark核心:包括RDD、RDD算子、RDD的持久化/缓存、累加器和广播变量 学习链接:https://mp.weixin.qq.com/s/caCk3mM…
-
CDH大数据平台 28Cloudera Manager Console之superset相关包安装(markdown新版二)
?个人主页:@与自己作战 ?作者简介:CSDN@博客专家、CSDN@大数据领域优质创作者、CSDN@内容合伙人、阿里云@专家博主 ?希望大佬们多多支持,携手共进 ? 如果文章对你有…
-
基于Hadoop的MapReduce网站日志大数据分析(含预处理MapReduce程序、hdfs、flume、sqoop、hive、mysql、hbase组件、echarts)
需要本项目的可以私信博主!!! 本项目包含:PPT,可视化代码,项目源码,配套Hadoop环境(解压可视化),shell脚本,MapReduce代码,文档以及相关说明教程,大数据集…
