big data
-
MySQL | 视图
目录 一、创建视图 1.1 在单表上创建视图 1.2 在多表上创建视图 二、查看视图 2.1 使用DESCRIBE语句查看视图基本信息 2.2 使用SHOW TABLE STATU…
-
DataX VS Kettle,深度对比分析
1.前言 开源的 ETL工具里面 DataX和 Kettle的人气一直高居不下,datax虽然比较年轻,但这两年发展势头很猛,不时就能听到身边的同事谈起。kettle作为老牌的 e…
-
切OSM数据矢量瓦片并前端可视化最完整流程
本文提供了完整OSM数据切瓦片,并实现前端可视化的流程。参考了一些大佬的开源项目,在此感谢这些大佬,并在最后提供相关参考资料。话不多说,整起。 1. OSM矢量数据下载 OSM数据…
-
Docker 部署 Flink 集群环境
Flink 部署笔记: Ubuntu 环境下部署 Flink 集群环境 Docker 部署 Flink 集群环境 kubernetes(K8S) 部署 Flink 集群环境 下面的…
-
一文让你学明白Hadoop《大数据技术之Hadoop》详细知识总结
思维导图: 一:Hadoop的简介 简介: Hadoop是由Apache基金会所开发的一个开源的分布式存储和处理大数据的框架,可以在计算机集群中进行大规模数据集的的存储和处理,并提…
-
十分钟带汝入门大数据开发语言Scala
大家好,我是百思不得小赵。 创作时间:2022 年 6 月 7 日 博客主页: 🔍点此进入博客主页 —— 新时代的农民工 🙊 —— 换一种思维逻辑去…
-
Elasticsearch:使用最新的 Elasticsearch Java client 8.0 来创建索引并搜索
这篇文章,我来详细地描述如何使用最新的 Elasticsearch Java client 8.0 来创建索引并进行搜索。最新的 Elasticsearch Java client…
-
Hadoop/HDFS/MapReduce/Spark/HBase重要知识点整理
本复习提纲主要参考北京大学计算机学院研究生课程《网络大数据管理与应用》课程资料以及厦门大学计算机科学系研究生课程 《大数据技术基础》相关材料整理而成,供广大网友学习参考,如有版权问…
-
Spark期末考试练习题
一、单选题 1. 下面的端口不是 Spark 自带的服务端口的是___________。 A. 8080 B. 4040 C. 8090 D. 18080 2. 下面的描述不是 R…
-
数据处理方法整理【目前最全】
数据处理方法 主要采用编写数据处理代码来对数据进行处理步骤,主要采用Python语言,使用相关的Pandas、Numpy、Scikit-learn等库来进行操作,一些代码实例如下。…
-
ambari2.8.0+bigtop3.2.0发行版大数据平台编译指南
前言 ambari和bigtop联合的第一个发行版终于出来了!!!这是在HDP、CDH大数据平台闭源后的第一个开源免费发行版的大数据平台。下面为大家详细介绍Centos7下的编译方…
-
Flink window 源码分析4:WindowState
本文源码为flink 1.18.0版本。 其他相关文章: Flink window 源码分析1:窗口整体执行流程 Flink window 源码分析2:Window 的主要组件 F…
-
从零开始了解大数据(七):总结
系列文章目录 从零开始了解大数据(一):数据分析入门篇-CSDN博客 从零开始了解大数据(二):Hadoop篇-CSDN博客 从零开始了解大数据(三):HDFS分布式文件系统篇-C…
-
[Hive]一篇带你读懂Hive是什么
✅作者简介:大家好,我是Philosophy7?让我们一起共同进步吧!🏆 📃个人主页:Philosophy7的csdn博客 🔥系列专…
-
大数据学习之Hadoop
分布式存储HadoopHDFS 一、分布式与集群 1.分布式:将多台服务器集中在一起,每台服务器都能实现整个中的不同的业务,可以做不同的事。 举例:做一顿年夜饭,一个人…
