big data
-
MySQL | 常见运算符介绍
目录 一、算术运算符 二、比较运算符 2.1 等于运算符(=) 2.2 安全等于运算符() 2.3 不等于运算符(或者!=) 2.4 小于等于运算符(<=) 2….
-
Pyspark读写csv,txt,json,xlsx,xml,avro等文件
1. Spark读写txt文件 读: df = spark.read.text(“/home/test/testTxt.txt”).show() +————-+ |…
-
PySpark中DataFrame的join操作
内容导航 类别 内容导航 机器学习 机器学习算法应用场景与评价指标 机器学习算法—分类 机器学习算法—回归 机器学习算法—聚类 机器学习算法—异常检测 机器学习算法—时间序列 数据…
-
100天精通Python(数据分析篇)——第48天:数据分析入门知识
文章目录 1. 为什么要学数据分析? 2. 数据分析的概念 3. 数据分析涉及哪些能力 4. 数据分析的流程 5. Python做数据分析学什么? 1. 为什么要学数据分析? 近两…
-
5、kafka监控工具Kafka-Eagle介绍及使用
Apache Kafka系列文章 1、kafka(2.12-3.0.0)介绍、部署及验证、基准测试 2、java调用kafka api 3、kafka重要概念介紹及示例 4、kaf…
-
【学习记录】SPSS问卷调查表分析法
用excel将收集的问卷数据存储,并用SPSS进行数据分析 文章目录 一、对收集的excel数据进行数据转换 二、将调整合适的excel数据导入SPSS,并进行变量调整 1.导入e…
-
超详细的hive和mysql的安装与配置以及hive服务启动脚本
目录 一、说明 二、Hive安装与配置 1.上传文件并解压 2.修改目录名称 3.配置hive环境变量 4.删除冲突jar包 5.启动hadoop集群 6.初始化元数据库并启动 三…
-
大数据的关键技术之——大数据采集
大数据的关键技术之——大数据采集 本文目录: 一、写在前面的话 二、大数据采集概念 三、大数据采集步骤 3.1、大数据采集步骤(总体角度) 3.2、大数据采集步骤(数据集角度) 3…
-
CentOS7安装教程—-图文详解
创建虚拟机 创建新的虚拟机—>选择自定义(高级)(C)—>下一步 默认下一步 选择稍后安装操作系统(s) —> 下一步 选择l…
-
MySQL | 视图
目录 一、创建视图 1.1 在单表上创建视图 1.2 在多表上创建视图 二、查看视图 2.1 使用DESCRIBE语句查看视图基本信息 2.2 使用SHOW TABLE STATU…
-
DataX VS Kettle,深度对比分析
1.前言 开源的 ETL工具里面 DataX和 Kettle的人气一直高居不下,datax虽然比较年轻,但这两年发展势头很猛,不时就能听到身边的同事谈起。kettle作为老牌的 e…
-
切OSM数据矢量瓦片并前端可视化最完整流程
本文提供了完整OSM数据切瓦片,并实现前端可视化的流程。参考了一些大佬的开源项目,在此感谢这些大佬,并在最后提供相关参考资料。话不多说,整起。 1. OSM矢量数据下载 OSM数据…
-
Docker 部署 Flink 集群环境
Flink 部署笔记: Ubuntu 环境下部署 Flink 集群环境 Docker 部署 Flink 集群环境 kubernetes(K8S) 部署 Flink 集群环境 下面的…
-
一文让你学明白Hadoop《大数据技术之Hadoop》详细知识总结
思维导图: 一:Hadoop的简介 简介: Hadoop是由Apache基金会所开发的一个开源的分布式存储和处理大数据的框架,可以在计算机集群中进行大规模数据集的的存储和处理,并提…
-
十分钟带汝入门大数据开发语言Scala
大家好,我是百思不得小赵。 创作时间:2022 年 6 月 7 日 博客主页: 🔍点此进入博客主页 —— 新时代的农民工 🙊 —— 换一种思维逻辑去…
