big data

MySQL | 常见运算符介绍

目录一、算术运算符二、比较运算符 2.1 等于运算符（=） 2.2 安全等于运算符（） 2.3 不等于运算符（或者!=） 2.4 小于等于运算符（<=） 2….

数据库 1天前

Pyspark读写csv,txt,json,xlsx,xml,avro等文件

1. Spark读写txt文件读： df = spark.read.text(“/home/test/testTxt.txt”).show() +————-+ |…

大数据 1天前

大数据

PySpark中DataFrame的join操作

内容导航类别内容导航机器学习机器学习算法应用场景与评价指标机器学习算法—分类机器学习算法—回归机器学习算法—聚类机器学习算法—异常检测机器学习算法—时间序列数据…

1天前

大数据

100天精通Python（数据分析篇）——第48天：数据分析入门知识

文章目录 1. 为什么要学数据分析？ 2. 数据分析的概念 3. 数据分析涉及哪些能力 4. 数据分析的流程 5. Python做数据分析学什么？ 1. 为什么要学数据分析？近两…

1天前

大数据

5、kafka监控工具Kafka-Eagle介绍及使用

Apache Kafka系列文章 1、kafka（2.12-3.0.0）介绍、部署及验证、基准测试 2、java调用kafka api 3、kafka重要概念介紹及示例 4、kaf…

1天前

大数据

【学习记录】SPSS问卷调查表分析法

用excel将收集的问卷数据存储，并用SPSS进行数据分析文章目录一、对收集的excel数据进行数据转换二、将调整合适的excel数据导入SPSS，并进行变量调整 1.导入e…

1天前

大数据

超详细的hive和mysql的安装与配置以及hive服务启动脚本

目录一、说明二、Hive安装与配置 1.上传文件并解压 2.修改目录名称 3.配置hive环境变量 4.删除冲突jar包 5.启动hadoop集群 6.初始化元数据库并启动三…

1天前

大数据

大数据的关键技术之——大数据采集

大数据的关键技术之——大数据采集本文目录：一、写在前面的话二、大数据采集概念三、大数据采集步骤 3.1、大数据采集步骤（总体角度） 3.2、大数据采集步骤（数据集角度） 3…

1天前

大数据

CentOS7安装教程—-图文详解

创建虚拟机创建新的虚拟机—>选择自定义（高级）（C）—>下一步默认下一步选择稍后安装操作系统（s） —> 下一步选择l…

1天前

MySQL | 视图

目录一、创建视图 1.1 在单表上创建视图 1.2 在多表上创建视图二、查看视图 2.1 使用DESCRIBE语句查看视图基本信息 2.2 使用SHOW TABLE STATU…

大数据 1天前

DataX VS Kettle，深度对比分析

1.前言开源的 ETL工具里面 DataX和 Kettle的人气一直高居不下，datax虽然比较年轻，但这两年发展势头很猛，不时就能听到身边的同事谈起。kettle作为老牌的 e…

大数据 1天前

前端

切OSM数据矢量瓦片并前端可视化最完整流程

本文提供了完整OSM数据切瓦片，并实现前端可视化的流程。参考了一些大佬的开源项目，在此感谢这些大佬，并在最后提供相关参考资料。话不多说，整起。 1. OSM矢量数据下载 OSM数据…

1天前

Docker 部署 Flink 集群环境

Flink 部署笔记： Ubuntu 环境下部署 Flink 集群环境 Docker 部署 Flink 集群环境 kubernetes(K8S) 部署 Flink 集群环境下面的…

大数据 1天前

大数据

一文让你学明白Hadoop《大数据技术之Hadoop》详细知识总结

思维导图：一：Hadoop的简介简介： Hadoop是由Apache基金会所开发的一个开源的分布式存储和处理大数据的框架，可以在计算机集群中进行大规模数据集的的存储和处理，并提…

1天前

大数据

十分钟带汝入门大数据开发语言Scala

大家好，我是百思不得小赵。创作时间：2022 年 6 月 7 日博客主页： 🔍点此进入博客主页 —— 新时代的农民工 🙊 —— 换一种思维逻辑去…

1天前