大数据
-
Ubuntu搭建Hadoop3.X分布式和高可用集群,一步步深入
目录 1. 介绍 2. 基础环境 2.1 关闭防火墙 2.2 修改主机名和主机映射 2.3 免密登录 2.4 安装jdk 3. 搭建hadoop3.x完全分布式 3.1 下载包地址…
-
基本操作:如何在HBase中进行基本的CRUD操作
1.背景介绍 在HBase中进行基本的CRUD操作是一项重要的技能。在本文中,我们将深入了解HBase的核心概念和算法原理,并通过具体的代码实例来展示如何进行基本的CRUD操作。 …
-
从大数据到人工智能:技术的演进与融合
我熟悉云计算、机器学习、深度学习、神经网络、量子计算机等概念。这些领域虽然在技术上有所重叠,但它们各自保持着独特的特点。例如,大数据和人工智能在许多应用场景中是相互交织的,同时大数…
-
Flink与ApacheAirflow集成
1.背景介绍 在大数据处理领域,流处理和批处理是两个非常重要的领域。Apache Flink 是一个流处理框架,Apache Airflow 是一个工作流管理器。在实际应用中,我们…
-
Hive窗口函数整理
Hive 中的窗口函数允许你在结果集的一个特定“窗口”内对行进行计算。这些窗口可以是物理的(基于行在数据中的实际位置)或逻辑的(基于行的一些排序标准)。窗口函数在处理排名、计算累计…
-
Hadoop-5-HDFS常用命令
hdfs常用命令: 第一部分:hdfs文件系统命令 第一类:文件路径增删改查系列: hdfs dfs -mkdir dir 创建文件夹 hdfs dfs -rmr dir 删除文件…
-
Flink应用实时数据质量检查
1.背景介绍 随着大数据时代的到来,实时数据处理和分析变得越来越重要。Apache Flink是一个流处理框架,用于处理大规模实时数据。在大数据处理中,数据质量是关键因素,影响了数…
-
大数据毕设分享 基于Python大数据的电影可视化分析系统(源码+论文)
# 0 简介 今天学长向大家介绍一个机器视觉的毕设项目 毕设分享 基于Python大数据的电影可视化分析系统(源码+论文) 项目获取: https://gitee.com/sino…
-
ES 8.x新特性一览(完整版)
一、看点 在 2022 年 2 月 11 日,Elasticsearch(ES)正式发布了 8.0 版本,而截止到 2023 年 10 月,历经一年半时间,ES官方已经连续发布了多…
-
Flink的高可用性与容量扩展
1.背景介绍 Flink是一个流处理框架,用于实时数据处理和分析。它具有高吞吐量、低延迟和强大的状态管理功能。Flink的高可用性和容量扩展是其在大规模生产环境中的关键特性。在本文…
-
使用JavaApi获取Kafka的topic、topic的分区数量与副本数量
目录 1、代码 2、结果 1、代码 package com.zsh.kafkatest.topic; import com.zsh.kafkatest.connect.KafkaC…
-
大数据毕设分享 基于Kmeans的图像分割算法软件设计
文章目录 0 简介 1 Kmeans聚类算法基本原理 2 基于Kmeans图像分割算法流程 4 代码运行结果及评价 5 最后 0 简介 今天学长向大家分享一个毕业设计项目 毕业设计…
-
浅谈大数据智能化技术在多个领域的应用实践
摘要 大数据智能化技术在当今信息社会中得到了广泛的应用。从金融、互联网电商、视频行业到垂直短视频领域,从工业互联网到云计算、边缘计算等领域,大数据智能化技术已经成为…
-
Spark与ApacheSqoop集成
1.背景介绍 在大数据时代,数据处理和分析的需求日益增长。为了更高效地处理和分析大量数据,Apache Spark和Apache Sqoop这两种技术得到了广泛应用。本文将从以下几…
-
微软Power Platform平台低代码
微软Power Platform平台 从我目前的了解的情况来看,资料来源于百度,csdn,掘金,简书,知乎等国内的资料相对于比较少或者说power platform 这个平台的系列…
