大数据
-
大数据- Hadoop入门
目录 🐶2.1 hadoop的简介 1. 概述 2. 什么是分布式? 3. Hadoop的指代 🐶2.2 hadoop的发展历程 🐶…
-
云计算与大数据期末考试题库
单选题 1. 以下哪一项不属于Hadoop可以运行的模式___C___。 A. 单机(本地)模式 B. 伪分布式模式 C. 互联模式 D. 分布式模式 2、Hadoop作者 Ma…
-
ES搜索框架–设置IK分词器
ES的默认中文分词效果太差了,稍微长一点的词句就完全匹配不到,于是选择使用安装IK中文分词器来实现索引的分词。 参考: https://blog.csdn.net/w1014074…
-
城市房价数据可视化分析 计算机毕设 数据分析大数据毕设
流程图: 1.读数据表 首先,读取数据集。 CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO B LSTAT target 0.0…
-
初识大数据,一文掌握大数据必备知识文集(10)
🏆作者简介,普修罗双战士,一直追求不断学习和成长,在技术的道路上持续探索和实践。 🏆多年互联网行业从业经验,历任核心研发工程师,项目技术负责人。 &…
-
Spark内容分享(十二):Spark 和 MapReduce 的区别及优缺点
总结 Spark 和 MapReduce 的区别及优缺点 1、Spark处理数据是基于内存的,而MapReduce是基于磁盘处理数据的 MapReduce是将中间结果保存到磁盘中,…
-
Elasticsearch启动报错:fatal exception while booting Elasticsearchjava.lang.RuntimeException: can not run
出错原因: Elasticsearch不允许使用root用户启动 解决办法: 1、为elaticsearch创建用户并赋予相应权限(推荐) //创建用户组 groupadd esg…
-
Flink窗口API、窗口分配器和窗口函数
目录 1.Flink窗口API 1.1分为 按键分区(Keyed)和非按键分区(Non-Keyed) 1.1.1按键分区窗口(Keyed Windows) 1.1.2非按键分区(N…
-
【flink番外篇】15、Flink维表实战之6种实现方式-通过广播将维表数据传递到下游
Flink 系列文章 一、Flink 专栏 Flink 专栏系统介绍某一知识点,并辅以具体的示例进行说明。 1、Flink 部署系列 本部分介绍Flink的部署、配置相关基础内容。…
-
我们是如何测试人工智能的(一)基础效果篇
前言 这个系列算是科普文吧,尤其这第一篇可能会比较长,因为我这8年里一直在AI领域里做测试,涉及到的场景有些多, 我希望能尽量把我经历过的东西都介绍一下,算是给大家科普一下我们这些…
-
Flink的实时数据集成与ETL
1.背景介绍 1. 背景介绍 Apache Flink 是一个流处理框架,用于实时数据处理和分析。它支持大规模数据流处理,具有高吞吐量和低延迟。Flink 的 ETL(Extrac…
-
Elasticsearch 未授权访问漏洞
Elasticsearch 未授权访问漏洞(Es未授权访问) 漏洞描述 ElasticSearch 是一款 Java 编写的企业级搜索服务,启动此服务默认开放 HTTP-9200 …
-
[机器学习、Spark]Spark MLlib实现数据基本统计
👨🎓👨🎓博主:发量不足 📑📑本期更新内容:Spark MLlib基本统计 &#x…
-
ElasticSearch与Apache Flink的集成
1.背景介绍 Elasticsearch和Apache Flink都是现代大数据处理技术的重要组成部分。Elasticsearch是一个分布式搜索和分析引擎,用于实时搜索、分析和可…
-
虚拟化,容器化,云原生,大数据概念
虚拟化: 虚拟化,是指通过虚拟化技术将一台计算机虚拟为多台逻辑计算机。在一台计算机上同时运行多个逻辑计算机,每个逻辑计算机可运行不同的操作系统,并且应用程序都可以在相互独立的空间内…
