大数据 | 第12页 | 协通编程

大数据

大数据- Hadoop入门

目录 🐶2.1 hadoop的简介 1. 概述 2. 什么是分布式？ 3. Hadoop的指代 🐶2.2 hadoop的发展历程 🐶…

1天前

云计算与大数据期末考试题库

单选题 1. 以下哪一项不属于Hadoop可以运行的模式___C___。 A. 单机（本地）模式 B. 伪分布式模式 C. 互联模式 D. 分布式模式 2、Hadoop作者 Ma…

大数据 1天前

大数据

ES搜索框架–设置IK分词器

ES的默认中文分词效果太差了，稍微长一点的词句就完全匹配不到，于是选择使用安装IK中文分词器来实现索引的分词。参考： https://blog.csdn.net/w1014074…

1天前

大数据

城市房价数据可视化分析计算机毕设数据分析大数据毕设

流程图： 1.读数据表首先，读取数据集。 CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO B LSTAT target 0.0…

1天前

大数据

初识大数据，一文掌握大数据必备知识文集(10)

🏆作者简介，普修罗双战士，一直追求不断学习和成长，在技术的道路上持续探索和实践。 🏆多年互联网行业从业经验，历任核心研发工程师，项目技术负责人。 &…

1天前

Spark内容分享(十二)：Spark 和 MapReduce 的区别及优缺点

总结 Spark 和 MapReduce 的区别及优缺点 1、Spark处理数据是基于内存的，而MapReduce是基于磁盘处理数据的 MapReduce是将中间结果保存到磁盘中，…

大数据 1天前

Elasticsearch启动报错：fatal exception while booting Elasticsearchjava.lang.RuntimeException: can not run

出错原因： Elasticsearch不允许使用root用户启动解决办法： 1、为elaticsearch创建用户并赋予相应权限（推荐） //创建用户组 groupadd esg…

大数据 1天前

大数据

Flink窗口API、窗口分配器和窗口函数

目录 1.Flink窗口API 1.1分为按键分区（Keyed）和非按键分区（Non-Keyed） 1.1.1按键分区窗口（Keyed Windows） 1.1.2非按键分区（N…

1天前

【flink番外篇】15、Flink维表实战之6种实现方式-通过广播将维表数据传递到下游

Flink 系列文章一、Flink 专栏 Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。 1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。…

大数据 1天前

人工智能

我们是如何测试人工智能的（一）基础效果篇

前言这个系列算是科普文吧，尤其这第一篇可能会比较长，因为我这8年里一直在AI领域里做测试，涉及到的场景有些多，我希望能尽量把我经历过的东西都介绍一下，算是给大家科普一下我们这些…

1天前

Flink的实时数据集成与ETL

1.背景介绍 1. 背景介绍 Apache Flink 是一个流处理框架，用于实时数据处理和分析。它支持大规模数据流处理，具有高吞吐量和低延迟。Flink 的 ETL(Extrac…

大数据 1天前

大数据

Elasticsearch 未授权访问漏洞

Elasticsearch 未授权访问漏洞(Es未授权访问) 漏洞描述 ElasticSearch 是一款 Java 编写的企业级搜索服务，启动此服务默认开放 HTTP-9200 …

1天前

大数据

[机器学习、Spark]Spark MLlib实现数据基本统计

👨‍🎓👨‍🎓博主：发量不足 📑📑本期更新内容：Spark MLlib基本统计 &#x…

1天前

ElasticSearch与Apache Flink的集成

1.背景介绍 Elasticsearch和Apache Flink都是现代大数据处理技术的重要组成部分。Elasticsearch是一个分布式搜索和分析引擎，用于实时搜索、分析和可…

大数据 1天前

大数据

虚拟化，容器化，云原生，大数据概念

虚拟化：虚拟化，是指通过虚拟化技术将一台计算机虚拟为多台逻辑计算机。在一台计算机上同时运行多个逻辑计算机，每个逻辑计算机可运行不同的操作系统，并且应用程序都可以在相互独立的空间内…

1天前