大数据
-
Log4j2 配置日志记录发送到 kafka 中
前言 log4j2 在 2.11.0 之后的版本,已经内置了 KafkaAppender 支持可以将打印的日志直接发送到 kafka 中,在这之前如果想要集中收集应用的日志,就需要…
-
【大数据】Flink 架构(一):系统架构
《Flink 架构》系列(已完结),共包含以下 6 篇文章: Flink 架构(一):系统架构 Flink 架构(二):数据传输 Flink 架构(三):事件时间处理 Flink …
-
信息论与大数据:挖掘大数据中的价值
1.背景介绍 大数据是当今信息时代的一个重要话题,它指的是由于互联网、通信技术、计算机技术等的发展,使得数据量大、高速增长、不断变化的数据集。大数据的特点是五个V:量、速度、变化、…
-
数据资产入表,这泼天的富贵大数据团队怎样才能接住?
“ 大数据团队是成本中心还是价值中心? 数据资产入表,国家是怎么说的? 数据平台应具备哪些能力,才能助力企业最大化数据资产价值?” 2022年12月,国务院发文关于发挥数据要素作…
-
大数据前馈神经网络解密:深入理解人工智能的基石
文章目录 大数据前馈神经网络解密:深入理解人工智能的基石 一、前馈神经网络概述 什么是前馈神经网络 前馈神经网络的工作原理 应用场景及优缺点 二、前馈神经网络的基本结构 输入层、隐…
-
【spark】
一、Spark是什么 Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。 Spark是基于Scala语言开发的。 整个Spark框架模块包含:Spark Core、…
-
Flink、Yarn架构,以Flink on Yarn部署原理详解
Flink、Yarn架构,以Flink on Yarn部署原理详解 Flink 架构概览 Apache Flink是一个开源的分布式流处理框架,它可以处理实时数据流和批处理数据。F…
-
大数据毕设分享 基于python的搜索引擎设计与实现
文章目录 0 简介 1 课题简介 2 系统设计实现 2.1 总体设计 2.2 搜索关键流程 2.3 推荐算法 2.4 数据流的实现 3 实现细节 3.1 系统架构 3.2 爬取大量…
-
Flink项目实战篇 基于Flink的城市交通监控平台(上)
系列文章目录 Flink项目实战篇 基于Flink的城市交通监控平台(上) Flink项目实战篇 基于Flink的城市交通监控平台(下) 文章目录 系列文章目录 1. 项目整体介绍…
-
湖仓一体电商项目(十四):实时任务执行流程
文章目录 实时任务执行流程 一、准备环境 二、启动Flink代码
-
Flink版本更新汇总(1.14-1.18)
0、汇总 ========1.14.0======== 1.有界流支持 Checkpoint; 2.批执行模式支持 DataStream 和 Table/SQL 混合应用; 3.新…
-
spark on yarn 运行任务提示java.io.IOException: Cannot run program “python3“: error=2, No such file or dire
报错场景: 机器 linux-centos7.6,自带的python 2.7 因为spark对环境的要求所以安装了Anaconda,生成的pyspark环境。但是在执行任务时提示如…
-
【地图匹配(ST-matching)】GPS 轨迹数据预处理——T-Driver数据集【持续更新中】
一、数据介绍 1.数据链接 https://download.csdn.net/download/skyman30/87432266?spm=1001.2014.3001.5503…
-
Hive连接异常:无法通过JDBC连接打开客户端传输(JDBC Uri: jdbc:hive2:// 大数据)
Hive连接异常:无法通过JDBC连接打开客户端传输(JDBC Uri: jdbc:hive2:// 大数据) 在大数据领域中,Hive是一个常用的数据仓库解决方案,可以用于处理和…
-
ERROR Fatal error during KafkaServer startup. Prepare to shutdown (kafka.server.KafkaServer) kafka.c
文章目录 问题描述: 原因分析: 解决方案: 方法一: 方法二: 问题描述: 开启 ZooKeeper 之后,准备启动 Kafka 服务,结果出现 ERROR Fatal erro…
