大数据
-
【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事
系列文章目录 【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事 【SQL开发实战技巧】系列(二):简单单表查询 【SQL开发实战技巧】系列(三):SQL排序的那些事 【…
-
Spark编程实验二:RDD编程初级实践
目录 一、目的与要求 二、实验内容 三、实验步骤 1、pyspark交互式编程 2、编写独立应用程序实现数据去重 3、编写独立应用程序实现求平均值问题 4、三个综合实例 四、结果分…
-
【云平台技术】Hadoop全分布式安装与配置
目录 一、虚拟机安装 1、创建虚拟机 2、虚拟机启动初始化 二、 虚拟机克隆 三、Linux系统的网络配置 1、准备工作 2、 主机名和IP映射 2.1 配置主机名 2.2 配置…
-
Elasticsearch:Search tutorial – 使用 Python 进行搜索 (一)
本实践教程将教你如何使用 Elasticsearch 构建完整的搜索解决方案。 在本教程中你将学习: 如何对数据集执行全文关键字搜索(可选使用过滤器) 如何使用机器学习模型生成、存…
-
ElasticSearch篇——认识、安装和使用IK分词器插件,一篇文章带你彻底拿下!
一、什么是IK分词器 所谓分词,即把一段中文或者别的划分成一个个的关键字,我们在搜索时会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配的操作,默认的…
-
postgresql 内核源码分析 表锁relation lock的使用,session lock会话锁的应用场景,操作表不再困难
专栏内容: postgresql内核源码分析 手写数据库toadb 并发编程 个人主页:我的主页 座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物. ===========…
-
【大数据实时数据同步】超级详细的生产环境OGG(GoldenGate)12.2实时异构同步Oracle数据部署方案(中)
系列文章目录 【大数据实时数据同步】超级详细的生产环境OGG(GoldenGate)12.2实时异构同步Oracle数据部署方案(上) 【大数据实时数据同步】超级详细的生产环境OG…
-
实战:大数据Flink CDC同步Mysql数据到ElasticSearch
文章目录 前言 知识积累 CDC简介 CDC的种类 常见的CDC方案比较 Springboot接入Flink CDC 环境准备 项目搭建 本地运行 集群运行 将项目打包将包传入集群…
-
2023年Go语言盘点:稳中求新,稳中求变
时光荏苒,转眼间已经是2023年的最后一天了。《2022年Go语言盘点:泛型落地,无趣很好,稳定为王[1]》仿佛就写在昨天。 回首这一年,全球彻底从新冠大流行中得以复苏,Go语言也…
-
图解KafkaConsumer SyncGroupRequest请求流程
作者:石臻臻, CSDN博客之星Top5、Kafka Contributor 、nacos Contributor、华为云 MVP ,腾讯云TVP, 滴滴Kafka技术专家 、 K…
-
Flink实时电商数仓(九)
用户注册汇总表 需求分析 统计各窗口的注册用户数,写入Doris 思路分析 读取kafka用户注册主题数据 转换数据结构 string -> JSONObject->j…
-
Spark大数据分析与实战笔记(第二章 Spark基础-04)
文章目录 每日一句正能量 引言 章节概要 2.4 体验第一个Spark程序 2.4.1 运行Spark官方示例SparkPi 总结 每日一句正能量 “春风十里,不如你。” 这句来自…
-
利用新媒体平台,彩妆化妆工具市场如何挖掘潜在客户
随着新媒体技术的发展,现在越来越多的彩妆/化妆工具品牌正在利用新媒体平台来扩大自己的市场。新媒体平台不仅可以帮助彩妆/化妆工具品牌更好地推广自己的产品,而且还可以帮助彩妆/化妆工具…
-
什么是shuffle?shuffle的原理及过程
目录 一、什么是shuffle 二、为什么要引入shuffle,有哪些影响 三、shuffle的工作原理 1、shuffle的阶段 2、shuffle的中间文件 3、Shuffle…
-
国内外交通数据集介绍(附参数说明)
国外数据集 NGSIM数据集 NGSIM数据集采集自美国,数据集中包含两条高速公路(US-101,I-80)及两条城市道路(lankershim,peachtree…
