大数据
-
【Flink精讲】Flink数据延迟处理
面试题:Flink数据延迟怎么处理? 将迟到数据直接丢弃【默认方案】 将迟到数据收集起来另外处理(旁路输出) 重新激活已经关闭的窗口并重新计算以修正结果(Lateness) Fli…
-
Spark基础知识
一.SPark基本介绍 1.Spark是什么? 1.1 定义 Apache Spark是用于大数据处理的统一分析引擎; 1.2 Spark与MapReduce对比 MapReduc…
-
推荐系统的趋势:深度学习与大数据
1.背景介绍 推荐系统是现代互联网公司的核心业务之一,它通过分析用户行为、内容特征等信息,为用户推荐个性化的内容或产品。随着数据规模的增加和计算能力的提升,推荐系统逐渐向深度学习和…
-
Flink TaskManager内存管理机制介绍与调优总结
内存模型 因为 TaskManager 是负责执行用户代码的角色,一般配置 TaskManager 内存的情况会比较多,所以本文当作重点讲解。根据实际需求为 TaskManager…
-
基于spark对美国新冠肺炎疫情数据分析
基于spark对美国新冠肺炎疫情数据分析 GCC的同学不要抄袭呀!!!严禁抄袭 有任何学习问题可以加我微信交流哦!bmt1014 前言 2020年美国新冠肺炎疫情是全球范围内的一场…
-
字节跳动 Spark 支持万卡模型推理实践
摘要:本文整理自字节跳动基础架构工程师刘畅和字节跳动机器学习系统工程师张永强在本次 CommunityOverCode Asia 2023 中的《字节跳动 Spark 支持万卡模型…
-
第二章:AI大模型基础知识 2.3 自然语言处理基础
1. 背景介绍 1.1 自然语言处理的发展历程 自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个重要分支,它致力于让计算机能够…
-
凯撒密码(Python)
一、凯撒密码是什么? 凯撒密码是一种非常古老的加密方法,最初由古罗马的凯撒大帝使用。凯撒大帝将纸条卷起后,按照字母表顺序向后移动一定的位数,然后再写下加密后的字母,这样其他人就无法…
-
elasticsearch 基于ik分词器的分词查询和模糊匹配
前言:elasticsearch 查询有很多关键字,查询的条件有固定格式,返回结果提示不明确,让ES使用起来有点不方便的感觉,ES查询方式很多,简单介绍几种使用点的,实用的 此处简…
-
Elasticsearch 查询和聚合查询:基本语法和统计数量
摘要:Elasticsearch是一个强大的分布式搜索和分析引擎,提供了丰富的查询和聚合功能。本文将介绍Elasticsearch的基本查询语法,包括预发查询和聚合查询,以及如何使…
-
数据仓库的数据模型与设计:关系图形化构建
1.背景介绍 数据仓库是一种用于存储和管理大量历史数据的系统,它的主要目的是为数据分析和报告提供支持。数据仓库通常包含大量的表格数据,这些数据需要进行复杂的查询和分析。为了实现高效…
-
flink mysql cdc调试问题记录
最近需要用到flink cdc作为数据流处理框架,在demo运行中发现一些问题,特此记录问题和解决过程。 无法读取table Caused by: java.lang.Illega…
-
阿里云-数据仓库-全链路大数据开发治理平台-DataWorks的数字世界
一、前言 上文我讲到 阿里云-数据仓库-数据分析开发神器-ODPS ,今天我带领大家一起走进神器的成长环境及它的数据世界。 二、 DataWorks是什么 DataWorks基于M…
-
一文了解数据库vs数据仓库vs数据湖
大家好,我是K&D,一名10年以上大数据架构&研发经验从业者,目前主要从事云原生大数据方向设计,擅长云原生技术、数据架构、数据平台构建、大数据组件性能调优 以下是本…
-
springboot+mybatis+echarts +mysql制作数据可视化大屏
作者水平低,如有错误,恳请指正!谢谢!!!!! 目录 一、数据源 二、所需工具 三、项目框架搭建 3.1新建springboot项目 3.1.1进入官网 3.1.2创建项目 四、后…
