大数据 | 第18页 | 协通编程

Doris 入门：高级特性（四）

目录一、表结构变更二、Rollup 三、增大内存四、修改超时时间五、Broadcast/Shuffle Join 六、数据模型七、索引八、物化视图九、动态分区十、数…

大数据 1天前

大数据

TDengine Kafka Connector将 Kafka 中指定 topic 的数据（批量或实时）同步到 TDengine

教程放在这里：TDengine Java Connector，官方文档已经写的很清晰了，不再赘述。这里记录一下踩坑： 1.报错 java.lang.UnsatisfiedLink…

1天前

223页10万字大数据中心总体架构及数据仓库顶层设计解决方案WORD

提供智慧城市、智能制造、数据治理、信息化等领域的系统框架、总体架构、数据流架构资料，包括数据治理、信息化、精益生产改善知识。本文文档69页，因篇幅限制，以下仅展示部分资料，需要完…

大数据 1天前

【2024年更新】大数据专业毕设必过选题推荐

文章目录大数据专业毕设必过选题大数据毕设项目主要流程：一、Hive数据仓库相关选题题目推荐：二、Hadoop/MapReduce相关选题题目推荐：三、Spark相关选…

大数据 1天前

大数据

CDH整合Flink(CDH6.3.0+Flink1.12.1)

CDH整合Flink(CDH6.3.0+Flink1.12.1) 1 准备环境 Linux版本：CENTOS 7.7.1908 在自己的虚拟机上提前准备好，版本建议高点 JAVA版…

1天前

HiveSql中的分区分桶详解

分区(partiton) 静态分区动态分区静态分区如果有一张表,需求是要其中一类的数据例如(星座),但是需要全盘扫描,如何精…

大数据 1天前

网约车大数据综合项目——数据分析Hive

第1关：Hive 储存数据开启Hadoop服务，并使得 Hive 连接 MySQL 初始化 start-all.sh schematool -dbType mysql -init…

大数据 1天前

Flink的实时数据流式图数据处理

1.背景介绍 1. 背景介绍 Apache Flink 是一个流处理框架，用于实时数据流处理和大数据处理。Flink 可以处理大规模数据流，并提供低延迟和高吞吐量。Flink 支持…

大数据 1天前

大数据

Spark与PySpark(1.概述、框架、模块)

目录 1.Spark 概念 2. Hadoop和Spark的对比 3. Spark特点 3.1 运行速度快 3.2 简单易用 3.3 通用性强 3.4 可以允许运行在很多地方 4….

1天前

Jave

记elasticsearch CPU负载100%问题

记elasticsearch CPU负载100%问题环境：问题表现：初步排查：日志查询hot_thread 深入查询当前elasticsearch正在运行的Task 查…

1天前

大数据环境下的隐私安全的图像特征提取及应用（毕业论文）

点我完整下载：大数据环境下的隐私安全的图像特征提取及应用.docx 大数据环境下的隐私安全的图像特征提取及应用 “Image Feature Extraction an…

大数据 1天前

大数据

文化+科技融合发展第十一届中关村大数据日成功举办

12月22日，以“新出发，文化+科技铸就新商业文明”为主题的“2023年中关村大数据日暨大红门数智产业大厦启动仪式”在北京南中轴国际文化科技园成功举办。百余位政府主管部门领导、权威…

1天前

大数据

Hadoop YARN CGroup 实践

文章目录 Hadoop YARN Cgroups 实践什么是 cgroups cgroups 概念 YARN 使用 cgroups 背景 cgroups 在 YARN 中的工作原…

1天前

大数据

Hadoop-MapReduce使用说明

一、MapReduce是什么？ MapReduce是一个开源的分布式软件框架，可以让你很容易的编写程序（继承Mapper和Reducer，重写map和reduce方法）去处理大数据…

1天前

大数据

HADOOP的配置

一，集群和分布式的概念 hadoop+java1.8:链接：https://pan.baidu.com/s/1yTlgLGzz6Ow-YWU-CeF68w 提取码：aoag –来自…

1天前