大数据
-
Doris 入门:高级特性(四)
目录 一、表结构变更 二、Rollup 三、增大内存 四、修改超时时间 五、Broadcast/Shuffle Join 六、数据模型 七、索引 八、物化视图 九、动态分区 十、数…
-
TDengine Kafka Connector将 Kafka 中指定 topic 的数据(批量或实时)同步到 TDengine
教程放在这里:TDengine Java Connector,官方文档已经写的很清晰了,不再赘述。 这里记录一下踩坑: 1.报错 java.lang.UnsatisfiedLink…
-
223页10万字大数据中心总体架构及数据仓库顶层设计解决方案WORD
提供智慧城市、智能制造、数据治理、信息化等领域的系统框架、总体架构、数据流架构资料,包括数据治理、信息化、精益生产改善知识。 本文文档69页,因篇幅限制,以下仅展示部分资料,需要完…
-
【2024年更新】大数据专业毕设必过选题推荐
文章目录 大数据专业毕设必过选题 大数据毕设项目主要流程: 一、Hive数据仓库相关选题 题目推荐: 二、Hadoop/MapReduce相关选题 题目推荐: 三、Spark相关选…
-
CDH整合Flink(CDH6.3.0+Flink1.12.1)
CDH整合Flink(CDH6.3.0+Flink1.12.1) 1 准备环境 Linux版本:CENTOS 7.7.1908 在自己的虚拟机上提前准备好,版本建议高点 JAVA版…
-
HiveSql中的分区分桶详解
分区(partiton) 静态分区 动态分区 静态分区 如果有一张表,需求是要其中一类的数据例如(星座),但是需要全盘扫描,如何精…
-
网约车大数据综合项目——数据分析Hive
第1关:Hive 储存数据 开启Hadoop服务,并使得 Hive 连接 MySQL 初始化 start-all.sh schematool -dbType mysql -init…
-
Flink的实时数据流式图数据处理
1.背景介绍 1. 背景介绍 Apache Flink 是一个流处理框架,用于实时数据流处理和大数据处理。Flink 可以处理大规模数据流,并提供低延迟和高吞吐量。Flink 支持…
-
Spark与PySpark(1.概述、框架、模块)
目录 1.Spark 概念 2. Hadoop和Spark的对比 3. Spark特点 3.1 运行速度快 3.2 简单易用 3.3 通用性强 3.4 可以允许运行在很多地方 4….
-
记elasticsearch CPU负载100%问题
记elasticsearch CPU负载100%问题 环境: 问题表现: 初步排查: 日志 查询hot_thread 深入 查询当前elasticsearch正在运行的Task 查…
-
大数据环境下的隐私安全的图像特征提取及应用(毕业论文)
点我完整下载:大数据环境下的隐私安全的图像特征提取及应用.docx 大数据环境下的隐私安全的图像特征提取及应用 “Image Feature Extraction an…
-
文化+科技融合发展 第十一届中关村大数据日成功举办
12月22日,以“新出发,文化+科技铸就新商业文明”为主题的“2023年中关村大数据日暨大红门数智产业大厦启动仪式”在北京南中轴国际文化科技园成功举办。百余位政府主管部门领导、权威…
-
Hadoop YARN CGroup 实践
文章目录 Hadoop YARN Cgroups 实践 什么是 cgroups cgroups 概念 YARN 使用 cgroups 背景 cgroups 在 YARN 中的工作原…
-
Hadoop-MapReduce使用说明
一、MapReduce是什么? MapReduce是一个开源的分布式软件框架,可以让你很容易的编写程序(继承Mapper和Reducer,重写map和reduce方法)去处理大数据…
-
HADOOP的配置
一,集群和分布式的概念 hadoop+java1.8:链接:https://pan.baidu.com/s/1yTlgLGzz6Ow-YWU-CeF68w 提取码:aoag –来自…
