大数据
-
spark3使用hive zstd压缩格式总结
ZSTD(全称为Zstandard)是一种开源的无损数据压缩算法,其压缩性能和压缩比均优于当前Hadoop支持的其他压缩格式,本特性使得Hive支持ZSTD压缩格式的表。Hive支…
-
Hadoop作业篇(一)
一、选择题 1. 以下哪一项不属于Hadoop可以运行的模式__C____。 A. 单机(本地)模式 B. 伪分布式模式 C. 互联模式 D. 分布式模式 C. 互联模式 不属于H…
-
大数据基础复习题整理
第一章 以下关于云计算、大数据和物联网之间的关系,论述错误的是 A. 物联网可以借助于大数据实现海量数据的分析 B. 物联网可以借助于云计算实现海量数据的存储 C. 云计算、大数据…
-
Caused by: org.apache.flink.table.api.ValidationException: The MySQL server has a timezone offset
Caused by: org.apache.flink.table.api.ValidationException: The MySQL server has a timezone…
-
Vmware虚拟机Centos6.5+Hadoop 完全分布式集群
一、环境:Vmware16+三台cent0s6.5 二、步骤 ROOT 用户操作(三台虚拟机都要操作,下面是以 HMaster 的操作截图) 一、配置 IP 和网关 1.在 wi…
-
matlab快速入门(读取数据并绘制散点图和拉格朗日插值
目录 1.读取excel: 2.注释快捷键: 3.数组/矩阵索引: 4.绘制散点图: 5.拉格朗日插值: 5.1分割出非空和空的x和y两组数据: 5.2插值: 5.3画图: 小结:…
-
flink学习之旅(-)
某天正在摸鱼的小邓,突然接到任务需要1个月内掌握flink并接手前辈遗留下来的大数据计算项目,于是便有了此文。 1.flink 简单了解 有状态的数据计算、流批一体、…
-
flink源码分析之功能组件(五)-高可用组件
简介 本系列是flink源码分析的第二个系列,上一个《flink源码分析之集群与资源》分析集群与资源,本系列分析功能组件,kubeclient,rpc,心跳,高可用,sl…
-
【SQL开发实战技巧】系列(三):SQL排序的那些事
系列文章目录 【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事 【SQL开发实战技巧】系列(二):简单单表查询 【SQL开发实战技巧】系列(三):SQL排序的那些事 【…
-
Kerberos安全认证-连载11-HBase Kerberos安全配置及访问
目录 1. Zookeeper Kerberos配置 2. HBase配置Kerberos 3. HBase启动及访问验证 4. HBase Shell操作HBase …
-
【flink】使用flink-web-ui提交作业报错
使用WebUI提交作业出现错误。 错误截图: 弹框信息: Server Response Message: org.apache.flink.runtime.rest.handl…
-
【大数据】kubernetes(k8s)calico跨节点网络不通的问题及排错过程
网络不通的表征: Readiness probe failed: calico/node is not ready: BIRD is not ready: BGP not esta…
-
Spark在AI与机器学习中的应用
1.背景介绍 1. 背景介绍 Apache Spark是一个开源的大规模数据处理框架,它可以处理批量数据和流式数据,并提供了一个易于使用的编程模型。Spark在AI和机器学习领域的…
-
GoldenDB-02数据库安装及分片介绍、重分布
目录 一键安装 ini配置文件 整体架构 代码结构 安装模式 机器配置与软件要求 典型规划 install_senior.ini 安装步骤 问题 安装成功 常用命令 数据分片规则 …
-
R实战 | 限制性立方样条(RCS)
RCS 在科学研究中,我们经常构建回归模型来分析自变量和因变量之间的关系。大多数的回归模型有一个重要的假设就是自变量和因变量呈线性关联。当自变量和因变量之间为非线性关系时,可以将连…
