大数据 | 第19页 | 协通编程

spark3使用hive zstd压缩格式总结

ZSTD（全称为Zstandard）是一种开源的无损数据压缩算法，其压缩性能和压缩比均优于当前Hadoop支持的其他压缩格式，本特性使得Hive支持ZSTD压缩格式的表。Hive支…

大数据 1天前

Hadoop作业篇(一）

一、选择题 1. 以下哪一项不属于Hadoop可以运行的模式__C____。 A. 单机（本地）模式 B. 伪分布式模式 C. 互联模式 D. 分布式模式 C. 互联模式不属于H…

大数据 1天前

大数据基础复习题整理

第一章以下关于云计算、大数据和物联网之间的关系，论述错误的是 A. 物联网可以借助于大数据实现海量数据的分析 B. 物联网可以借助于云计算实现海量数据的存储 C. 云计算、大数据…

大数据 1天前

大数据

Caused by: org.apache.flink.table.api.ValidationException: The MySQL server has a timezone offset

Caused by: org.apache.flink.table.api.ValidationException: The MySQL server has a timezone…

1天前

大数据

Vmware虚拟机Centos6.5+Hadoop 完全分布式集群

一、环境：Vmware16+三台cent0s6.5 二、步骤 ROOT 用户操作（三台虚拟机都要操作，下面是以 HMaster 的操作截图）一、配置 IP 和网关 1．在 wi…

1天前

编程语言

matlab快速入门（读取数据并绘制散点图和拉格朗日插值

目录 1.读取excel： 2.注释快捷键： 3.数组/矩阵索引： 4.绘制散点图： 5.拉格朗日插值： 5.1分割出非空和空的x和y两组数据： 5.2插值： 5.3画图：小结：…

1天前

大数据

flink学习之旅(-)

某天正在摸鱼的小邓，突然接到任务需要1个月内掌握flink并接手前辈遗留下来的大数据计算项目，于是便有了此文。 1.flink 简单了解有状态的数据计算、流批一体、…

1天前

大数据

flink源码分析之功能组件(五)-高可用组件

简介本系列是flink源码分析的第二个系列，上一个《flink源码分析之集群与资源》分析集群与资源，本系列分析功能组件，kubeclient，rpc，心跳，高可用，sl…

1天前

【SQL开发实战技巧】系列（三）：SQL排序的那些事

系列文章目录【SQL开发实战技巧】系列（一）:关于SQL不得不说的那些事【SQL开发实战技巧】系列（二）：简单单表查询【SQL开发实战技巧】系列（三）：SQL排序的那些事【…

大数据 1天前

大数据

Kerberos安全认证-连载11-HBase Kerberos安全配置及访问

目录 1. Zookeeper Kerberos配置 2. HBase配置Kerberos 3. HBase启动及访问验证 4. HBase Shell操作HBase …

1天前

大数据

【flink】使用flink-web-ui提交作业报错

使用WebUI提交作业出现错误。错误截图：弹框信息： Server Response Message: org.apache.flink.runtime.rest.handl…

1天前

【大数据】kubernetes(k8s)calico跨节点网络不通的问题及排错过程

网络不通的表征： Readiness probe failed: calico/node is not ready: BIRD is not ready: BGP not esta…

大数据 1天前

Spark在AI与机器学习中的应用

1.背景介绍 1. 背景介绍 Apache Spark是一个开源的大规模数据处理框架，它可以处理批量数据和流式数据，并提供了一个易于使用的编程模型。Spark在AI和机器学习领域的…

大数据 1天前

大数据

GoldenDB-02数据库安装及分片介绍、重分布

目录一键安装 ini配置文件整体架构代码结构安装模式机器配置与软件要求典型规划 install_senior.ini 安装步骤问题安装成功常用命令数据分片规则 …

1天前

人工智能

R实战 | 限制性立方样条(RCS)

RCS 在科学研究中，我们经常构建回归模型来分析自变量和因变量之间的关系。大多数的回归模型有一个重要的假设就是自变量和因变量呈线性关联。当自变量和因变量之间为非线性关系时，可以将连…

1天前