大数据
-
MySQL安装与环境搭建——超详细教程
MySQL安装目录 一、MySQL环境搭建 1. MySQL的卸载 2. MySQL的下载、安装、配置 2.1 MySQL版本的介绍 2.2 软件的下载 2.4 配置MySQL8….
-
大数据大作业(课程设计)
题目:信息爬取字数统计及可视化 内容及要求: 配置Hadoop平台; 利用爬虫技术爬取任一门户网站新闻栏目一定时间段内的新闻信息,保存为一个或多个文件并上传到Hadoop平台以本人…
-
Hadoop 原理及架构详解
### README 本文是基于黑马程序员的 Hadoop 网课的前半部分整理的笔记,主要介绍了相关操作与组件架构。 视频网址:01-课程内容大纲与学习目标_哔哩哔哩_bilibi…
-
Apache DolphinScheduler——开源大数据调度器神器(国人之光)
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 1. 简 介 Apache DolphinScheduler(海豚调度),国人之光,是许多国人雷锋开源在Apache的顶级…
-
Hadoop问题:start-all.sh显示未找到命令
在sbin文件夹下是start-all.sh可以运行的,但是到了别的文件夹下就不行了,于是想到了是文件路径问题,因为hadoop环境是和java环境一起配置的导致sbin写成了bi…
-
Netty数据粘包问题:解决Adjusted frame length exceeds大数据异常
Netty数据粘包问题:解决Adjusted frame length exceeds大数据异常 概述: 在网络通信中,数据的传输往往是以数据包(Packet)为单位进行的。而在使…
-
数据仓库基础(通俗易懂,好文)数仓概念
1、数据仓库的概念 数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。数据仓库的目的是构建面向分…
-
监管数据治理治什么?1104、EAST、客户风险系统数据简介
近年来,随着经济社会数字化发展,商业银行逐步向数字化、智能化转型,监管部门对商业银行数据报送质量也越来越重视。自2020年5月9日工行、农行、中行、建行、交行、邮储…
-
大数据技术之Hadoop:使用命令操作HDFS(四)
目录 一、创建文件夹 二、查看指定目录下的内容 三、上传文件到HDFS指定目录下 四、查看HDFS文件内容 五、下载HDFS文件 六、拷贝HDFS文件 七、HDFS数据移动操作 八…
-
python大数据作业-客户价值分析-实训头歌
一、实验目的与要求 1、掌握使用numpy和pandas库处理数据的基本方法。 2、掌握使用RFM分析模型对客户信息进行特征提取的基本方法。 3、掌握对特征数据进行标准化处理的基本…
-
ES实战- data too large, data for
场景 客户现场业务系统突然查询不到数据,个人一开始分析以为是聚合查询报错,于是去看了下系统日志,看到如下日志打印: Caused by: ElasticsearchStatusEx…
-
欢迎报名!数境·第七届工业互联网数据创新应用大赛震撼来袭!
欢迎报名! 由深圳市宝安区人民政府和中国信息通信研究院共同主办的数境·第七届工业互联网数据创新应用大赛正式开赛啦~~~ 中国信通院“数境”品牌赛事起始于2017年工业大数据创新大赛…
-
ES(elasticsearch)删除指定索引
场景 需要删除指定的索引 语法 执行命令 DELETE /索引名 比如:DELETE /mysql-status_-2023.06 执行结果: 判断索引是否删除成功 执行命令 HE…
-
Elasticsearch系列组件:Kibana无缝集成的数据可视化和探索平台
Elasticsearch 是一个开源的、基于 Lucene 的分布式搜索和分析引擎,设计用于云计算环境中,能够实现实时的、可扩展的搜索、分析和探索全文和结构化数据。它具有高度的可…
-
elasticsearch 如何查看index的内容
查看内容 1、使用 Elasticsearch 的 API 来进行查询,例如: GET /{index_name}/_search 查看index大小 curl ‘246.111….
