数据归一化常见算法

1天前 • 算法结构

数据归一化的几种方法

1 Min-Max归一化

Min-Max归一化是一种线性的归一化方法。该方法将数据进行一次线性变换，将数据映射到[0,1]区间。Min-Max归一化不改变数据的分布。其缺点为，过度依赖最大最小数，且容易受到离群点、异常数据的影响。其公式为：

x

′

=

x

−

M

i

n

M

a

x

−

M

i

n

x^\prime = \frac{ x – Min} {Max – Min}

x′=Max−Minx−Min

其中

x

x

x是原始数据、

M

i

n

Min

Min为数据的最小值、

M

a

x

Max

Max为数据的最大值、

x

′

x^\prime

x′是变换后的数据。

2 Z-Score归一化

Z-Score归一化将数据尽可能处理成符合正态分布的数据。该方法难以将数据映射到一个固定的区间上。Z-Score归一化的公式为：

x

′

=

x

−

x

‾

S

t

d

x^\prime = \frac{ x – \overline{x}} {Std}

x′=Stdx−x

其中

x

x

x为原始数据、

x

‾

\overline{x}

x为数据的均值、

S

t

d

Std

Std为数据的标准差

3 小数标定

通过直接除以一个整数，移动所有数据的小数点，进行数据归一化的方法，称之为小数标定归一化方法。该方法可将数据映射到[-1,1]区间。该方法的公式为：

x

′

=

x

1

0

j

x^\prime = \frac{x} {10^j}

x′=10jx

其中，

j

j

j为数据绝对值最大数据的位数。

4 Sigmoid

Sigmoid函数的表达式为：

F

(

x

)

=

1

1

+

e

−

x

F(x) = \frac{1} {1+e^{-x}}

F(x)=1+e−x1,其值域为[0,1].将所有数据经过Sigmoid映射以后，可以将数据映射到

[

0

,

1

]

[0,1]

[0,1]区间。该函数图像如图所示：

在这里插入图片描述

5 RankGauss归一化

今天刚刚看到的，记录一下

def ScaleRankgauss(x, epsilon=1e-6): 
    '''rankgauss'''
    x = x.argsort().argsort()     #排序
    x = (x/x.max()-0.5)*2         #转换尺度到[-1,1]
    #调整极端值 把在[-1,1]区间之外的数值截断为-1或1
    x = np.clip(x, -1+epsilon, 1-epsilon)
    x = erfinv(x)                 #函数映射
    return x

x = np.random.randint(0, 100, 1000)
plt.hist(x)
x_rankgauss = ScaleRankgauss(x)
plt.hist(x_rankgauss, bins=50)

本文来自网络，不代表协通编程立场，如若转载，请注明出处：https://net2asp.com/e70935eb37.html

人工智能算法

赞 (0)

数据结构C/C++ 职工信息管理系统

« 上一篇 1天前

动态规划汇总

下一篇 » 1天前

人工智能

单片机项目分享单片机图像分类智能识别机器人 – 物联网深度学习 AI

文章目录 0 前言 1 **项目背景** 2 **在 Arduino IDE 上安装 ESP32-Cam** 3 **用 BLINK 测试电路板** 4 **测试 WiFi** 5…

1天前
人工智能

yolov5识别cf火线敌人（FPS类的AI瞄准）详细教程二

一.前言以下代码只可用于私服，不可商用，代码完全开源，主要用于学习，上篇文章已经写了yolov5的基础用法，这篇文章主要是将我对yolov5模型的修改，用于实现对屏幕进行实时监测…

1天前
人工智能

AI监测绕不过？5种规避方法大揭秘

在互联网时代，AI检测发挥着重要作用，鉴别和处理违规、有害及低质内容，维护网络环境的健康与安全。但仍有人尝试规避此检测，以发布某些不合规或敏感信息。本文将评述并比较几种常见的规避手…

1天前
人工智能

20240119 每日AI必读资讯

🎬Motion推新功能：Video-to-Motion 可通过视频捕捉运动 – 通过视频捕捉运动。 – 生成各种角色视频。 – …

1天前
人工智能

置信椭圆（误差椭圆）详解

文章目录 Part.I 预备知识 Chap.I 一些概念 Chap.II 主成分分析 Chap.III Matlab 函数 randn Chap.IV Matlab 函数 pca …

1天前
人工智能

YOLOv8进行改进并训练自定义的数据集

一.训练数据集准备 YOLOv8的训练数据格式与YOLOv5的训练数据格式一致，这一部分可以进行沿用。之前博文有发布VOC标注格式转YOLO标注格式的脚本，有需要可…

1天前
人工智能

如何使用labelme中的AI多边形（AI-polygon）标注

文章目录 1.创建labelme虚拟环境 2.下载AI标注模型 3.修改配置文件 4.愉快地使用labelme的AI标注工具 1.创建labelme虚拟环境（1）创建基础环境并激…

1天前
人工智能

【KITTI数据集Odometry序列00-10标定文件中的参数关系解读】

KITTI数据集Odometry序列00-10标定文件中的参数关系解读 KITTI数据集Odometry序列00-10标定文件中的参数关系解读一、下载完整的里程计calib文件 …

1天前
人工智能

【修改huggingface transformers默认缓存文件夹】

How to change huggingface transformers default cache directory 前言关于windows上如何修改huggingfac…

1天前
人工智能

【自监督论文阅读笔记】EVA: Exploring the Limits of Masked Visual Representation Learning at Scale

Abstract：本文推出了 EVA，这是一个以视觉为中心的基础模型，旨在仅使用可公开访问的数据来探索大规模视觉表示的局限性。EVA 是一种经过预训练的普通 Vi…

1天前