Нормализация данных в Python

Нормализация относится к преобразованию числовых атрибутов с действительным знаком в 0 0 от 0 до 1 1 1 диапазон.

Нормализация данных используется в машинном обучении, чтобы сделать обучение модели менее чувствительным к масштабу функций. Это позволяет нашей модели сходиться к лучшему весу и, в свою очередь, приводит к более точной модели.

Слева: исходные данные, справа: нормализованные данные

Нормализация делает функции более согласованными друг с другом, что позволяет модели более точно прогнозировать выходные данные.

Код

Python предоставляет предварительную обработку библиотека, которая содержит функцию normalize для нормализации данных. Он принимает массив в качестве входных данных и нормализует его значения между 0 0 аннотация> 0 и 1 1 аннотация > 1. Затем он возвращает выходной массив с теми же размерами, что и входной.

 from sklearn import preprocessingimport numpy as npa = np.random.random ((1, 4)) a = a * 20print ("Data =", a) # нормализовать данные  attributesnormalized = preprocessing.normalize (a) print ("Нормализованные данные =", нормализованные) 

Оцените статью
nanomode.ru
Добавить комментарий