This commit is contained in:
Yesen 2023-10-13 13:22:07 +03:00
parent e14148adc9
commit c31c05ef01

View File

@ -34,7 +34,7 @@ plt.ylabel('Частота')
plt.title('Гистограмма данных')
plt.show()
```
![Гистограмма](C:\Users\admin\Documents\prog\hello\practica\DataBase\Figure_1.png)
![Гистограмма](./practica/DataBase/Figure_1.png)
- Построение гистограммы диаграммы рассеяния
```python
import matplotlib.pyplot as plt
@ -50,7 +50,7 @@ plt.ylabel('Переменная Y')
plt.title('Диаграмма рассеяния')
plt.show()
```
![Диаграмма рассеяния](docs\practica\DataBase\Figure_2.png)
![Диаграмма рассеяния](./practica/DataBase/Figure_2.png)
### Ящик с усами (box plot)
---
@ -138,7 +138,7 @@ plt.ylabel('Переменная Y')
plt.title('Диаграмма рассеяния и корреляция')
plt.show()
```
![Диаграмма рассеяния и корреляция](docs/practica/DataBase/Figure_3.png)
![Диаграмма рассеяния и корреляция](./practica/DataBase/Figure_3.png)
## Преобразование данных (например, нормализация или стандартизация)
__Преобразование данных__ это процесс изменения шкалы или распределения переменных, чтобы сделать их более подходящими для анализа или моделирования. Это важный этап EDA, который помогает сгладить различия между переменными и создать более устойчивые и интерпретируемые данные. Преобразование данных может быть особенно полезным, когда у нас есть переменные с разными диапазонами значений, что может затруднять интерпретацию результатов. Это также может помочь алгоритмам машинного обучения работать более эффективно, так как они часто ожидают, что переменные будут иметь определенный масштаб или распределение.
@ -192,7 +192,7 @@ plt.ylabel('Значения')
plt.title('Анализ выбросов')
plt.show()
```
![Boxplot](docs\practica\DataBase\Figure_4.png)
![Boxplot](./practica/DataBase/Figure_4.png)
# Шаги разведочного анализа данных
## Загрузка и первичный осмотр данных