Hari 10: Visualisasi Data dengan Matplotlib dan Seaborn (Bagian 1)

January 22, 2025 (1mo ago)

Belajar Visualisasi Data dengan Matplotlib dan Seaborn

Kita udah belajar pake Pandas, sekarang kita bakal belajar Visualisasi Data pake Matplotlib dan Seaborn. Visualisasi itu penting banget buat bikin data kita gampang dipahami, baik untuk analisis sendiri ataupun presentasi ke orang lain. Let's go!

1. Kenalan ama Matplotlib

Matplotlib itu library dasar buat bikin grafik di Python.

a. Membuat Line Plot

Line plot dipakai buat ngeliat tren data.

import matplotlib.pyplot as plt
 
# Data dummy
hari = ['Senin', 'Selasa', 'Rabu', 'Kamis', 'Jumat']
penjualan = [100, 150, 300, 200, 250]
 
# Bikin line plot
plt.plot(hari, penjualan, color='blue', marker='o', linestyle=' - ')
plt.title("Penjualan Harian") # Judul
plt.xlabel("Hari") # Label X
plt.ylabel("Jumlah Penjualan") # Label Y
plt.show()
 
 
📌 Artinya:
 
- `plt.plot`: Bikin grafik garis.
- `color`: Warna garis.
- `marker`: Titik pada data.
- `linestyle`: Gaya garis, seperti `—`, `-`, atau `:`.
 
### b. Membuat Bar Plot
Bar plot cocok buat data kategorikal, seperti penjualan per hari.
 
```python
# Bikin bar plot
plt.bar(hari, penjualan, color='orange')
plt.title("Penjualan Harian (Bar Plot)")
plt.xlabel("Hari")
plt.ylabel("Jumlah Penjualan")
plt.show()

c. Membuat Scatter Plot

Scatter plot digunakan untuk melihat hubungan antara dua variabel.

# Data dummy
harga = [1000, 2000, 3000, 4000, 5000]
jumlah_terjual = [50, 70, 60, 90, 100]
 
# Bikin scatter plot
plt.scatter(harga, jumlah_terjual, color='red')
plt.title("Hubungan Harga vs Jumlah Terjual")
plt.xlabel("Harga")
plt.ylabel("Jumlah Terjual")
plt.show()

📌 Artinya:

2. Membuat Grafik Penyebaran Data dengan Seaborn

Seaborn bikin grafik penyebaran data jadi lebih gampang dan terlihat lebih estetik.

a. Histogram

Histogram digunakan untuk melihat penyebaran data (seberapa sering nilai tertentu muncul).

import seaborn as sns
 
# Data dummy
data_penjualan = [100, 150, 200, 250, 300, 350, 300, 250, 200, 150]
 
# Bikin histogram
sns.histplot(data_penjualan, bins=5, kde=False, color='green')
plt.title("Penyebaran Penjualan")
plt.xlabel("Jumlah Penjualan")
plt.ylabel("Frekuensi")
plt.show()

📌 Artinya:

b. KDE Plot

KDE (Kernel Density Estimation) digunakan untuk melihat penyebaran data dalam bentuk kurva halus.

# Bikin KDE plot
sns.kdeplot(data_penjualan, shade=True, color='purple')
plt.title("Penyebaran Penjualan (KDE)")
plt.xlabel("Jumlah Penjualan")
plt.ylabel("Density")
plt.show()

📌 Artinya:

Kesimpulan

#100HariNulis #Day10 #MachineLearning