Tuesday, 22 November 2022

Algoritma K Nearest Neighbor dan cara Kerjanya




K-nearest neighbors atau knn adalah algoritma yang berfungsi untuk melakukan klasifikasi suatu data berdasarkan data pembelajaran (train data sets), yang diambil dari k tetangga terdekatnya (nearest neighbors). Dengan k merupakan banyaknya tetangga terdekat.

Kelebihan dan Kekurangan Algoritma KNN

Kelebihan Algoritma KNN:

  1. Algoritma KNN dapat mengatasi data noisy
  2. Algoritma KNN dapat menanggulangi data yang jumlahnya besar
  3. Mudah diimplementasikan

Kekurangan Algoritma KNN:

  1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga terdekat)
  2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa yang harus digunakan dan atribut mana yang harus digunakan untuk mendapatkan hasil yang terbaik
  3. Daya komputasi cukup tinggi karena diperlukan perhitungan jarak dari tiap sample uji pada keseluruhan sample latih

K-nearest neighbors melakukan klasifikasi dengan proyeksi data pembelajaran pada ruang berdimensi banyak. Ruang ini dibagi menjadi bagian-bagian yang merepresentasikan kriteria data pembelajaran. Setiap data pembelajaran direpresentasikan menjadi titik-titik c pada ruang dimensi banyak.

Algoritma K-Nearest Neighbors

  1. Tentukan k bilangan bulat positif berdasarkan ketersediaan data pembelajaran.
  2. Pilih tetangga terdekat dari data baru sebanyak k.
  3. Tentukan klasifikasi paling umum pada langkah (2), dengan menggunakan frekuensi terbanyak.
  4. Keluaran klasifikasi dari data sampel baru.

0 comments:

Post a Comment