Analisis
Cluster termasuk dalam salah satu jenis analisis multivariate yang memiliki
tujuan untuk mengelompokkan objek-objek berdasarkan karakteristik yang
dimiliki. Tujuan utama dari analisis Cluster ini adalah untuk mengetahui
struktur data dengan menempatkan kesamaan objek (variabel) kedalam satu grup (cluster)
yang memiliki karakteristik tertentu dan dapat dibedakan antara satu dengan
yang lainnya untuk dilakukan analisis dan interpretasi lebih lanjut.
Cluster-cluster yang terbentuk memiliki homogenitas internal yang tinggi dan
heterogenitas eksternal yang tinggi. Jadi, dapat disimpulkan bahwa analisis
Cluster adalah analisis multivariate yang berfungsi untuk mengelompokkan objek
sehingga tiap objek yang memilki kedekatan atau kesamaan karakteristik dengan
objek lainnya berada pada cluster yang sama.
Sebelum
melakukan analisis Cluster, terdapat 3 hal yang perlu diperhatikan :
a. Mengukur kemiripan objek, dimana
dapat dilakukan dengan mengelompokkan atau memisahkan objek berdasar kesamaan
atau kemiripan atau kedekatan antar objek.
b. Membentuk Cluster, dimana dilakukan
melalui pengidentifikasian dua observasi yang memiliki tingkat kemiripan yang
terdekat yang belum ada di cluster yang sama dan mengkombinasikan cluster-clusternya.
c. Menentukan jumlah Cluster sebagai
hasil akhir, dimana menghasilkan jumlah cluster secara hierarki.
Terdapat
2 metode pembentukan cluster, yaitu :
Metode
hierarki
Adalah
teknik pengelompokkan yang membentuk konstruksi hierariki atau kelompok
tertentu seperti pohon sehingga proses pengelompokkan dilakukan secara
bertahap. Metode hierarki memiliki jenis, yaitu :
·
Metode
aglomerasi
Pada
metode ini, tiap objek pada mulanya dianggap sebagai cluster tersendiri
sehingga terdapat cluster sebanyak jumlah observasi. Kemudian dua cluster yang
terdekat kesamaannya digabung menjadi suatu cluster baru, sehingga jumlah
cluster berkurang satu pada tiap tahap.
·
Metode
divisif
Metode
ini diawali dengan membagi n objek menjadi 2 cluster. Tiap cluster dibagi dalam
dua kelompok lagi dan seterusnya sehingga akan terdapat n buah cluster yang
berisikan satu objek atau n cluster yang dibutuhkan.
Metode non-hierarki (partisi)
Dimulai
dengan memilih cluster sesuai jumlah keinginan lalu objek digabungkan dalam
cluster-cluster. Dalam metode ini dikenal sebuah analisis, yakni analisis
K-means dimana analisis ini berguna untuk mengelompokkan sejumlah kasus besar
(>200 kasus) dengan didasarkan pada jarak terkecil antara kasus dan pusat
cluster. Output yang dihasilkan berupa diagram dendogram dan analisis koefisien
aglomerasi. Diagram dendogram adalah suatu diagram pohon yang menggambarkan
penggabungan atau pemisahan antra objek menjadi cluster dalam tiap tahap
pemrosesan, sedang jarak antar pengelompokka merupakan interpretasi beberapa
kedekatan penggabungan objek dalam cluster.
Keuntungan
penggunaan metode hierarki dalam analisis Cluster adalah mempercepat pengolahan
dan menghemat waktu karena data yang diinputkan akan membentuk hierarki atau
membentuk tingkatan tersendiri sehingga mempermudah dalam penafsiran, namun
kelemahan dari metode ini adalah seringnya terdapat kesalahan pada data
outlier, perbedaan ukuran jarak yang digunakan, dan terdapatnya variabel yang
tidak relevan. Sedang metode non-hierarki memiliki keuntungan dapat melakukan
analisis sampel dalam ukuran yang lebih besar dengan lebih efisien. Selain itu,
hanya memiliki sedikit kelemahan pada data outlier, ukuran jarak yang
digunakan, dan variabel tak relevan atau variabel yang tidak tepat. Sedangkan
kelemahannya adalah untuk titik bakal
random lebih buruk dari pada metode hirarkhi.
Berikut
ini adalah tahapan kerja analisis Cluster dengan menggunakan SPSS :
1. Buka
lembar kerja SPSS
2. Tentukan nama variabel jenis data
pada variabel view
3. Masukkan data ke data view
4. Untuk analisisnya, klik menu Analyze, pilih sub menu Classify, pilih Hierarchial Cluster
5. Masukkan semua variabel ke kotak
variabel
6. Klik statistics
7. Pada box Statistics, dibagian cluster membership aktifkan Agglomeration Scedule. Isikan Range of Solutions sesuai
kebutuhan, misal dari range 2 hingga 4. Hal ini menunjukkan bahwa cluster yang
akan ditampilkan nantinya antara 2 hingga 4.
8. Klik continue dan kembali ke box
awal
9. Klik Plots. Pada box Plots, aktifkan Dendogram, dimana dendogram ini berguna untuk memperlihatkan proses
terbentuknya cluster secara grafis. Pada icicle
pilih None dimana tidak ada icicle
yang ditampilkan pada output.
10. Klik continue dan kembali ke box
awal
11. Klik Method. Pada box Method pilih Between Group Linkage.
12. Klik continue dan kembali ke box
awal
13. OK
Tidak ada komentar:
Posting Komentar