Rabu, 25 Juli 2012

Analisis Cluster



Analisis Cluster termasuk dalam salah satu jenis analisis multivariate yang memiliki tujuan untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimiliki. Tujuan utama dari analisis Cluster ini adalah untuk mengetahui struktur data dengan menempatkan kesamaan objek (variabel) kedalam satu grup (cluster) yang memiliki karakteristik tertentu dan dapat dibedakan antara satu dengan yang lainnya untuk dilakukan analisis dan interpretasi lebih lanjut. Cluster-cluster yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi. Jadi, dapat disimpulkan bahwa analisis Cluster adalah analisis multivariate yang berfungsi untuk mengelompokkan objek sehingga tiap objek yang memilki kedekatan atau kesamaan karakteristik dengan objek lainnya berada pada cluster yang sama.
Sebelum melakukan analisis Cluster, terdapat 3 hal yang perlu diperhatikan :
a. Mengukur kemiripan objek, dimana dapat dilakukan dengan mengelompokkan atau memisahkan objek berdasar kesamaan atau kemiripan atau kedekatan antar objek.
b. Membentuk Cluster, dimana dilakukan melalui pengidentifikasian dua observasi yang memiliki tingkat kemiripan yang terdekat yang belum ada di cluster yang sama dan mengkombinasikan cluster-clusternya.
c.  Menentukan jumlah Cluster sebagai hasil akhir, dimana menghasilkan jumlah cluster secara hierarki.

Terdapat 2 metode pembentukan cluster, yaitu :
     Metode hierarki
Adalah teknik pengelompokkan yang membentuk konstruksi hierariki atau kelompok tertentu seperti pohon sehingga proses pengelompokkan dilakukan secara bertahap. Metode hierarki memiliki jenis, yaitu :
·      Metode aglomerasi
Pada metode ini, tiap objek pada mulanya dianggap sebagai cluster tersendiri sehingga terdapat cluster sebanyak jumlah observasi. Kemudian dua cluster yang terdekat kesamaannya digabung menjadi suatu cluster baru, sehingga jumlah cluster berkurang satu pada tiap tahap.
·      Metode divisif
Metode ini diawali dengan membagi n objek menjadi 2 cluster. Tiap cluster dibagi dalam dua kelompok lagi dan seterusnya sehingga akan terdapat n buah cluster yang berisikan satu objek atau n cluster yang dibutuhkan.

     Metode non-hierarki (partisi)
Dimulai dengan memilih cluster sesuai jumlah keinginan lalu objek digabungkan dalam cluster-cluster. Dalam metode ini dikenal sebuah analisis, yakni analisis K-means dimana analisis ini berguna untuk mengelompokkan sejumlah kasus besar (>200 kasus) dengan didasarkan pada jarak terkecil antara kasus dan pusat cluster. Output yang dihasilkan berupa diagram dendogram dan analisis koefisien aglomerasi. Diagram dendogram adalah suatu diagram pohon yang menggambarkan penggabungan atau pemisahan antra objek menjadi cluster dalam tiap tahap pemrosesan, sedang jarak antar pengelompokka merupakan interpretasi beberapa kedekatan penggabungan objek dalam cluster.

Keuntungan penggunaan metode hierarki dalam analisis Cluster adalah mempercepat pengolahan dan menghemat waktu karena data yang diinputkan akan membentuk hierarki atau membentuk tingkatan tersendiri sehingga mempermudah dalam penafsiran, namun kelemahan dari metode ini adalah seringnya terdapat kesalahan pada data outlier, perbedaan ukuran jarak yang digunakan, dan terdapatnya variabel yang tidak relevan. Sedang metode non-hierarki memiliki keuntungan dapat melakukan analisis sampel dalam ukuran yang lebih besar dengan lebih efisien. Selain itu, hanya memiliki sedikit kelemahan pada data outlier, ukuran jarak yang digunakan, dan variabel tak relevan atau variabel yang tidak tepat. Sedangkan kelemahannya adalah untuk titik bakal  random lebih buruk dari pada metode hirarkhi.

Berikut ini adalah tahapan kerja analisis Cluster dengan menggunakan SPSS :
1.   Buka lembar kerja SPSS
2.   Tentukan nama variabel jenis data pada variabel view
3.   Masukkan data ke data view
4.   Untuk analisisnya, klik menu Analyze, pilih sub menu Classify, pilih Hierarchial Cluster
5.   Masukkan semua variabel ke kotak variabel
6.   Klik statistics
7.   Pada box Statistics, dibagian cluster membership aktifkan Agglomeration Scedule. Isikan Range of Solutions sesuai kebutuhan, misal dari range 2 hingga 4. Hal ini menunjukkan bahwa cluster yang akan ditampilkan nantinya antara 2 hingga 4.
8.   Klik continue dan kembali ke box awal
9.   Klik Plots. Pada box Plots, aktifkan Dendogram, dimana dendogram ini berguna untuk memperlihatkan proses terbentuknya cluster secara grafis. Pada icicle pilih None dimana tidak ada icicle yang ditampilkan pada output.
10. Klik continue dan kembali ke box awal
11.  Klik Method. Pada box Method pilih Between Group Linkage.
12.  Klik continue dan kembali ke box awal
13.  OK

Tidak ada komentar:

Posting Komentar