Pada artikel ini, penulis akan menunjukkan proses analisa jaringan melalui sebuah data set yang biasanya berbentuk sebuah tabel dua kolom yang menunjukkan hubungan antar nodes yang belum ter-visualisasi dalam bentuk jaringan / graph. Tujuan pembahasan kali ini adalah memberikan gambaran serta berbagi cara langkah-langkah yang dapat digunakan untuk menganalisa sebuah data set. Manfaat dari artikel ini diharapkan bahwa pembaca akan lebih mudah dalam mengubah suatu data set menjadi bentuk graph yang selanjutnya dapat dilakukan analisa dan mengambil kesimpulan /informasi mengenai jaringan tersebut.
Pembahasan penulis akan berada pada area SNA / Social Network Analysis yang mencakup hal-hal seperti average degree, graph density, network diameter dan modularity.
Introduction to Data set
Pada pembahasan ini penulis menggunakan salah satu data set yang bersumber dari www.networksciencebook.com serta menggunakan bantuan aplikasi Gephi untuk melakukan analisa data set tersebut. Perlu diketahui bahwa dalam pembahasan artikel ini, penulis mengambil data set mengenai powergrid network / jaringan pembangkit listrik untuk selanjutnya dianalisa. Bentuk data set yang telah diunduh dari link tersebut adalah seperti gambar berikut,
Sesuai dengan deskripsi penulis pada awal artikel, bentuk dari data set ini hanyalah berupa tabel 2 kolom dimana pada kolom paling kiri berisi nomor dari node dan kolom paling kanan berisi node yang terhubung dengan kolom di sebelah kiri.
Selanjutnya untuk mengubah data set ini menjadi format yang bisa dibaca oleh aplikasi Gephi, kita perlu memindahkan semua konten data set ke Ms Excel dengan bentuk akhirnya seperti ini,
Setelah itu kita simpan data ini ke dalam format file CSV (.csv), selanjutnya kita dapat menggunakan aplikasi Gephi untuk membuka format data tersebut dan berikut adalah tampilannya,
Pada saat menjalankan analisa ini, penulis menggunakan pilihan analisa secara undirected atau tidak saling mempengaruhi ketika ada jaringan lain yang ditambahkan dalam analisa. Selanjutnya akan beralih kepada analisa data set yang telah ter-visualisasi menjadi jaringan ini.
Network Analyzing
Dalam jaringan ini akan dilakukan analisa secara standard hingga pada akhir dari analisa nanti dapat diambil kesimpulan soal jaringan distribusi listrik / powergrid network tersebut.
Sebelum menganalisa jaringan ini, ada baiknya untuk mengubah bentuk / layout dari jaringan tersebut untuk mempermudah kita dalam melihat jaringan ini, berikut adalah bentuk penggunaan layout Fruchterman Reingold,
Dapat dilihat banyak titik dan garis yang terhubung, bentuk inilah yang disebut graph dan di sini titik / nodes merepresentasikan sebuah tiang listrik sementara garisnya / edges adalah kabel yang saling menghubungkan tiang listrik tersebut.
Berikutnya, penulis akan melakukan analisa pada nilai average degree distribution yang akan menunjukkan jumlah rata-rata hubungan yang terjalin antar pembangkit listrik dalam jaringan ini. Berikut adalah hasilnya,
Didapatkan nilai average degree sebesar 2,669 yang berarti rata-rata tiang listrik terhubungan dengan dua tiang listrik lainnya, dan dapat dilihat persebaran titik yang ada tidak merata dan merujuk pada bentuk distribusi poisson. Dibuktikan dengan adanya beberapa titik / node yang memiliki lebih dari 10 hubungan kepada titik lain.
Berikutnya, analisa akan dilakukan dengan melihat serangkaian nilai yaitu network diameter, average path length, betweenness dan closeness dari jaringan ini
Didapatkan nilai network diameter adalah 46 yang berarti untuk menempuh jarak antara dua titik terjauh di dalam jaringan ini dapat melalui 46 titik / nodes saja dengan average path length / rata-rata jarak antar titik sejauh 18,9 skala graph.
Pada gambar di atas dapat dilihat nilai betweenness centrality yang mengindikasikan adanya jumlah hub yang ada dalam jaringan, dapat dilihat bahwa dalam jaringan ini terdapat kurang dari seratus hub dan hal ini adalah salah satu landasan mengapa persebaran data pada average degree menghasilkan bentuk distribusi poisson.
Pada bagian ini terlihat nilai closeness centrality distribution yang mengukur kedekatan antara dua titik / nodes dalam sebuah jaringan. Dapat diamati pada gambar banyak titik yang memiliki tingkat kedekatan kurang dari 1. Berikut ini adalah nilai graph density,
Pada nilai graph density di atas dapat dilihat sebesar 0,001 jika dihitung secara teoritis dimana network density sendiri memiliki konsep rumus yaitu jumlah hubungan dibagi dengan probabilitas terjadinya hubungan dan tanpa melihat faktor pengaruh lain maka dengan nilai tersebut dapat diartikan bahwa hanya ada 1 hubungan dari total 1000 kemungkinan sebuah titik untuk terhubung. Mari kita identifikasi, siapa titik / node yang menjadi key player dalam jaringan ini mengingat key player artinya ia menjadi kunci hubungan dengan indikasi hubungan yang terjalin terhadap satu titik ini sangat banyak.
Dengan melihat kolom degree kita dapat melihat bahwa titik dengan Id 2395 adalah pemain kunci / key player dalam jaringan ini karena ia memiliki nilai tertinggi. Dengan hubungan / degree sebanyak 19 dan titik ini masuk ke dalam kelompok ke-20. Selanjutnya kita akan mengidentifikasi jumlah kelompok / komunitas yang ada dalam jaringan distribusi listrik ini dengan menggunakan fungsi modularity,
Dalam hasilnya dapat dilihat terdapat 35 komunitas kecil dalam jaringan ini, dan perhitungan ini menggunakan resolusi 1,0. Berikut adalah interpretasi data dengan warna-warna yang menunjukkan kelompok-kelompoknya,
Mari kita coba dengan menggunakan resolusi yang berbeda, penggunaan resolusi dalam fungsi modularity adalah untuk mengidentifikasi jumlah kelompok menjadi lebih besar dan dihasilkan lebih sedikit kelompok yang terdiferensiasi.
Dengan menaikkan resolusi menjadi 1,5 akan didapatkan jumlah kelompok yang lebih sedikit, berikut adalah hasilnya,
Dapat dilihat bahwa jumlah komunitas menurun dari 35 menjadi 31, dan berikut ini adalah interpretasinya dengan menggunakan warna,
Tidak terjadi terlalu banyak perubahan dalam graph namun, perubahan dapat dilihat dengan melihat jumlah komunitas yang menurun tadi. Berikut ini adalah bentuk akhir dari jaringan yang dianalisa dengan menunjukkan label masing-masing titik / nodes label.
Summary
Setelah melakukan analisa standard dari jaringan distribusi listrik / powergrid didapatkan sebuah pemain kunci dalam jaringan ini dan juga informasi-informasi mengenai jaringan ini yang telah dibahas pada bagian tengah artikel.
Akhir kata yang ingin disampaikan oleh penulis adalah semoga artikel ini membawa manfaat secara positif kepada pembacanya, dan bagi yang belum bisa memahami isi artikel ini maka penulis menerima saran dan kritik yang membangun demi perbaikan diri penulis. Terimakasih.