Senin, 22 Mei 2017

BAB 8 KLASIFIKASI MULTISPEKTRAL

BAB 8 KLASIFIKASI MULTISPEKTRAL


            Klasifikasi multispectral adalah salah satu bagian dari pengolahan citra pengindraan jauh yang paling sering dibahas, digunakan, dan dalam praktik dipandang mapan. Lebih dari itu, hasil utama klasifikasi multispectral adalah peta tematik (yang pada umumnya merupakan peta penutup atau penggunaan lahan), yang kemudian biasanya dijadikan masukan dalam pemodelan spasial dalam lingkungan system informasi gegrafis (SIG). Meksipun demikian, metode klasifikasi ini masih menggandung kelemahan yang disebabkan oleh asumsi – asumsi awalnya, khususnya apabila diterapkan untuk pemetaan penggunaan lahan dilingkungan Indonesia dan Negara tropis basah lainnya. Seperti halnya klasifikasi manual yang menggunakan foto udara, klasifikasi multispectral merupan suatu metode yang dirancang untuk menurunkan informasi tematik dengan cara mengelompokkan fenomena berdasarkan kriteria tertent.
            Pada klasifikasi manual berbagai kriteria digunakan, antara lain kesamaan rona atau warna, tekstur, bentuk, pola, relief, dan sebagainya yang digunakan secara serentak. Pada bagian besar metode klasifikasi multispectral hanya ada satu krikteria yang digunakan, yaitu nilai spectral ( atau nilai kecerahan) pada beberapa saluran sekaligus. Perkembangan mutakhir menunjukkan bahwa klasifikasi multispectral juga dapat dilakukan dengan melibatkan unsur interpretasi lain disamping warna atau nilai  spectral, seperti tekstur dan bentuk, misalnya dengan segmentasi citra berbasis objek (object-based image segmentation) (Baatz dan Schappe,2000; Danoedoro ea al., 2008), serta melibatkan sumber data lain yang bersifat nir-spektral, misalnya melalui metode jaringan saraf tiruan (artificial neural network) (samudera, 2007). Meksipun demikian, klasifikasi manual dan multispectral mempunyai kesamaan mendasar, yaitu membutuhkan informasi bantu (termasuk data lapangan) supaya dapat menghasilkan peta tematik yang siap pakai.
            Dengan berkembanganya metode pencitraan hiperspektral (lihat Bab 3), para peneliti dan praktisi merasa bahwa metode klasifikasi baku yang tersedia saat ini dirasa kurang mamou memenuhi kebutuhan, khususnya apabila data multispectral yang harus ditangani berdimensi sangat besar. Bidang spektroskopi merupakan bidang kajian fisika (dan kimia) yang berkonsentrasi pada upaya pengenalan dan penjelajahan sifat – sifat komposisi material tertentu secara spectral, dalam kaitannya dengan suatu panjang gelombang yang sangat spesifik.
8.I DASAR PEMIKIRAN DAN ASUMSI
            Asumsi paling awal dalam klasifikasi multispectral ialah bahwa tiap objek dapat dibedakan dari yang lain berdasarkan nilai spektralnya. Disamping itu, Phinn (2002) menyebutkan bahwa klasifikasi multispectral mengasumsikan: (a) resolusi spasial tinggi, dimana setiap piksel merupakan piksel murni yang tersusun atas satu macam objek penutup lahan, (b) piksel – piksel yang menyusun satu jenis penutup lahan mempunyai kesamaan spectral, (c) setiap penutup lahan yang berbeda juga mempunyai perbedaan spectral yang signifikan.
            Fakta yang diperoleh melalui penelitian eksperimental (lihat Gambar 3.1 pada Bab 3) menunjukkan bahwa tiap objek cenderung memberikan pola respons spectral yang spesifik.  Semakin banyak informasi statistic yang dibutuhkan, semakin rumit algoritmanya, dan semakin lama proses eksekusi klasifikasinya. Dalam beberapa hal, algoritma yang lebih rumit akan memberikan hasil yang lebih teliti.
            Untuk mempermudah pemahaman konsep mengenai klasifikasi multispectral, contoh berikut diberikan. Misalkan ada suatu kelompok yang terdiri atas 26 mahasiswa dalam kelas, di mana masing – masing mahasiswa bernama A, B, C, D, …, Z. kelompok masiswa ini dapat dikelomokkan lagi menjadi grup – grup yang lebih kecil berdasarkan krikteria tertentu. Apabila beberapa macam krikteria diterapkan sekaligus maka pengelompokan akhir dihasilkan, di mana setiap grup terdiri atas anggota yang benar – benar sejenis ditinjau dari beberapa krikteria itu.
            Contoh diatas dapat diterapkan pada system multispectral, di suatu wilayah terekam pada system multispectral, dimana suatu wilayah terekam pada beberapa saluran spectral sekaligus. Apabila masing – masing saluran dievaluasi histogramnya maka setiap histogram bersifat multimodal, yang merupakan gabungan dari berbagai objek pada wilayah tersebut dan masing – masing objek membentuk kurva normal. Dalam hal ini, nilai piksel pada berbagai saluran ini menngantikan kriteria umur, berat bada, dan kriteria lainnya pada contoh dia atas.
            Sebagai ilustrasi, Gambar8.1 berikut ini menyajikan kurva bimodal. Telah diulas pada ban sebelumnya bahwa tiap objek homogeny cenderung membentuk satu kurva normal. Gambar tersebut menyajikan dua objek yang mempunyai pertampalan (overlap) nilai spectral. Pada gambar juga terlihat bahwa ada bagian kurva yang murni milik objek A, murni milik objek B, dan bagian pertampalan, yaitu A yang diinterpretasikan sebagai B, atau justru sebaliknya.
            Melalui teknik pemilahan tingkat kecerahan, A dan B dapat dipilih (dan diberi warna yang berbeda) dengan cara tepat membagi kedua kurva pada perpotongan keduannya. Dapat pula hal ini dilakukan dengan mengambil wilayah yang murni A ataupun yang murni B dan ‘menyerahkan’ sisanya kepada kelas yang lain (kelas ‘peralihan’, missalnya). Masalah-masalah seprti ini yang umum di jumpai pada klasifikasi multispectral. Pada kenyataannya, kurfa histogram objek tidaklah bimodal, melainkan multimodal. Begitu banyak objek dengan nilai spekral yang bermacan-macam. Satu sam lai saling bertampalan, bahkan kadang-kadang berimpit. Hanya saja, susunan bertampalan dan perimpitan mereka berbeda satu sama lain (lihat gambar 8.2). 
Gambar 8.1 model kurfa bimodal yang menggambarkan dua objek dengan nilai spectral yang bertampalan (sumber. Swain dan Darwis, 1978)
Cara kerja algoritma klasifikasi multispekral pada prinsipnya adalah menandai tiap jenis objek hingga terlihat berbeda dari satu yang lain, berdasarkan ciri-ciri nilai spectral sekaligus pada beberapa saluran. Melalui feature space (yang telah dibahas pada bab 5), pengelompokan objek ini dapat dilihat secara visual. Cara kerja algoritma klasifikasi adalah menerjemakan kenampakan visual tersebut menjadi parameter-parameter statistic yang dimengerti oleh computer, dan kemudian dieksekusi

Gambar 8.2 prinsip klasifikasi multispectral. Histogram tiap saluran penunjukan kecenderungan yang berbeda dalam merepresentasika pertampalan nilai piksel-pikselnya. Satu kufa yang seharusya mewakili satu objek bias merupakan perwujudan dua objek atau lebih karena kesamaan responsspektral. Penggunaan seluruh saluran dalam koordinat kartesius (e, y, z) mempermudah perbedaan gugus-gugus piksel objek.
Secara ringkas, algoritma klasifikasi sederhana memuat langkah-langkah sebagai berikut.
1.      Menentukan nilai spekral representative tiap objek dengan cara sampling. Nilai rerata tiap sampel akan dijadikan pegangan untuk pengenalan objek;
2.      Menempatkan nilai representative objek(sampel) pada diagram multidimensional;
3.      Menentukan batas toleransi berupa jarak spekrtral dari nilai representative. Artinya, vector piksel yang terhitung pada posisi diluar jarak ini akan dikelaskan sebagai bukan objek yang termaksud;
4.      Pengambilan keputusan berupa penghitungan seluruh nilai piksel dan memasukkan ke kelas yang tersedia, selama mereka lebih pendek atau sama dengan jarak toleransi masing-masing objek, dan menjelaskan sebagai’tak terklasifikasi’ selama mereka tidak masuk elas mana pun. Piksel yang bersangkutan akan di tandai sebagai kelas A, bila jarak spectral piksel tersebuat adalah yang terdekat dibandingkan jarak spectral ke kelas lain.
Pemeliharaan tingkat kecerahan (Density slicing)
Pemeliharaan nilai kecerahan (sering juga disebut sebagai density slicing atau level slising) merupakan teknik operasi yang dekat dengan LOOK-UP TABLE. Metode ini pada dasarnya juga merupakan suatu metode paling sederhana dalam mengelompokan atau mengklasifikasi objek secara spectral, khususnya untuk citra saluran tunggal. Bepijak pada asumsi bahwa tiap objek saluran tertentu mempunyai julat nilai kecerahan tertentu maka julat nilai kecerahan 0 – 225 dapat dilipat menjadi beberapa interfal yang menggambarkan kenampakan ibjek secara umum. Gambar 8.2 menunjukan ilustrasi pemilihan tingkat kecerahan pada tiga saluran sekaligus. Tiap interfal dapat diberi warna unik, terpisah dari interfal yang lain, sehingga tiap objek digambarkan dengan warna hijau, dan seterusnya. Selain dengan warna tiap interfal ini dapt pula ditandai dengan derajat keabuan yang berbeda. 
Syarat utama dalm teknik operasi pemilihan tingat kecerahan ini ialah adanya informasi tentang julat nilai tiap objekk. Melesetnya informasi ini akan menghasilkan kekeliruan dalam color mapping yang ingin dihasilkan. Teknik ini juga kurang bermanfaat dalam pemilihan nilai kecerahan objek yang saling bertampalan. Secara praktis teknik ini dapat diterapkan setelah melihat listogram tiap saliran. Dari sudut pandang statistic, tiap objek homogeny akan memberikan variasi nilai piksel yang berbentuk kurfa normal (Swain dan Davis, 1978). Kumpilan objek homogeny pada satu liputan citra akan menghasilkan sekumpulan kurfa normal sehingga pada umumnya histogram citra saluran tunggal merupakan kurva multimodel. Pemilihan nilai kwcerahan dapat dilakukan dengan ‘mengiris’ kurva besar tersebut hingga dihasilkan kurva-kurva kecil. Pemotongan ini juga berarti bahwa seluruh julat nilai kecerahan dipilah menjadi beberapa interval, masing-masing mewakili objek tertentu. Perlu dicatat bahwa dalam operasi ini tidak ada pengubahan nilai kecerahan. Seluruh nilai masih tetap seperti semula, namun representasi warnanya berbeda sehingga teknik ini sebenarnya lebih dekat ke operasi LUT(look-up table).
8.2 METODE KLASIFIKASI; TERSELIA DAN TAK-TERSELIA
Proses klasifikasi multispectral dengan bantuan computer masi dapat dibedakan menjadi dua jenis berdasarkan tingkat otomasinya. Keduanya ialah klasifikasi terselia (supervised classification atau klasifikasi terawasi, atau klasifikasi terkontrol) dan klasifikasi tak-terselia (unsupervised classification, atau klasifikasi tak-terawasi, atau klasifikasi tak-terkontrol). Pembahasan singkat keduanya diuraikan pada pembahasan berikut ini, dengan referensi utama Mulder dan Kostwinder (1987), Sherestha (1991), Richards (1994), Gonzales dan Woods (2000), Mather (2004), Jensen (2005), dan Gao (2010).
8.2.I klasifikasi terselia
Klasifikasi terselia meliputi sekumpulan algoritma yang didasarkan pemasukan contoh objek(berupa nilai spektal) oleh operator. Contoh ini disebut sampel, dan lokasi geografis kelompok piksel sampel ini disebut sebagai daerah contoh (training area). Sebelum sampel diambil, operator, analisis atau pengguna harus mempersiapkan system skasifikasi yang akan diterapkan, seperti halnya klasifikasi manual. Dua hal penting yang haus dipertimbangkan dalam klasifikasi ialah system skasifikasi dan kriteria sampel. Di samping itu, algoritma klasifikasi juga sangat menentukan. Pengambilan sampel secara digital oleh analisis pada dasarnya merupakan cara ‘melatih’ computer untuk mengenali objek berdasarkan kecenderungan spekrtalnya. Gambar 8.3 membantu pemahaman ini.




Gambar 8.3 Diagram alir proses klasifikasi secara tersedia (supervised classification)

(Modifikasi dari Gao, 2010)



            Perlu pula dipahami disini bahwa sebenarnya terdapat kesenjangan persepsi mengenai sampel diantara analis dan komputer (perangkat lunak pengolahan citra). Ketika analis melihat kelompok piksel pada citra yang ditampilkan pada layar monitor maka analis mengenalinya sebagai objek – objek yang sudah diakrabiny, misalnya sungai, lautr, permukiman, lapangan sepak bola, dan kompleks perumahan. Akan tetapi, perangkat lunak tidak dapat mengenalinya secara demikian karena analis mampu mengenali objek tersebut dengan bantuan pengalaman empiris termasuk pengetahuan lokal mengenai wilayah yang terekam pada citra. Disisi lain, perangkat lunak hanya dapat dipelajari untuk mengenalinya sebagai kesimpulan piksel dengan julat nilai tertentu, kemudian melakukan komputasi statistik seperti misalnya rerata, simpangan baku, variansi, probablitas, dan sebagainya. Oleh karena itu diperlukan, kemampuan untuk menerjemahkan “persepsi” yang dimiliki oleh perangkat lunak, yaitu sekadar nilai piksel. Disinilah arti penting pemahaman konseptual dalam melakukan pengambilan sampel.


1.      Sistem atau skema Klasifikasi
Klasifikasi multispektral secara langsung hanya dapat diterapkan untuk pemetaan penutup lahan (land cover), dan bukan penggunaan lahan. Aspek penggunaan lahan secara deduktif dapat diturunkan dari informasi penutup lahannya, atau dengan cara lain melalui pemasukan informasi bantu atau ancillary data (rotasi tanaman, citra multitemporal, faktor bentuk lahan, dan sebagainya). Oleh karena itu, skema klasifikasi yang disiapkan harus beriisi kelas – kelas penutup lahan (misalnya, padi, jagung, hutan campuran, semak, padang rumput, lahan terbuka, dan sebagainya); bukan penggunaan lahan (sawah, tegalan, hutan lindung) karena aspek fungsi ini tidak dapat dipresentasikan secara langsung melalui nilai piksel, kecuali untuk kasus – kasus khusus.
Saat ini telah tersedia berbagai macam sistem klasifikasi penggunaan lahan. Di Amerika Serikat, badan yang menangani survei pemetaan adalah USGS (United States Geological Survey) dan lembaga ini sudah mempunyai suatu sistem klasifikasi penutup/penggunaan lahan yang bersifat baku (Anderson et al. 1976), yang diacu oleh berbagai peneliti dan praktisi diseluruh Amerika Serikat dan bahkan beberapa negara lain. Sistem klasifikasi ini dirancang untuk dapat digunakan dengan menggunakan foto udara dan proses Interpretasi fotografik, serta dirinci dalam bentuk multitingkat, dari I hingga IV (lihat tabel 8.1 yang hanya menyajikan hingga tingkat II). Tingkat I bersifat sangat umum, sementara tingkat IV bersifat sangat spesifik. Semakin rinci tingkatnya, semakin besar skala dan resolusi spasial citra yang diperlukan untuk memetakannya.

Tabel 8.1 Sistem klasifikasi penutup/penggunaan lahan menurut USGS dan versi NOAA (2006, kiri) dan Anderson et al (1976, kanan)
Sistem klasifikasi menurut NOAA dan USGS ini mencampurkan konsep penutup dan penggunaan lahan karena berangkat dari asumsi bahwa penutup lahan lebih dapat diindera langsung melalui citra, dan aspek – aspek penggunaan lahan dalam beberapa hal dapat dideduksi dari penutup lahannya. Apabila proses pemetaannya menggunakan pendekatan interpretasi fotografik maka praktis tidak ada masalah yang muncul dari padanya. Akan tetapi, ketika metode klasifikasi ini maka banyak masalah akan muncul, mengingat fungsi penggunaan seringkali tidak diekspresikan oleh kenampakan fisik penutup lahannya; misalnya industri, perdagangan, dan permukiman yang kadang kala sama – sama berupa bangunan dengan penutup atas asbes.
  Di Indonesia, Bakosurtanal (Badan Koordinasi Survei dan Pemetaan Nasional) juga mempunyai sistem klasifikasi penutup dan penggunaan lahan yang secara konseptual tercampur. Begitu pula hanya klasifikasi yang dikembangkan oleh Malingreau dan Christiani (1982), Kementrian Kehutanan, dan berbagai Bappeda tingkat Provinsi. Badan Pertahanan Nasional (BPN) juga telah mengembakan sistem klasifikasi yang sudah lebih jelas mengarah ke penggunaan lahan dibandingkan Lembaga – lembaga lain. Meskipun demikian, sistem klasifikasi ini belum secara tegas mengaitkan metode penginderaan jauh (apalagi klasifikasi digital) dengan rincian kategori yang dispesifikkan.
      Danoedoro (2006) mengembangkan sistem klasifikasi multiguna (versatile) yang memuat aspek – aspek penutup dan pengguanaan lahan sekaligus serta dikembangkan dengan menggunakan citra penginderaan jauh sebagai sumber data utama. Gambar 8.4 menunjukan bahwa secara konseptual penutup/penggunaann lahan mempunyai enam dimensi, yaitu dimensi spektral, spasial, temporal, ekologis, fungsi sosial-ekonomi dan politis/legal. Dari keenam dimensi tersebut, Hanya lima dimensi pertama yang dapat diekstrak melalui citra penginderaan jauh, dengan tingkat komplek-sitas dan kebutuhan data bantu nir-penginderaan jauh yang berbeda – beda. Secara ideal, setiap dimensi disajikan sebagai salah satu lapis (layer) informasi yang berdiri sendiri sehingga suatu peta penggunaan lahan multidimen-sional atau multiguna setidaknya terdiri dari lima lapis informasi yang berturut – turut memuat aspek spektral, spasial, temporal, ekologis, dan fungsi sosial-ekonomi.
            Pada gambar 8.4 klasifikasi multispektral dijalankan untuk secara langsung menghasilkan peta dengan kandungan isi menurut skema klasifikasi dimensi penutup lahan secara spektral (spectral-related cover dimension). Proses selain klasifikasi yang diperlukan untuk mencapai kategorisasi ini hanyalah penggabungan kelas (class merging), untuk dimensi spasial, proses yang disarankan adalah interpretasi visual dan atau segmentasi dan klasifikasi bebasis objek. Untuk tiga dimensi yang lain diperlukan pengolahan citra digital lanjut yang melibatkan kombinasi yang lebih kompleks, termasuk didalamnya penggunaan data spasial bantu (misalnya dengan peta satuan medan hasil interpretasi visual) serta analisis spasial dilingkungan sistem informasi geografis berbasis raster.
            Pada gambar 8.4 tersebut secara eksplisit dijelaskan bahwa setiap tingkat (aras) kategorisasi memerlukan citra dengan resolusi spasial tertentu. Pada aras terendah diperlukan resolusi spasial 100 meter atau rendah sementara untuk aras tertinggi (paling rinci) diprlukan resolusi spasial 5 meter atau lebih tinggi. Skema ini sejauh mungkin sudah mempertimbangkan keselarasan antara resolusi spasial dan resolusi kategoris, meskipun penggunaan resolusi temporal yang lebih tinggi (misalnya citra 3 tanggal perekam) bisa meningkatkan kandungan informasi ke aras kerincian yang lebbih tinggi tanpa meningkatkan resolusi spasial.

Gambar 8.4 skema klasifikasi penggunaan lahan multiguna yang dikembangkan Danoedoro (2006, 2008), yang membedakan kategori penggunaan lahan dalam kelima dimensi, yang masing – masing dapat diekstrak dengan metode yang berbeda serta disajikan sebagai peta tematik terpisah.
            Bila skema klasifikasi yang tersedia ternyata hanya penggunaan lahan maka skema ini perlu diterjemahkan dulu menjadi klasifikasi penutup lahan. Untuk konversi semacam ini, pengetahuan analis atau operator mengenai karakteristik penggunaan lahan sangatlah penting. Disamping itu pengetahuan mengenai kodisi daerah yang diamati (local knowledge) juga sangat menunjang (Bronsveld et al., 1994). Skema klasifikasi yang secara langsung mengacu pada kategori – kategori penggunaan lahan, atau yang mencampur adukkan aspek penutup lahan dengan penggunaan lahan sebaiknya tidak digunakan pada klasifikasi awal, mengingat bahwa fungsi penggunaan lahan tidak secara langsung diinterpretasikan oleh nilai piksel (Danoedoro, 1994).
Gambar 8.5 Hubungan antara penutup lahan dan penggunaan lahan untuk beberapa kategori atau kelas.
2.      Kriteria Sampel
Sama dengan metode penelitian ataupun surveiyang lain, sampel haruslah homogen. Homogenitas sampel dalam klasifikasi digital ditunjukkan oleh homogenitas nilai piksel pada tiap kelompok piksel yang dipilih. Artinya, nilai simpangan baku kelompok piksel tiap sampel haruslah rendah untuk tiap saluran. Cara termudah untuk mengambil sampel yang memnuhi kriteria ini adalah dengan mengambil piksel – piksel murni (pure pixel, lihat BAB 2). Pada luasan yang homogen, pengambilan piksel murni dapat secara mudah dilakukan dengan memilih piksel dibagian tengah ketrampilan objek. Melalui penampilan citra komposit warna yang baik, homogenitas objek dicerminkan oleh warna yang seragam. Ada alternatif lain dalam mengambil sampel yang tidak homogen, yang akan dibahas dalam klasifikasi lunak.
Disamping itu, kriteria statistik pun diperlukan untuk menilai sampel – sampel yang baik tentunya mempunayi homogenitas nilai piksel yang tinggi, yang ditunjukkan oleh kecilnya simpangan baku, bentuk histogramnya, dan tentu saj bentuk gugusnya yang mengelompok pada  feature space, Campbell (2002) menyebutkan bahwa ada beberapa karakteristik kunci untuk sampel, yng dalam tulisan ini dapat disebut sebagai kriteria sampel yang baik. Jumlah piksel sampel minimum menurut Campbell, adalah 100 piksel untuk setiap kategori. Masing – masing kategori ini ada kemungkinan merupakan hasil pengambilan sampel atau training area pada beberapa lokasi yang berbeda, persyaratan jumlah ini sebenarnya juga berbeda. Disamping itu, Joyce (1978 dalam Campbell, 2002) mensyaratkan bahwa setiap daerah contoh yang berbeda setidaknya harus memuat luasan area 10 hektar, dan sebaiknya mencapai 16 hektar, untuk citra landsat MSS. Apabila persyaratan ini diterjemahkan dalam ukuran piksel maka nilai itu setara dengan 10 – 40 piksel per daerah contoh.
Selanjutnya, Campbell mensyaratkan lokasi, jumlah daerah contoh per kategori sampel, penempatan, serta keseragaman (uniformity), lokasi daerah contoh sebaiknya menyebar secara merata pada seluruh liputan citra, dengan harapan variabilitas spektral objek diseluruh citra dapat terwakili dengan baik. Jumlah daerah contoh per kategori disarankan antara 5-10 buah, yang masing – masing  (mengacu pada syarat jumlah piksel per daerah contoh) memuat 10 – 40 piksel. Phinn (2002) dan perangkat lunak ERDAS Imagine merekomendasikan jumlah minimum 100 piksel supaya perhitungan statistik setiap sampel memberikan hasil yang optimal.
Keseragaman piksel yang disyaratkan Campbell (2002) sebenarnya paralel dengan homogenitas piksel yang telah dikemukakkan sebelumnya karena keseragaman ini dapat dicapai pada awalnya dengan memilih objek yang berwarna sama pada citra komposit  warna yang ditampilkan (tentu saja dengan asumsi bahwa pembuatan citra kompositnya cukup representatif), kemudian dapat diuji homogenitasnya dengan melihat kekompakkan gugus piksel pada feature space maupun histogram sampelnya yang harus unimodal.

Gambar 8.6 cara pengambilan sampel yang menggunakan dua tampilan citra untuk cek silang, yaitu citra Quickbird multispektral (2,4 m resolusi spasial, komposit warna semu saluran – saluran 4-2-1 dengan urutan pewarnaan merah-hijau-biru) disebelah kiri, dan citra komposit Quickbird multispektral (pan-sharpened dengan transfomasi Brovey, mendekati warna asli) disebelah kanan, pada gambar kiri, area yang diberi kotak telah diperbesar (kiri bawah) untuk diambil sampelnya dalam bentuk ROI, area ini tampak jauh lebih besar pada citra komposit multiresolusi sehingga secara langsung daoat dicek tingkat homogenitasnya, dengan menggunakan kombinasi saluran yang berbeda. (sumber, Danoedoro, 2004).

  Secara kuantitatif, Fitzpatrick (1981) serta Congalton dan Green (2010) menggunakan kriteria statistik berikut untuk menggunakan jumlah sampel minimal untuk seluruh daerah penelitian N adalah sebagai berikut :

            
 Dimana Z= 2, yang merupakan standard normal deviate untuk derajat kepercayaan sebesar 95% adalah tingkat akurasi yang diharapkan dan q= (100-p); sementara E = tingkat kesalahan yang diperbolehkan. Contoh berdasarkan rumus ini adalah sebagai berikut. Misalnya, jika akurasi 85% diharapkan, dan kesalahan yang diizinkan adalah 5% (derajat kepercayaan 95%), maka :
Tetapi nilai N ini akan berubah drastis jika kesalahan yang diperbolehkan berubah, contohnya, kalau kesalahan yang diperbolehkan turun jadi 2% maka nilai N menjadi 1.275, jauh diatas jumlah sampel pada contoh sebelumnya, yang hanya 204.
Pertanyaannya yang muncul adalah : dimana saja sampel sebanyak itu akan diambil? McCoy (2005) mengkritik bahwa metode ini tidak memperhatikan luas dan kompleksitas wilayah. Hal ini bertentangan dengan prinsip geografi bahwa variabilitas fenomena dalam ruang menjadi salah satu kunci penentu dalam melakukan kajian, dan tentu saja termasuk dalam pengambilan sampel.
Pengambilan sampel pada citra bisa dibantu dengan tampilan citra lebih dari satu, yang memanfaatkan komposit warna yang berbeda-beda. Danoedoro (2004) mendemonstrasikan hal ini dengan menampilkan citra pada lebih dari satu jendela (window), dengan bantuan perangkat lunak pengolahan citra berbasis windows, yaitu ENVI (lihat gambar 8.6). pada satu jendela tersaji citra komposit warna semu standar Quickbird multispektral, sementara dijendela yang lain tersaji citra wilayah yang sama dalam komposisi yang dipertajam oleh citra pankromatik.
Separabilitas Antarsampel
Campbell (2002) melaporkan temuan beberapa penelitian lain yang pernah menyimpulkan bahwa pemilihan sampel lebih berpengaruh terhadap akurasi hasil klasifikasi daripada pemilihan algoritma klasifikasi itu sendiri. Oleh karena itu, strategi pengambilan sampel yang dilakukan secara cermat dan hati-hati mutlak diperlukan, untuk evaluasi tingkat separabilitas antarsampel, beberapa metode pengukuran dikenal, misalnya divergence (D), transformed divergence (TD) dan jarak Jeffries-Matusita (JM) (Richards, 1993; Jansen, 2005; Lillesand et., al 2008), indeks divergensi D dan transformed divergence TD dihitung berdasarkan rumus berikut ini (Tso dan Mather, 2009) :

            Separabilitas menurut rumus Jeffries-Matusita (JM) adalah sebagai berikut :

           
 Pada evaluasi tingkat separabilitas, analis memperoleh masukkan mengenai kategori atau kelas apa saja yang nantinya perlu untuk digabung, baik pada saat pengambilan sampel (yang berarti mengulang proses pengambilan sampel) maupun pada saat pemrosesan pasca klasifikasi (postclassification).
3.      Bebrapa Algoritma Klasifikasi Tersedia
a.       Jarak minimum terhadap Rerata (Minimum Distance to Mean Algorithm)
Bayangkanlah suatu Feature space n dimensi, yang menggambarkan saluran 1,2,3,......,n dalam suatu sistem multispektral. Melalui sistem ini tiap objek yang sama akan mempunyai nilai ganda; pada saluran 1,2,3,..., dan n. Setiap piksel dapat diplot pada ruang spektral, dan diukur jarak spektralnya terhadap suatu piksel sampel acuan (yang telah diketahui pasti jenisnya), dengan menggunakan persamaan berikut ini :
                 Dimana BV­ijk dan BVijl adalah posisi koordinat piksel yang tidak diketahui pada saluran k dan saluran l, sementara µck dan µcl adalah nilai rerata vektor piksel kelas c disaluran k dan l. Apabila lebih dari dua saluran digunakan sebagai masukkan maka rumusnya menjadi :
                 Dimana BVijk adalah vektor piksel pada saluran k dan µck adalah nilai Rerata vektor piksel kelas c disaluran k.



Apabila jarak spektral JS ini dihitung untuk seluruh kelas c yang tersedia maka suatu jarak terpendek untuk kelas tertentu akan diperoleh, dan piksel yang dihitung akan diberi label kelas itu. Pada alogaritma ini hanya dibutuhkan suatu nilai ambang (threshold value) sehingga bila semua jarak yang dihitung ternyata tidak ada yang memenuhinya, piksel yang bersangkutan akan dianggap tak terklasifikasi.

Keuntungan dari penggunaan alogaritma klasifikasi ini ialah kecepatannya (kecuali bila dibandingkan dengan alogaritma parallelepiped). Kelemahannya, cara ini tidak mempertimbangkan variabilitas kelas. Sebagai contoh, lahan terbuka berbatuan gamping di sana-sini tersusun oleh banyak piksel dengan variansi yang tinggi, yang berarti mempunyai piksel dengan jarak spektral yang jauh dari nilai reratanya. Piksel-piksel semacam ini akan dapat salah terklasifikasi. Sebaliknya, objek yang variansi nilai pikselnya kecil, seperti air jernih akan menghasilkan piksel-piksel yang terlalu banyak terklasifikasi masuk ke kelas air.

b. Alogaritma Parallelepiped (Box Classification Alogarithm)

klasifikasi dengan alogaritma ini dapat dijelaskan dengan langkah-langkah sebagai berikut. Pertama, operator memasukan sampel berupa nilai kelompok piksel beserta dengan nama (label)nya. Nilai kelompok piksel ini hanya akan dicatat sebagai nilai rerata beserta dengan simpangan bakunya (sd). Kedua, sampel-sampel  yang telah tercatat nilai rerata dan labelnya ini kemudian akan ditempatkan pada ruang spektral n dimensi, dimana n adalah jumlah saluran spektral yang dijadikan masukan. Ketiga, operator diminta memasukan suatu koefisien pengalih p. Nilai p ini nantinya akan dikalikan dengan sd pada tiap saluran. Nilai p × sd ini digunakan sebagai nilai panjang tiap sisi yang dibangun pada nilai rerata sebagai pusat kotak (lihat Gambar 8.5).

Setelah semua sampel selesai dicatat oleh komputer, dan si pengguna telah memasukan nilai koefisien pengalih p, maka program pun segera memutuskan klasifikasi. Proses ini dimulai dari piksel baris 1 kolom 1, sampai baris terakhir kolom terakhir. Apabila ternyata vek-tor piksel yang bersangkutan masuk ke salah satu kotak (box) sampel maka ini dikalsifikasikan sebagai kelas yang menandai kotak tersebut. Itulah sebabnya, klasifikasi parallelepiped ini sering juga disebut sebagai klasifikasi box.
Namun disamping itu, bisa jadi suatu vektor piksel ternyata tidak masuk kotak mana pun. Piksel ini dinyatakan sebagai ‘tak terklasifikasi’. Besarnya nilai faktor pengalih p sangat menentukan banyaknya piksel yang tak terklasifikasi. Semakin besar nilai p, semakin besar ukuran tiap kotak, dan semakin kecil risiko suatu vektor piksel untuk tidak masuk kotak mana pun (unclassified). Akan tetapi, semakin besar kotak berarti pula semakin kurang teliti hasil klasifikasinya (banyak yang misclassified), karena tingkat generalisasinya pun menjadi semakin besar.

c. Alogaritma Kemungkinan Maksimum (Maximum Likelihood Algoritm)
Alogaritma kemungkinan maksimum merupakan alogaritma yang secara statistik paling mapan. Kalau alogaritma lain didasari oleh pengukuran jarak antara koordinat gugus sampel dengan koordinat piksel kandidat (yang akan dikelaskan atau diberi label) maka alogaritma kemungkinan maksimum menggunakan dasar perhitungan probabilitas. Asumsi dari alogaritma ini ialah bahwa objek homogen selalu menampilkan histogram yang terdistribusi normal (Bayesian). Pada alogaritma ini, piksel dikelaskan sebagai objek tertentu bukan karena jarak euklidiannya, melainkan oleh bentuk, ukuran dan orientasi sampel pada feature space (yang berupa elipsoida) (Shresta, 1991).
Aturan Umum
Jensen (2005) menjelaskan bahwa alogaritma kemungkinan maksimum bekerja dengan cara berikut. Pertama, program secara ringkas menandai setiap piksel yang mempunyai hasil pengukuran pola atau kenampakan X ke dalam i yang satuannya paling mungkin dikelompokan sebagai vektor X. Dengan kata lain, probabilitas suatu untuk menjadi milik sejumlah kelas yang sudah didefinisikan dalam proses pengambilan sampel dihitung, kemudian piksel ini ditandai sebagai salah satu kelas yang nilai probabilitas piksel tersebut untuk menjadi anggotanya merupakan nilai yang tertinggi. Alogaritma kemungkinan maksimum mengasumsikan bahwa statistik setiap sampel bersifat Gaussian (terdistribusi normal). Dengan kata lain, sampel yang membentuk histogram bimodal atau multimodal dalam suatu saluran tunggal tidaklah ideal.

Untuk memutuskan klasifikasi, dibutuhkan informasi statistik berupa rerata dan simpangan baku tiap sampel, serta variansi (ragam) dan kovariansi. Rerata dan simpangan baku tiap sampel secara otomatis tersimpan pada waktu melakukan pengambilan sampel. Nilai vektor rerata menentukan posisi elipsoida sampel pada feature space multisaluran. Ukuran elipsoida ditentukan oleh nilai variansi pada tiap saluran, sedangkan bentuk dan orientasi elipsoida tersebut ditentukan oleh kovariansinya (Sharestha, 1991).

Berdasarkan rerata, variansi, dan kovariansi ini, probabilitas tiap piksel untuk dikatakan sebagai ‘milik’ suatu kelas tertentu dapat dihitung. Fungsi kerapatan probabilitas yang didefenisikan oleh alogaritma kemungkinan maksimum. Nilai probabilitas dinyatakan pada sumbu z, namum bila digambarkan dalam ruang dua dimensi, distribusi sampel dalam ‘cara pandang’ kemungkinan maksimum dinyatakan sebagai garis-garis kontur ekuiprobabilitas.
Cara memperoleh informasi probabilitas yang diperlukan dari sampel yang sudah dikumpulkan ialah dengan menggunakan fungsi kerapatan probabilitas (probability density function). Sebagai contoh, kalau ada satu sampel hutan yang diambil dari suatu saluran tunggal maka sampel tersebut dapat dihitung histogramnya dan kemudian berdasarkan histogram ini dapat dihitung perkiraan distribusinya melalui suatu fungsi kerapatan probabilitas normal. 
Pada alogaritma klasifikasi kemungkinan maksimum ini diasumsikan bahwa probabilitas untuk semua kelas dipandang sama. Pada kenyataanya, tidak semua kelas dapat diperlakukan dengan probabilitas sama untuk dipresentasikan pada citra. Suatu gugus sampel yang jauh lebih kecil untuk muncul sehingga perlu adanya faktor pembobot untuk masing-masing kelas yang ada. Gugus sampel yang kecil ini secara logis dapat diberi bobot yang lebih rendah dibandingkan gugus yang lain (Curran, 1985). Strhler (1980) menamakannya prior probability.


Pertimbangan Probabilitas untuk Maximum Likelihood
Melengkapi uraian tersebut di atas, Gao (20100 menjelaskan landasan berpikir alogaritma maximum likelihood sebagai berikut. Alogaritma ini menggunakan nilai probabilitas suatu piksel X untuk menjadi anggota dari suatu kelas informasi atau label tertentu. Metode yang melandasi alogaritma ini adalah statistik orde dua (second order statistics) mengenai model fungsi kerapatan probabilitas gaussian untuk setiap kelas.

Fungsi diskriminan dsar untuk piksel X adalah:
di mana max[p(Ci/X), p(C2/X), .....p(Cm/X)] merupakan fungsi yang memberikan nilai probabilitas terbesar diantara nilai-nilai yang ada di dalam tanda kurung. Misalnya, max[0.25, 0.34, 0.21, 0.62, 0.39] adalah 0.62. Adapun p(Ci/X) menunjukan probabilitas kondisional piksel X untuk menjadi anggota kelas Ci. Pemecahannya menggunakan teorema Bayes;

di mana p(Ci/X) mewakili probabilitas kondisonal untuk menemukan piksel X dalam kelas Ci. Sementara p(Ci) juga sering disebut dengan probabilitas a priori (mendahului fakta), yang merupakan probabilitas keberadaan kelas Ci dalam citra masukan; p(X) menunjukan probabilitas piksel X pada citra masukan. Ini semua diperoleh dari sampel-sampel, dengan cara menjumlahkan semua probabilitas yang ada pada setiap kelas dikalikan dengan proporsi pada setiap kelas tersebut, atau:

seperti batas persamaan (8.8) dann (8.9)  bertolak belakang karena probabilitas untuk menemukan kelas informasi spesifik p(Ci) harus diketahui lebih dahulu. Tanpa hasil klasifikasi, berapa besar setiap kelas penutup lahan pada citra masukan tidak mungkin diketahui. Untuk mengatasi kontradiksi ini, ada dua pendekatan (Gao, 2010):
-          Pertama, presentase setiap penutup lahan yang dapat diturunkan dari klasifikasi yang lain, seperti misalnya melalui klasifikasi tak terselia, minimum distance to mean, atau berdasarkan maximum likelihood yang telah dijalankan sebelumnya.
-          Kedua, probabilitas dapat diasumsikan sama untuk seluruh kelas penutup lahan.
Asumsi-asumsi tersebut tidaklah rasional, tetapi tampaknya tidak berpengaruh terhadap hasil klasifikasi karena klasifikasinya sendiri bersifat robust. Dalam pelaksanaanya, analis dengan maximum likelihood diberi kesempatan untuk memberikan nilai probabilitas untuk setiap kelas. Lepas dari itu, metode apa pun yang akan dipilih untuk memecahkan masalah p(Ci) tidak ada pengaruh dalam penentuan p(Ci/X) setelah persamaan (8.8) dimasukan ke persamaan (8.9), atau menjadi:

Dengan demikian, kalkulasi p(Ci/X) direduksi menjadi penentuan p(X/Ci). Kalkulasi probabilitas kondisional semacam ini didsari oleh model probabilitas distribusi normal menurut asumsi distribusi normal untuk semua sampel. Dalam kasus satu dimensi, maka:

di mana µi adalah rerata untuk kelas Ci dan i adalah simpangan baku untuk kelas Ci. Baik Ci maupun i  diturunkan dari sampel.
Komputasi p(X/Ci) menjadi semakin rumit dalam domain multispektral, seperti yang biasa dijumpai dalam citra satelit, yaitu:

di mana µi dan Ei berturut-turut adalah vektor rerata dan matriks kovariansi kelas Ci. Keduanya diestimasi dari sampel melalui estimasi tak-bias berdasarkan persamaan berikut;
Sedangkan fungsi diskriminan dasar untuk persamaan paling atas dapat dituliskan kembali menjadi:
Mengacu pada aturan gtersebut, piksel X adalah anggota dari kelas informasi Ci, jika dan hanya jika probabilitas piksel ini untuk menjadi milik anggota kelas i lebih besar dari pada probabilitas untuk menjadi milik kelas informasi yang lain. Untuk setiap piksel pada citra masukan, nilai probabilitasnya untuk muncul disetiap kelas informasi harus dikomputasi dengan persamaan (8.12). Intensitas komputasi meningkat dengan pesat sejalan dengan penambahan ukuran citra . jika nilai probabilitas tertinggi muncul untuk menjadi anggota dua kelas informasi yang berbeda, tentunya tidak bisa diputuskan begitu saja untuk menjadi milik salah satu tanpa suatu bukti yang lengkap. Kadang kala dibuat aturan tambahan untuk menjadi milik salah satu kelas informasi tanpa suatu pedoman statistik yang jelas (bersifat arbitrary), dengan resiko bahwa hal ini menimbulkan kesalahan. Cara lain adalah membiarkan piksel semacam itu ke dalam kelas ‘tak terklasifikasi’.
Probabilitas suatu kelas untuk muncul selalu terdapat pada bagian pusat gugus. Probabilitas ini menurun selaras dengan menjauhnya jarak dari titik pusat gugus. Pada gambar 8.10 disajikan gradasi penurunan probabilitas dalam bentuk kontur ekuiprobabilitas. Seperti dijelaskan sebelumnya, piksel yang ‘jatuh’ diarea pertampalan dua kontur ekuiprobabilitas yang sama tak dapat dikelskan dengan kepastian 100%. Ada pertimbangan lain, misalnya kurva probabilitas dua penutup lahan yang terlihat dievaluasi terlebih dahulu.
Berdasarkan Gambar 8.10 terlihat bahwa kurva probabilitas dua kelas A(air) dan V (vegetasi) tersaji pada satu saluran spektral. Dua kurva distribusi probabilitas kondisional bertampalan satu dengan yang lain pada nilai piksel (BV) = 102. Piksel-piksel yang berada dibawah area bertampalan tentu sja tidak bisa begitu saja diklasifikasi ke salah satu kelas. Diperlukan kalkulasi probabilitas kondisional untuk kelas A dan V. Misalnya, probabilitas BV=102 untuk menjadi anggota kelas A dalah p(A/102), dan probabilitas BV=102 untuk menjadi anggota kelas V adalah p(V/102). Penentuan kedua probabilitas ini memerlukan nilai probabilitas untuk p(A) dan p(V), yang diasumsikan berturut-turut 0,4 dan 0,6. Selanjutnya diasumsikan bahwa probabilitas kondisional untuk menjumpai nilai 102 pada sampel-sampel A dan V adalah p(102/A)= 0,7 dan p(102/V)= 0,3, sehingga:

Dengan demikian, semua piksel dengan nilai 102 pada saluran ini akan diklasifikasikan sebagai A (air). Pada contoh ini, jumlah saluran yang digunakan adalah satu. Dalam kenyataan, jumlah saluran bisa lebih banyak, dan kalkulasi probabilitas kondisional harus mengacu pada persamaan (8.12).
Klasifikasi dengan Menggunakan Jarak Ambang
Pengambilan keputusan yang memperhatikan maximum likelihood (kemungkinan maksimum) dilakukan berdasarkan persamaan berikut (Jensen, 2005).

di mana:
D                     = jarak yang diberi bobot
c                      = suatu kelas tertentu
X                      = vektor piksel yang diklasifikasikan
Mc                          = vektor rerata sampel kelas c
ac                            = presentase probabilitas sembarang piksel untuk dapat menjadi anggota kelas c, di mana nilai default (yang ditawarkan komputer) adalah 1,0 yang berasal dari pengetahuan/informasi a priori
Covc                      = matriks kovariansi piksel-piksel pada sampel kelas c,
*Covc*                        = determinan Covc (aljabar matriks)
Covc-1                   = inversi Covc (aljabar matriks)
Ln                    = fungsi logaritma natural
T                       = fungsi transpose (aljabar matriks)    
                                                     
Malalui persamaan ini, suatu piksel akan dimasukan sebagai kelas c, apabila nilai D untuk kelas c adalah yang terendah. Secara teoretis, alogaritma kemungkinan maksimum ini akan berfungsi dengan baik, apabila bentuk histogram saluran-saluran yang dilibatkan dalam proses klasifikasi menyajikan bentuk distribusi normal karena alogaritma ini mempertimbangkan paling banyak variabel statistik dibanding yang lain. Dalam praktek, selain faktor bentuk histogramnya, bentuk gugugs-gugus sampel yang cenderung elipsoid juga akan lebih akurat apabila diklasifikasikan dengan alogaritma ini. Perlu diperhatikan bahwa sofistikasi alogaritma ini masih mengandalkan diri pada asumsu bahwa berbagai objek dapat dibedakan semata-mata berdasarkan kecenderungan spektralnya. Kenyataan menunjukan bahwa objek terlalu kompleks untuk dapat diklasifikasikan dengan asumsi ini.
Selanjutnya Gao (2010) menyatakan bahwa seperti halnya klasifikasi parametik lainnya, alogaritma klasifikasi maximum likelihood dibatasi oleh hal-hal berikut. Pertama, kalkulasi p(X/Ci) memerlukan sampel semua kelas penutup lahan yang akan dipetakan dalam bentuk distribusi normal, yang sulit dipenuhi dalam praktek. Meskipun demikian, alogaritma ini dapat menoleransi sampel yang tidak terdistribusi normal pada tingkat tertentu. Kedua, masukan nilai piksel X biasanya dikuantifikasi dalam bentuk koding 8-bit atau 256 tingkat kecerahan, dan bersifat integer. Inkompatibilitas format data muncul ketika alogaritma ini digunakan untuk memasukan data non penginderaan jauh, misalnya model elivasi digital. Ketiga, untuk mengalkulasi p(X/Ci), matriks kovariansi setiap kelas harus non-singular atau dapat diinversi. Untuk mengklasifikasi citra multispektral dengan jumlah saluran yang sangat banyak, misalnya citra hiperspektral, hal ini bisa menjadi masalah (Benediktsson et al,. 1993).
d. Alogaritma Tetangga Terdekat (K-Nearest Neighbour Algorithm)
Alogaritma klasifikasi tetangga terdekat ini dipandang sebagai salah satu variasi dari prinsip kemungkinan maksimum (maximum likelihood) non-parametrik (Mulder dan Kostwinder, 1987). Keputusan bahwa satu nilai vektor masuk pada salah satu kelas ditentukan oleh sejumlah k sampel terdekat pada feature space-nya. Biasanya k ini bernilai 3 atau 5. Oleh karena itu, alogaritma ini sering pula dipandang sebagai cara pengambilan keputusan yang ‘demokratis’. Di samping itu, alogaritma tetangga terdekat juga menggunakan suatu pendekatan nilai ambang jarak spektral pada feature space, untuk mencari sampel-sampel tetangga yang dijadikan rujukan. Nilai ambang ini disebut radius pelacakan (searching radius). Radius pelacakan ini juga menentukan fungsi penghalusan histogramnya (histogram smoothing).
                                                                     



8.2.2 Klasifikasi Tak-tersedia

 Berbeda halnya dengan klasifikasi tersedia, klasifikasi tak tersedia secara otomatis diputuskan oleh computer, tanpa campur tangan operator (kalaupun ada, proses interaksi ini sangat terbatas). Proses ini sendiri adalah suatu proses iterasi, samapai menghasilkan pengelompokan akhir gugus-gugus spectral. Campur tangan operator terutama setelah gugus-gugus spectral terbentuk, yaitu dengan menandai tiap gugus sebagai objek tertentu. Oleh karena itu, teknik klasifikasi semacam ini disebut klasifikasi a-posteriori (setelah fakta), sebagai lawan dari klasifikasi a-riori (mendahului fakta) (Robinove,1981, dalam Jensen,2005). Shrestha (1991) menyebutkan adanya tiga algoritma klasifikasi tak tersedia, yaitu jarak minimum ke pusat gugus, penggusan statistic, dan algoritma campuran. Berikut ini uraian singkat masing-masing algoritma.


 

  1. Jarak Minimum ke Pusat Gugus (Minumum Distance to Cluster Center)
Algoritma ini kadang kala disebut sebagai k-means algorithm, dan mengikuti tahap-tahap sebagai berikut. Pertama, secara bebas (arbitrarily) sioperator memasukan jumlah maksimum kelas atau gugus. Kedua, berdasarkan masukan ini, secara acak (random) computer akan menempatkan vector rerata sebagai titik-titik pusat gugus (gugus-gugusnya sendiri belum terbentuk). Ketiga, berdasarkan distribusi titik-titik pusat ini, seluruh titik piksel dihitung dan ditandai sesuai dengan nama atau urutan gugus yang terdekat jaraknya.
 Sekali gugus-gugus ini terbentuk maka terlihat bahwa titik-titik pusat (centroids) yang ditentukan secara acak tadi tidaklah tepat posisinya; sehingga computer segera menentukan titik-titik pusat baru. Begitu titik-titik pusat baru terbentuk, pembentukan gugus-gugus baru pun dimulai lagi. Begitu seterusnya, sampai akhirnya terbentuk titik-titik pusat dengan posisi akhir, dan pengelompokan akhir. Di sinilah letak proses iterasinya. Melalui proses ini, jumlah akhir gugus dapat tidak sama dengan jumlah yang diberikan oleh si operator (secara bebas) karena terjadi proses pengelompokan kembali dan sekaligus pemecahan gugus. Bila didapati suatu gugus yang hanya terdiri atas sedikit piksel maka gugus ini dapat dihilangkan dengan masukan nilai ambang tertentu.
 Untuk meningkatkan efisiensi proses klasifikasi, masuka utama dari operator yang dibutuhkan ialah: (a) jumlah maksimum kelas/gugus, (b) jarak antara 2 pusat gugus, (c) jejari (radius) gugus, dan (d) jumlah piksel minimum sebagai nilai ambang factor penghilangan gugus.
  1. Penggugusan Statistik (Statistical Clustering)
Algoritma ini menggunakan parameter statistic berupa nilai variasi (ragam) untuk menentukan homogenitas kelas atau gugus. Dengan menggunakan jendela matriks (moving window), yang biasanya berukuran 3x3, seluruh nilai piksel di bawah jendela ini diperhintungkan sampai beberapa kali jendela bergerak. Nilai ambang variasi dan berapa kali jendela bergerak di berika oleh operator. Bila nilai rerata piksel-piksel dibawah jendela ini lebih rendah daripada nilai variasinya maka nilai rerata ini menjadi pusat kelas atau gugus. Setelah semua gugus terbentuk maka penggabungan gugus berdasarkan jarak antara gugus dilakukan. Dengan demikian, algoritma ini membutuhkan masukan berupa :
a.       Jumlah gugus/kelas maksimum
b.      Nilai ambang variasi
c.       Jumlah gerakan jendela untuk setiap kali perhitungan variasi dan rerata, dan
d.      Nilai ambang jarak antara gugus.



Hasil klasifikasi ini adalah kelompok-kelompok spectral yang siap untuk diklasifikasi secara tersedia (menggunakan algoritma-algoritma pada butir 8.1.2.3).
  1. Isodata
Pada contoh-contoh terdahulu diasumsikan bahwa jumlah gugus (klaster) telah diketahui sebelumnya. ISODATA (Iterative Self-Organizing Data Analysis Technique) menggunakan formula minimal untuk pengelompokkan piksel pada citra multispectral untuk menghasilkan gugus-gugus yang relative homogen. Komputer melakukan kalkulasi nilai-nilai rerata kelas dengan mempertimbangkan distribusi nilai yang merata (evenly distributed), kemudian melakukan iterasi pembentukan gugus dengan memperhatikan nilai rerata yang baru.

Metode perhitungan yang dipakai biasanya adalah jarak minimum terhadap rerata. Melalui metode ini, pemecahan dan penggabungan kelas dilakukan secara iterative, dan juga penghapusan apabila perlu, yang kesemuanya dilandasi oleh nilai ambang yang ditentukan sebelumnya. Seluruh piksel diklasifikasikan ke kelas terdekat, kecuali ada nilai simpangan baku dan nilai ambang jarak yang ditentukan sebelumnya. Artinya, bisa saja ada piksel yang kemudian tidak terklasifikasi apabila tidak memenuhi nilai ambang yang ditentukan. Proses iterasi baru berhenti ketika jumlah maksimum iterasi dan atau nilai ambang yang ditentukan telah tercapai.

Secara prakti, analisis memasukan jumlah dan nama saluran spectral yang akan diklaasifikasi, dan berdasarkan data tersebut akan dihasilkan suatu histogram yang mempresentasikan gugus-gugus yang menyatakan frekuensi keberadaan gugus tersebut di seluruh saluran spectral yang digunakan. Analis perlu mengevaluasi grafik ini, khususnya perubahan mendadak (breaks) pada kurva yang diasumsikan mewakili setiap gugus. Setelah itu, analis menentukan jumlah gugus yang akan dihasilkan, berdasarkan perubahan-perubahan kurva utama pada histogram. Kemampuan setiap perangkat lunak untuk melibatkan jumlah saluran spectral bisa berbeda-beda. Begitu pula jumlah gugus yang dapat dihasilkan.
  1. Algoritma Campuran (Hybrid Algorithm)
Penghitungan seluruh nilai piksel pada seluruh citra tentu saja sangat menghabiskan waktu dan biaya. Oleh karena itu, algoritma campuran dikembangkan, yang hanya mempertimbangkan daerah sampel yang secara spekral, cukup mewakili daerah keseluruhan pada citra. Nantinya hasil pengelompkan spectral ini diekstra menjadi file tersendiri, dan dijadikan masukan dalam ekstrapolasi pengelompokan untuk seluruh citra. Karena di sini ada proses pengambilan bagian citra (subset) sebagai sampel maka istilah campuran (hybrid) pun lebih tepat diberikan, mengingat proses pengambilan sampel sendiri lebing sering digunakan pada algorritma klasifikasi tersedia.
8.2.3 Sentuhan Akhir dalam Klasifkasi
1. Dari Kelas Spektral ke Kelas Internasional 
Perlu pula diperhatikan bahwa hasil langsung klasifikasi multispectral ialah kelas-kelas spectral yang berhubungan dengan penutup lahan. Jumlah kelas ini biasanya cukup banyak (sering kali mencapai 30 kelas atau lebih), sesuai dengan variabilitasi spectral di daerah penelitian, dan kurang operasional untuk disajikan sebagai peta penutup lahan. Untuk menyederhanakannya, diperlukan operasi pengelompokan kembali kelas-kelas tersebut menjadi kelas generic dengan nilai piksel yang baru.
Strategi yang sangat direkomendasikan dalam pengambilan sampel atau spectral training area adalah memilih kelompok piksel yang berbeda secara spektral. Hal ini bisa indisikasikan oleh bentuk klaster atau gugusnya dalam feature space yang mengelompokkan padat, nilai simpangan baku yang relatif kecil, warna yang homogen dalam tampilan citra komposit, serta nilai keterpisahan (separability index) dengan sampel lain yang juga besar apabila perangkat lunak yang digunakan mempunyai fasilitas untuk melakukan komputasi parameter ini. Dengan demikian, hasil eksekusi klasifikasi multispektral bisa merupakan peta kelas-kelas spektral yang labelnya kadang-kadang kurang bermakna secara praktis.misalnya ̋air_ 1”, air_2”,dan tanah lembab_1”, vegetasi mangrove , dan seterusnya. Nama-nama ini diberikan sesuai dengan banyaknya variasi spektral kenampakan objek pada citra, meskipun secara umum analis masih mengelompokkannya kedalam kategori umum yang sama.
Hasil klasifikasi secara langsung ini kemudian masih perlu diproses lebih lanjut melalui penggabungan kelas (class merging atau class regrouping). Proses penggabungan ini tidak bisa dilakukan pada saat pengambilan sampel karena akan mengakibatkan perubahan signifikan terhadap parameter statistik citra. Misalnya, piksel-piksel yang mewakili vegetasi kerapatan rendah perlu disampel dan dikelaskan menjadi tiga kelompok,  yaitu vegetasi_jarang_2, dan vegetasi_jarang_3 karena ketiganya tumbuh pada latar belakang tanahn yang berbeda misalnya berturut-turut tanah lembap berwarna merah cokelat, tanah kering berwarna hitam, dan tanah kering berwarna kelabu cerah. Ketiga sampel ini bisa mempunyai nilai rerata dan simpangan baku yang jauh berbeda pada beberapa saluran sehingga penggabungan sampel menjadi satu nama baru vegetasi jarang akan berakibat pada perubahan nilai rerata dan simpangan baku secara signifikan, dan bisa mengakibatkan kemunculan parameter statistik baru yang tidak mewakili ketiga sampel asli.
2. Generalisasi Hasil Klasifikasi melalui Pemfilteran Mayoritas
Hasil klarifikasi multispektral, baik secara tersedia maupun tidak menyatakan distribusi spasial objek pada daerah penelitian. Tiap objek diwakili oleh suatu nilai dan ditampilkan sebagai warna tertentu, nilai disini sudah bukan lagi ekspresi respon spektral objek melainkan urutan pemberian tanda pada waktu pengambilan samapel. Dengan kata lain, nilai 1,2,3,... tidak dapat lagi dipandang sebagai data rasio ataupun interval, melainkan sebagai data nominal atau label. Beberapa perangkat lunak sudah justru menggunakan label nama kelas, dan bukan nilai piksel untuk berkomunikasi dengan pengguna perangkat lunaknya , meskipun sebenarnya basis tautan antara piksel dengan atribut nama kelas tetaplah nilai piksel.
Disisi lain, hasil klasifikasi multispektral sering menghasilkan piksel-piksel terasing  (satu atau dua piksel) di tengah piksel-piksel homogen, misalnya piksel berlabel hutan ditengah piksel-piksel berlabel air laut. Cara menghilangkan piksel-piksel terasing ini ialah dengan filter mayoritas (lihat bab 6). Melalui jendela matrix 3x3,5x5, atau 7x7 piksel-piksel yang ada dibawah jendela ini diperhitungkan dan lihat modusnya. Untuk jendela 3x3, sejumlah 6 piksel dengan nilai sama sudah dapat dipandang sebagai modus (nilai yang paling sering muncul dijadikan masukan dalam ekstrapolasi pengelompokan untuk seluruh citra. Karena disini ada proses pengambilan bagian citra (subset) sebagai sampel maka istilah campuran (hybrid) pun lebih tepat diberikan, mengingat proses pengambilan sampel sendiri lebih sering digunakan pada algoritma klasifikasi tersedia.
8.2.3 sentuhan akhir dalam klasifikasi
1. dari kelas spektral ke kelas informasional
Perlu pula diperhatikan bahwa hasil langsung klasifikasi multispketral ialah kelas-kelas spektral yang berhubungan dengan penutup lahan. Jumlah kelas ini biasanya cukup banyak (seringkali mencapai 30 kelas atau lebih), sesuai dengan variabilitas spektral di daerah penelitian, dan kurang operasional untuk disajikan sebagai peta penutup lahan. Untuk menyederhanakannya, diperlukan operasi pengelompokan kembali kelas-kelas tersebut menjadi kelas generik dnegan nilai piksel yang baru.
Strategi yang sangat direkomendasikan dalam pengambilan sampel atau spectral training area adalah memilih kelompok piksel yang berbeda secara spektral. Hal ini bisa diindikasikan oleh bentuk klaster atau gugusnya dalam  feature space yang mengelompok padat, nilai simpangan baku yang relatif kecil, warna yang homogen dalam tampilan citra komposit, serta nilai keterpisahan (separability indeks) dengan sampel lain yang juga besar apabila perangkat lunak yang digunakan mempunyai fasilitas untuk melakukan komputasi parameter ini. Dengan demikian, hasil eksekusi klasifikasi multispektral bisa merupakan peta kelas-kelas spektral yang labelnya kadang-kadang kurang bermakna secara praktis, misalnya “air_1”, “air_2”, “tanah_lembab_1”, “vegetasi_mangrove_2”, dan seterusnya. Nama-nama ini diberikan sesuai dengan banyaknya variasi spektral kenampakan objek pada citra, meskipun secara umum analis masih mengelompokannya kedalam kategori umum yang sama.
Hasil klasifikasi secara langsung dan masih diproses lebih lanjut melalui penggabungan yang tidak bisa dilakukan pada saat proses penggabungan yang akan mengakibatkan perubahan signifikan terhadap parameter statistik citra. 
 
8.3  penilaian akurasi hasil klasifikasi
 
Telah dikemukakan dalam bab 5 bahwa data spasial dapat diukur kualitas dan hal ini telah menjadi salah satu kebutuhan utama dalam operasiionalisasi sistem informasi geografi kebutuhan akan kualitas data spasial beserta kriteria penentuan desertasi dan standar smakin terasa ketika permodelan masukan dari berbagai sumber. 




DAFTAR PUSTAKA



Danoedoro,Projo. Penagantar Penginderaan Jauh
Digital .-Ed.1.-Yogyakarta: ANDI.2012