24 Februari 2011

Image / Video Compression berbasis Discrete Cosine Transform

Bismillahirrohmanirrohim

Beberapa waktu lalu, saya disibukkan oleh kompetisi LSI Design Contest 2011 (http://lsi-contest.com) tentang image/video compression menggunakan Discrete Cosine Transform. Sedikit saya ingin berbagi di sini :). Alhamdulillah desain yang saya buat berjalan dengan baik sesuai dengan target yang diharapkan, yaitu kecil, cepat, dan berkompleksitas rendah. Ini tentunya bukan desain standar yang biasa ada di textbook, namun sudah dimodifikasi sedemikian rupa sehingga target tersebut tercapai. Baik dengan cara implementasi algoritma yang saya buat maupun optimasi sirkuit dari penurunan rumus DCT. Sayangnya, karena aplikasi serial yang dibuat boleh teman saya belum 100% selesai, alhasil belum berhasil lolos ke final :D di Okinawa. Tapi alhamdulillah ITB tetap punya wakil yang dikirim ke final yang tentunya telah lengkap dengan aplikasinya (selamat buat tim Putra Ganesha dan Oasis). Mungkin sedikit saya tidak akan mengulas masalah teknis dan matematis dari lomba ini, tapi lebih kepada prinsip kompresinya.

Kompresi yang dilakukan menggunakan prinsip Discrete Cosine Transform (DCT). DCT adalah teknik transformasi data dari domain spasial menjadi domain frekuensi. Lalu, dari prinsip itu, kita akan dapatkan  data dengan basis frekuensi yang bisa dimodifikasi untuk merepresentasikan kompresi data. Prinsipnya adalah dengan menghilangkan informasi dari gambar namun tidak sensitif pada penglihatan mata manusia. Maksudnya, dalam suatu gambar, terdapat kemungkinan ditemukannya komponen warna yang berfrekuensi tinggi hingga rendah. Secara umum, gambar frekuensi tinggi memiliki ukuran yang besar dibandingkan frekuensi rendah. Namun, junstru frekuensi tinggi ini secara umum sulit dinotifikasi oleh mata manusia, alhasil dengan membuang komponen frekuensi tinggi ini secara umum tidaklah mengganggu kualitas gambar di penglihatan mata kita. Mau bukti?

Berikut ini adalah hasil kompresi gambar yang didapatkan dari proses kompresi menggunakan desain "shoft chip" kami, dilengkapi pula dengan perbandingan terhadap desain standar DCT:


Di sini, kualitas gambar ditentukan dari PSNR (Peak Signal to Noise Ratio) dan MSE (Mean Square Error). Semakin baik kualitas gambar kompresi, maka PSNR semakin tinggi dan MSE semakin rendah. PSNR untuk gambar ini sekitar 40dB dan hanya bernilai 4 untuk MSE. Lumayan lah ya :D..

Quiz :
Bisa menotifikasi perubahan yang terjadi? Padahal kompresinya hingga 50% lho. File asli 78Kb, file terkompresi 38Kb :D.

Matematika memang keren. Terima kasih ya Rabb yang mengajarkan matematika pada kami :) sehingga bisa dimanfaatkan untuk kebaikan peradaban manusia. Aamiin...


3 respon:

ichwan mengatakan...

bgus juga hasil kompress nya. Memang hampir tidak terdefenisi di mata hasilnya..

Salam kenal ya..

Rachavidya mengatakan...

Salam kenal jg :)

rioseto mengatakan...

he.he.. bagusnya matematika, buruknya teknologi; kalau saja media pembawa informasinya itu photon, dan bukan elektron, sepertinya tak perlu kompresi, deh.

salam, rs

Recent Comments

Powered by Blogger Widgets