Rabu, 31 Oktober 2012

COMPUTER VISION


Pengertian
Computer vision merupakan proses otomatis yang mengintegrasikan sejumlah besar proses untuk persepsi visual, seperti akuisisi citra, pengolahan citra, pengenalan dan membuat keputusan. Computer vision mencoba meniru cara kerja sistem visual manusia (human vision) yang sesungguhnya sangat kompleks. Untuk itu, computer vision diharapkan memiliki kemampuan tingkat tinggi sebagaimana human visual.
Kemampuan itu diantaranya adalah:
  • Object detection → Apakah sebuah objek ada pada scene? Jika begitu, dimana batasan-batasannya..?
  • Recognation → Menempatkan label pada objek.
  • Description → Menugaskan properti kepada objek.
  • 3D Inference → Menafsirkan adegan 3D dari 2D yang dilihat.
  • Interpreting motion → Menafsirkan gerakan.
Computer Vision sering didefinisikan sebagai salah satu cabang ilmu pengetahuan yang mempelajari bagaimana komputer dapat mengenali obyek yang diamati/ diobservasi. Cabang ilmu ini bersama intelijensia semu (Artificial Intelligence) akan mampu menghasilkan sistem intelijen visual (Visual Intelligence System).
Computer Vision adalah kombinasi antara Pengolahan Citra dan Pengenalan Pola.
  • Pengolahan Citra (Image Processing) merupakan bidang yang berhubungan dengan proses transformasi citra/gambar (image). Proses ini bertujuan untuk mendapatkan kualitas citra yang lebih baik.
Sedangkan,
  • Pengenalan Pola (Pattern Recognition), bidang ini berhubungan dengan proses identifikasi obyek pada citra atau interpretasi citra. Proses ini bertujuan untuk mengekstrak informasi/pesan yang disampaikan oleh gambar/citra.

Hirarki pada Computer Vision
Hirarki pada computer vision ada 3 tahap, yaitu:
  • Pengolahan Tingkat Rendah (Image to image) → Menghilangkan noise, dan peningkatan gambar (enchament image).
  • Pengolahan  Tingkat Menengah (Image to dimbolic) → Kumpulan garis / vektor yang merepresentasikan batas sebuah obyek pada citra.
  • Pengolah Tingkat Tinggi (Simbolic to simbolic) → Representasi simbolik batas-batas obyek menghasilkan nama obyek tersebut.

Tahapan proses dalam Computer Vision
Sebuah komputer yang menyerupai kemampuan manusia dalam menangkap sinyal visual (human sight) dilakukan dalam empat tahapan proses dasar :
  • Proses penangkapan citra/gambar (image acquisition),
  • Proses pengolahan citra (image processing),
  • Analisa data citra (image analysis) dan
  • Proses pemahaman data citra (image understanding)

1.     Image Acqusition
  • Image Acqusition pada manusia dimulai dengan mata, kemudian informasi visual diterjemahkan ke dalam suatu format yang kemudian dapat dimanipulasi oleh otak.
  • Senada dengan proses di atas, computer  vision membutuhkan sebuah mata untuk menangkap sebuah sinyal visual.
  • Umumnya mata pada computer vision adalah sebuah kamera video.
  • Kamera menerjemahkan sebuah scene atau image
  • Kemudian sinyal listrik ini diubah menjadi bilangan biner yang akan digunakan oleh komputer untuk pemrosesan.
  • Keluaran dari kamera adalah berupa sinyal analog, dimana frekuensi dan amplitudonya (frekuensi berhubungan dengan jumlah sinyal dalam satu detik, sedangkan amplitudo berkaitan dengan tingginya sinyal listrik yang dihasilkan) merepresentasikan detail ketajaman (brightness) pada scene.
  • Kamera mengamati sebuah kejadian pada satu jalur dalam satu waktu, memindainya dan membaginya menjadi ratusan garis horizontal yang sama.
  • Tiap‐tiap garis membuat sebuah sinyal analog yang amplitudonya menjelaskan perubahan brightness sepanjang garis sinyal tersebut.
  • Karena komputer tidak bekerja dengan sinyal analog, maka sebuah analog‐to‐digital converter (ADC), dibutuhkan untuk memproses semua sinyal tersebut oleh komputer.
  • ADC ini akan mengubah sinyal analog yang direpresentasikan dalam bentuk informasi sinyal tunggal ke dalam sebuah aliran (stream) sejumlah bilangan biner.
  • Bilangan biner ini kemudian disimpan di dalam memori dan akan menjadi data rawyang akan diproses.
2.     Image Processing
  • Tahapan berikutnya computer vision akan melibatkan sejumlah manipulasi utama (initial manipulation) dari data binary tersebut.
  • Image processing membantu peningkatan dan perbaikan kualitas image, sehingga dapat dianalisa dan diolah lebih jauh secara lebih efisien.
  • Imagge processing akan meninggkatkan perbandingan sinyal terhadap noise (signal‐to‐noise ratio = s/n).
  • Sinyal‐sinyal tersebut adalah informasi yang akan merepresentasikan objek yang ada dalam image.
  • Sedangkan noise adalah segala bentuk interferensi, kekurang pengaburan, yang terjadi pada sebuah objek.
3.     Image Analysis
  • Image analysis akan mengeksplorasi scene ke dalam bentuk karateristik utama dari objek melalui suatu proses investigasi.
  • Sebuah program komputer akan mulai melihat melalui bilangan biner yang merepresentasikan informasi visual untuk mengidentifikasi fitur-fitur spesifik dan karakteristiknya.
  • Lebih khusus lagi program image analysis digunakan untuk mencari tepi dan batas‐batasan objek dalam image.
  • Sebuah tepian (edge) terbentuk antara objek dan latar belakangnya atau antara dua objek yang spesifik.
  • Tepi ini akan terdeteksi sebagai akibat dari perbedaan level brightness pada sisi yang berbeda dengan salah satu batasnya.
4.     Image Understanding
  • Ini adalah langkah terakhir dalam proses computer vision, yang mana spesifik objek dan hubungannya diidentifikasi.
  • Pada bagian ini akan melibatkan kajian tentang teknik‐teknik artificial intelligent.
  • Understanding berkaitan dengn template matching yang ada dalam sebuah scene.
  • Metoda ini menggunakan program pencarian (search program) dan teknik penyesuaian pola (pattern matching techniques).

Aplikasi Computer Vision
Sebagai teknologi disiplin, visi komputer berusaha untuk menerapkan teori dan model untuk pembangunan sistem visi komputer.
Aplikasi pada visi komputer mencakup berbagai macam sistem, yaitu:
  1. Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom).
  2. Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung).
  3. Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar urutan).
  4. Modeling benda atau lingkungan (misalnya, industri inspeksi, analisis gambar medis / topografis).
  5. Interaksi (misalnya, sebagai input ke perangkat untuk interaksi manusia komputer).
  6. Sub-domain visi komputer meliputi adegan rekonstruksi, acara deteksi, pelacakan video, pengenalan obyek, belajar, pengindeksan, gerak estimasi, dan gambar restorasi.

Tidak ada komentar:

Posting Komentar