• 08.00 s/d 20.45

Salah satu jenis AI yang paling kuat dan menarik adalah computer vision yang hampir pasti Anda alami dalam berbagai cara tanpa Anda sadari. Berikut adalah apa itu, bagaimana cara kerjanya, dan mengapa itu sangat mengagumkan (dan hanya akan menjadi lebih baik).

computer vision adalah bidang ilmu komputer yang berfokus pada replikasi bagian dari kompleksitas sistem penglihatan manusia dan memungkinkan komputer mengidentifikasi dan memproses objek dalam gambar dan video dengan cara yang sama seperti yang dilakukan manusia. Sampai saat ini, computer vision hanya berfungsi dalam kapasitas terbatas.

computer vision dalam Tindakan


Berkat kemajuan dalam artificial intelligence dan inovasi dalam pembelajaran mendalam dan jaringan saraf, bidang ini telah mampu melakukan lompatan besar dalam beberapa tahun terakhir dan telah mampu melampaui manusia dalam beberapa tugas yang berkaitan dengan pendeteksian dan pelabelan objek.

Salah satu faktor pendorong tumbuhnya computer vision adalah jumlah data yang kami hasilkan hari ini yang kemudian digunakan untuk melatih dan menjadikan computer vision lebih baik.

Deteksi dan Klasifikasi Multi-Objek YOLO.

Bagaimana Cara Kerja computer vision?

Salah satu pertanyaan terbuka utama dalam Ilmu Saraf dan Pembelajaran Mesin adalah: Bagaimana tepatnya cara kerja otak kita, dan bagaimana kita dapat memperkirakannya dengan algoritme kita sendiri? Kenyataannya adalah bahwa hanya ada sedikit teori perhitungan otak yang bekerja dan komprehensif; jadi terlepas dari fakta bahwa Neural Nets seharusnya "meniru cara kerja otak", tidak ada yang yakin apakah itu benar.

Paradoks yang sama berlaku untuk computer vision — karena kita tidak memutuskan bagaimana otak dan mata memproses gambar, sulit untuk mengatakan seberapa baik algoritme yang digunakan dalam produksi mendekati proses mental internal kita sendiri.

Pada tingkat tertentu, computer vision adalah tentang pengenalan pola. Jadi salah satu cara untuk melatih komputer bagaimana memahami data visual adalah dengan memberinya gambar, banyak gambar ribuan, jutaan jika mungkin yang telah diberi label, dan kemudian tunduk pada berbagai teknik perangkat lunak, atau algoritme, yang memungkinkan komputer untuk memburu. pola di semua elemen yang berhubungan dengan label tersebut.

Jadi, misalnya, jika Anda memberi komputer satu juta gambar kucing semuanya akan tunduk pada algoritme yang memungkinkan mereka menganalisis warna di foto, bentuk, jarak antar bentuk, di mana objek berbatasan satu sama lain, dan seterusnya, sehingga mengidentifikasi profil dari arti "kucing". Setelah selesai, komputer akan dapat menggunakan pengalamannya untuk menemukan gambar kucing.


Di bawah ini adalah ilustrasi sederhana buffer gambar skala abu-abu yang menyimpan gambar Abraham Lincoln kami. Kecerahan setiap piksel diwakili oleh angka 8-bit tunggal, yang berkisar dari 0 (hitam) hingga 255 (putih):

Diagram data piksel. Di sebelah kiri, gambar kami tentang Lincoln; di tengah, piksel diberi label dengan angka dari 0–255, mewakili kecerahannya; dan di sebelah kanan, angka-angka ini sendiri. 


{157, 153, 174, 168, 150, 152, 129, 151, 172, 161, 155, 156,

155, 182, 163, 74, 75, 62, 33, 17, 110, 210, 180, 154,

180, 180, 50, 14, 34, 6, 10, 33, 48, 106, 159, 181,

206, 109, 5, 124, 131, 111, 120, 204, 166, 15, 56, 180,

194, 68, 137, 251, 237, 239, 239, 228, 227, 87, 71, 201,

172, 105, 207, 233, 233, 214, 220, 239, 228, 98, 74, 206,

188, 88, 179, 209, 185, 215, 211, 158, 139, 75, 20, 169,

189, 97, 165, 84, 10, 168, 134, 11, 31, 62, 22, 148,

199, 168, 191, 193, 158, 227, 178, 143, 182, 106, 36, 190,

205, 174, 155, 252, 236, 231, 149, 178, 228, 43, 95, 234,

190, 216, 116, 149, 236, 187, 86, 150, 79, 38, 218, 241,

190, 224, 147, 108, 227, 210, 127, 102, 36, 101, 255, 224,

190, 214, 173, 66, 103, 143, 96, 50, 2, 109, 249, 215,

187, 196, 235, 75, 1, 81, 47, 0, 6, 217, 255, 211,

183, 202, 237, 145, 0, 0, 12, 108, 200, 138, 243, 236,

195, 206, 123, 207, 177, 121, 123, 200, 175, 13, 96, 218};


Cara menyimpan data gambar ini mungkin bertentangan dengan harapan Anda, karena datanya pastimuncul menjadi dua dimensi ketika ditampilkan. Namun, inilah masalahnya, karena memori komputer hanya terdiri dari daftar ruang alamat linier yang terus bertambah.

Bagaimana piksel disimpan dalam memori. 

Mari kembali ke gambar pertama lagi dan bayangkan menambahkan yang berwarna. Sekarang segalanya mulai menjadi lebih rumit. Komputer biasanya membaca warna sebagai rangkaian 3 nilai — merah, hijau, dan biru (RGB) — pada skala 0–255 yang sama. Sekarang, setiap piksel sebenarnya memiliki 3 nilai untuk disimpan komputer selain posisinya. Jika kita mewarnai Presiden Lincoln, itu akan menghasilkan nilai 12 x 16 x 3, atau 576 angka.


Itu membutuhkan banyak memori untuk satu gambar, dan banyak piksel untuk iterasi algoritme. Tetapi untuk melatih model dengan akurasi yang berarti terutama ketika Anda berbicara tentang Deep Learning, Anda biasanya membutuhkan puluhan ribu gambar, dan semakin banyak semakin baik.

Berapa Lama Dibutuhkan Untuk Menguraikan Gambar

Singkatnya tidak banyak dan akan semakin cepat. Padahal di masa lalu bahkan superkomputer mungkin membutuhkan waktu berhari-hari atau berminggu-minggu atau bahkan berbulan-bulan untuk menyelesaikan semua perhitungan yang diperlukan, chip ultra cepat saat ini dan perangkat keras terkait, bersama dengan internet yang cepat dan andal dan jaringan cloud, buat prosesnya secepat kilat. Salah satu faktor krusial adalah kesediaan banyak perusahaan besar yang melakukan penelitian AI untuk berbagi pekerjaan mereka Facebook, Google, IBM, dan Microsoft, terutama dengan membuka sumber beberapa pekerjaan pembelajaran mesin mereka.

Hal ini memungkinkan orang lain untuk membangun pekerjaan mereka daripada memulai dari awal. Akibatnya, industri AI ikut berkembang, dan eksperimen yang baru-baru ini membutuhkan waktu berminggu-minggu untuk dijalankan mungkin memerlukan waktu 15 menit hari ini. Dan untuk banyak aplikasi computer vision dunia nyata, semua proses ini terjadi terus menerus dalam mikrodetik, sehingga komputer saat ini mampu menjadi apa yang oleh para ilmuwan disebut "sadar situasi".

Aplikasi Computer Vision

computer vision adalah salah satu area dalam Pembelajaran Mesin di mana konsep inti telah diintegrasikan ke dalam produk utama yang kami gunakan setiap hari.

CV Dalam Mobil yang Mengemudi Sendiri

Namun bukan hanya perusahaan teknologi yang memanfaatkan Pembelajaran Mesin untuk aplikasi gambar.

computer vision memungkinkan mobil self-driving untuk memahami lingkungan sekitar mereka. Kamera menangkap video dari berbagai sudut di sekitar mobil dan memasukkannya ke perangkat lunak penglihatan komputer, yang kemudian memproses gambar secara real-time untuk menemukan ekstremitas jalan, membaca rambu lalu lintas, mendeteksi mobil lain, objek, dan pejalan kaki. Mobil self-driving kemudian dapat mengarahkan jalannya di jalan dan jalan raya, menghindari menabrak rintangan, dan (semoga) dengan aman mengantarkan penumpangnya ke tempat tujuan.

CV Dalam Pengenalan Wajah

computer vision juga memainkan peran penting dalam aplikasi pengenalan wajah, teknologi yang memungkinkan komputer mencocokkan gambar wajah orang dengan identitasnya. Algoritme computer vision mendeteksi fitur wajah dalam gambar dan membandingkannya dengan basis data profil wajah. Perangkat konsumen menggunakan pengenalan wajah untuk mengautentikasi identitas pemiliknya. Aplikasi media sosial menggunakan pengenalan wajah untuk mendeteksi dan menandai pengguna. Lembaga penegak hukum juga mengandalkan teknologi pengenalan wajah untuk mengidentifikasi penjahat di umpan video.

CV Dalam augmented reality & mixed reality

computer vision juga memainkan peran penting dalam augmented reality dan mixed reality, teknologi yang memungkinkan perangkat komputasi seperti ponsel cerdas, tablet, dan kacamata pintar melapisi dan menyematkan objek virtual pada citra dunia nyata. Menggunakan computer vision, perangkat AR mendeteksi objek di dunia nyata untuk menentukan lokasi pada tampilan perangkat untuk menempatkan objek virtual. Misalnya, algoritme computer vision dapat membantu aplikasi AR mendeteksi bidang seperti permukaan meja, dinding, dan lantai, bagian yang sangat penting untuk menetapkan kedalaman dan dimensi serta menempatkan objek virtual di dunia fisik.

CV Dalam Kesehatan

computer vision juga telah menjadi bagian penting dari kemajuan teknologi kesehatan. Algoritme computer vision dapat membantu mengotomatiskan tugas-tugas seperti mendeteksi tahi lalat kanker pada gambar kulit atau menemukan gejala pada pemindaian x-ray dan MRI.



Banyak aplikasi computer vision populer melibatkan upaya untuk mengenali hal-hal dalam foto; Misalnya:

  • Klasifikasi Objek: Kategori objek apa yang ada di foto ini?

  • Identifikasi Objek: Jenis objek apa yang ada di foto ini?

  • Verifikasi Objek: Apakah objek dalam foto?

  • Deteksi Objek: Di manakah objek-objek dalam foto itu?

  • Deteksi Landmark Objek: Apa poin kunci untuk objek dalam foto?

  • Segmentasi Objek: Apa piksel milik objek dalam gambar?

  • Pengenalan Objek: Benda apa yang ada di foto ini dan di mana letaknya?

Di luar pengakuan saja, metode analisis lainnya meliputi:

  • Analisis gerakan videomenggunakan penglihatan komputer untuk memperkirakan kecepatan objek dalam video, atau kamera itu sendiri.

  • Di dalam segmentasi gambar, algoritme mempartisi gambar menjadi beberapa set tampilan.

  • Rekonstruksi adegan membuat model 3D dari sebuah adegan yang diinput melalui gambar atau video.

  • Di dalam pemulihan citra, noise seperti blur dihapus dari foto menggunakan filter berbasis Machine Learning.

Aplikasi lain apa pun yang melibatkan pemahaman piksel melalui perangkat lunak dapat dengan aman diberi label sebagai computer vision.




sumber : https://towardsdatascience.com/everything-you-ever-wanted-to-know-about-computer-vision-heres-a-look-why-it-s-so-awesome-e8a58dfb641e



 Copyright stekom.ac.id 2018 All Right Reserved