• 08.00 s/d 20.45

Ada banyak hal yang dapat dipelajari saat Anda mengawasi bisnis: misalnya, mobilitas pelanggan di toko dan produk yang mereka lihat, proses produksi, atau stok yang perlu ditambahkan. Secara manusiawi, kita tidak dapat mengawasi bisnis terus-menerus. Di sinilah computer vision berperan.

Pencitraan komputer menggabungkan kamera, komputasi edge, komputasi berbasis cloud, perangkat lunak, dan artificial intelligence (AI) untuk membantu sistem “melihat” dan mengidentifikasi objek. Dengan computer vision, perusahaan dalam berbagai ukuran dapat mengerahkan AI di perangkat edge (seperti kamera), server edge, atau cloud, sehingga computer vision dapat dimanfaatkan di berbagai lingkungan seperti mengenali objek dan orang dengan cepat, menganalisis demografi khalayak, memeriksa hasil produksi, juga banyak hal lainnya.


Apa itu Computer vision?

Computer vision memanfaatkan kecerdasan buatan (AI) untuk memungkinkan komputer memperoleh data yang bermakna dari input visual seperti foto dan video. Wawasan yang diperoleh dari computer vision kemudian digunakan untuk mengambil tindakan otomatis. Sama seperti AI yang memberi komputer kemampuan untuk 'berpikir', computer vision memungkinkan mereka untuk 'melihat'.

Sebagai manusia, kita biasanya menghabiskan hidup kita mengamati sekeliling kita menggunakan saraf optik, retina, dan korteks visual. Kami mendapatkan konteks untuk membedakan antara objek, mengukur jaraknya dari kami dan objek lain, menghitung kecepatan gerakannya, dan menemukan kesalahan. Demikian pula, computer vision memungkinkan mesin bertenaga AI melatih diri mereka sendiri untuk melakukan proses ini. Mesin ini menggunakan kombinasi kamera, algoritme, dan data untuk melakukannya.

Namun, tidak seperti manusia, komputer tidak cepat lelah. Anda dapat melatih mesin yang didukung oleh computer vision untuk menganalisis ribuan aset produksi atau produk dalam hitungan menit. Hal ini memungkinkan pabrik produksi untuk mengotomatiskan pendeteksian cacat yang tidak dapat dilihat oleh mata manusia.

Computer vision membutuhkan database besar agar benar-benar efektif. Ini karena solusi ini menganalisis informasi berulang kali hingga mereka mendapatkan setiap kemungkinan wawasan yang diperlukan untuk tugas yang diberikan. Misalnya, komputer yang dilatih untuk mengenali tanaman sehat perlu 'melihat' ribuan input referensi visual tanaman, lahan pertanian, hewan, dan objek terkait lainnya. Hanya dengan begitu ia akan secara efektif mengenali berbagai jenis tanaman yang sehat, membedakannya dari tanaman yang tidak sehat, mengukur kualitas lahan pertanian, mendeteksi hama dan hewan lain di antara tanaman, dan seterusnya.

Dua teknologi utama yang mendorong computer vision: convolutional neural network dan deep learning, sejenis pembelajaran mesin. Machine learning (ML) memanfaatkan model berbasis algoritme untuk memungkinkan komputer mempelajari konteks melalui analisis data visual. Setelah data yang memadai diberikan kepada model, model akan dapat 'melihat gambaran besarnya' dan membedakan antara input visual. Alih-alih diprogram untuk mengenali dan membedakan gambar, mesin menggunakan algoritme AI untuk belajar secara mandiri.

Jaringan neural konvolusional membantu model ML melihat dengan memfraksinasi gambar menjadi piksel. Setiap piksel diberi label atau tag. Label ini kemudian secara kolektif digunakan untuk melakukan konvolusi, sebuah proses matematis yang menggabungkan dua fungsi untuk menghasilkan fungsi ketiga. Melalui proses ini, jaringan saraf convolutional dapat memproses input visual.

Untuk melihat gambar seperti yang dilakukan manusia, jaringan saraf mengeksekusi konvolusi dan memeriksa keakuratan keluaran dalam banyak iterasi. Sama seperti manusia yang membedakan objek yang jauh, jaringan saraf convolutional dimulai dengan mengidentifikasi bentuk yang belum sempurna dan tepi yang keras. Setelah ini selesai, model menambal celah dalam datanya dan mengeksekusi iterasi outputnya. Ini berlangsung sampai keluaran secara akurat 'memprediksi' apa yang akan terjadi.

Sementara jaringan saraf convolutional memahami gambar tunggal, jaringan saraf berulang memproses input video untuk memungkinkan komputer 'mempelajari' bagaimana serangkaian gambar berhubungan satu sama lain.


Contoh Computer vision

Di bawah ini adalah lima contoh utama computer vision yang menunjukkan potensi solusi bertenaga AI ini untuk merevolusi seluruh industri .

  1. Google Translate

Pada tahun 2015, pemimpin teknologi Google meluncurkan layanan terjemahan instan yang memanfaatkan computer vision melalui kamera smartphone. Neural Machine Translation, sistem utama yang mendorong terjemahan berbasis computer vision yang instan dan akurat, dimasukkan ke dalam hasil web Google Terjemahan pada tahun 2016. 

Saat aplikasi dibuka di perangkat berkemampuan internet dengan kamera, kamera mendeteksi teks apa pun di dunia nyata. Aplikasi kemudian secara otomatis mendeteksi teks dan menerjemahkannya ke dalam bahasa pilihan pengguna. Misalnya, seseorang dapat mengarahkan kameranya ke papan reklame atau poster yang memiliki teks dalam bahasa lain dan membaca apa yang tertulis dalam bahasa pilihannya di layar ponsel cerdasnya.

Selain Terjemahan, Google juga menggunakan computer vision dalam layanan Lens-nya. Kedua layanan tersebut mampu menerjemahkan lebih dari 100 bahasa secara instan. Layanan terjemahan Google sudah menguntungkan pengguna di seluruh Asia, Afrika, dan Eropa, dengan banyak bahasa terkonsentrasi di wilayah geografis yang relatif kecil.

Selama beberapa tahun terakhir, lebih dari separuh bahasa perangkat terjemahan Google telah tersedia untuk penggunaan luring. Dengan demikian, tidak diperlukan koneksi jaringan untuk terjemahan bertenaga jaringan saraf ini.

  1. Facebook 3D Photo

Tak ketinggalan, raksasa teknologi Meta (sebelumnya dikenal sebagai Facebook) juga berkecimpung dalam computer vision untuk berbagai aplikasi seru. Salah satu kegunaannya adalah konversi gambar 2D menjadi model 3D.

Diluncurkan pada tahun 2018, Facebook 3D Photo awalnya membutuhkan smartphone dengan kamera ganda untuk menghasilkan gambar 3D dan membuat peta kedalaman. Meskipun hal ini awalnya membatasi popularitas fitur ini, ketersediaan luas ponsel kamera ganda dengan harga ekonomis telah meningkatkan penggunaan fitur yang didukung computer vision ini.

Foto 3D mengubah foto dua dimensi biasa menjadi gambar 3D. Pengguna dapat memutar, memiringkan, atau menggulir pada smartphone mereka untuk melihat gambar-gambar ini dari perspektif yang berbeda. Pembelajaran mesin digunakan untuk ekstrapolasi bentuk 3D dari objek yang digambarkan dalam gambar. Melalui proses ini, efek 3D yang tampak realistis diterapkan pada gambar.

Kemajuan dalam algoritme computer vision yang digunakan oleh Meta telah memungkinkan fitur Foto 3D diterapkan ke gambar apa pun. Saat ini, seseorang dapat menggunakan ponsel Android atau iOS kelas menengah untuk mengubah gambar berusia puluhan tahun menjadi 3D, menjadikan fitur ini populer di kalangan pengguna Facebook.

Meta bukan satu-satunya perusahaan yang mengeksplorasi penerapan computer vision dalam konversi gambar 2D ke 3D. DeepMind yang didukung Google dan pemimpin pasar GPU Nvidia sama-sama bereksperimen dengan sistem AI yang memungkinkan komputer untuk melihat gambar dari berbagai sudut, mirip dengan yang dilakukan manusia.

  1. YOLO

YOLO, singkatan dari You Only Look Once, adalah model deteksi objek terlatih yang memanfaatkan pembelajaran transfer. Anda dapat menggunakannya untuk berbagai aplikasi, termasuk menegakkan pedoman jarak sosial.

Sebagai solusi computer vision, algoritma YOLO dapat mendeteksi dan mengenali objek dalam input visual secara real-time. Ini dicapai dengan menggunakan jaringan saraf konvolusional yang dapat memprediksi kotak pembatas yang berbeda dan probabilitas kelas secara bersamaan.

Sesuai dengan namanya, YOLO dapat mendeteksi objek dengan mengirimkan gambar melalui jaringan saraf hanya sekali. Algoritme menyelesaikan prediksi untuk seluruh gambar dalam satu kali algoritma dijalankan. Itu juga mampu 'mempelajari' hal-hal baru dengan cepat dan efektif, menyimpan data pada representasi objek dan memanfaatkan informasi ini untuk deteksi objek.

Menegakkan langkah-langkah jarak sosial selama puncak pandemi COVID-19 sangat penting namun sangat sulit untuk yurisdiksi dengan sumber daya terbatas dan populasi besar. Untuk mengatasi masalah ini, pihak berwenang di beberapa bagian dunia mengadopsi solusi computer vision seperti YOLO untuk mengembangkan alat jarak sosial.

YOLO dapat melacak orang-orang dalam wilayah geografis tertentu dan menilai apakah norma jarak sosial dipatuhi. Ini menerapkan prinsip deteksi dan pelacakan objek secara real-time untuk mendeteksi pelanggaran jarak sosial dan memperingatkan otoritas terkait.

Dalam praktiknya, YOLO bekerja dengan menangkap setiap orang yang hadir dalam input visual dengan menggunakan kotak pembatas. Pergerakan kotak-kotak ini dilacak di dalam bingkai, dan jarak di antara mereka terus dihitung ulang. Jika pelanggaran pedoman jarak sosial terdeteksi, algoritme menyoroti kotak pembatas yang melanggar dan memungkinkan tindakan lebih lanjut dipicu.

  1. Faceapp

Faceapp adalah aplikasi manipulasi gambar populer yang mengubah input visual wajah manusia untuk mengubah jenis kelamin, usia, dan fitur lainnya. Ini dicapai melalui jaringan permusuhan generatif konvolusional yang dalam, subtipe khusus dari computer vision.

Faceapp menggabungkan prinsip pengenalan gambar, aspek kunci dari pengenalan wajah , dengan pembelajaran mendalam untuk mengenali fitur wajah utama seperti tulang pipi, kelopak mata, batang hidung, dan garis rahang. Setelah fitur ini diuraikan pada wajah manusia, aplikasi dapat memodifikasinya untuk mengubah gambar.

Faceapp bekerja dengan mengumpulkan data sampel dari smartphone beberapa pengguna dan memasukkannya ke jaringan saraf yang dalam. Hal ini memungkinkan sistem untuk 'mempelajari' setiap detail kecil dari penampilan wajah manusia. Pembelajaran ini kemudian digunakan untuk meningkatkan kemampuan prediktif aplikasi dan memungkinkannya mensimulasikan kerutan, memodifikasi garis rambut, dan membuat perubahan realistis lainnya pada gambar wajah manusia.

Faceapp mengandalkan computer vision untuk mengenali pola. Kemampuan kecerdasan buatannya memungkinkannya meniru gambar dengan efisiensi yang meningkat dari waktu ke waktu, menggunakan data yang diterimanya dari berbagai sumber. Faceapp mentransfer informasi wajah dari satu gambar ke gambar lainnya di tingkat mikro. Ini mengarah pada kemampuan yang mengesankan di tingkat makro, akibatnya memungkinkan aplikasi membuat database besar dengan memproses jutaan foto pengguna.

  1. SentioScope

SentioScope adalah sistem pelacakan kebugaran dan olahraga yang dikembangkan oleh Sentio. Ini terutama beroperasi sebagai solusi pelacakan pemain untuk sepak bola, memproses input visual waktu nyata dari pertandingan langsung. Data yang direkam diunggah ke platform analitik berbasis cloud.

SentioScope mengandalkan pengaturan kamera 4K untuk menangkap input visual. Kemudian memproses masukan ini untuk mendeteksi pemain dan mendapatkan wawasan waktu nyata dari gerakan dan perilaku mereka.

Solusi yang didukung computer vision ini menciptakan model konseptual lapangan sepak bola, yang merepresentasikan permainan dalam dunia dua dimensi. Model 2D ini dipartisi menjadi kisi-kisi sel spasial yang padat. Setiap sel mewakili titik dasar yang unik di lapangan, ditampilkan sebagai tambalan gambar tetap dalam video.

SentioScope didukung oleh pembelajaran mesin dan dilatih dengan lebih dari 100.000 sampel pemain. Ini memungkinkannya untuk mendeteksi sel 'pemain' dalam cuplikan pertandingan sepak bola. Algoritme probabilistik dapat berfungsi dalam berbagai jenis kondisi visibilitas yang menantang.

Sentio adalah salah satu dari banyak perusahaan yang bekerja untuk menanamkan computer vision dengan rejimen pelatihan olahraga. Solusi ini biasanya menganalisis umpan langsung dari kamera beresolusi tinggi untuk melacak bola yang bergerak, mendeteksi posisi pemain, dan merekam informasi berguna lainnya yang dapat digunakan untuk meningkatkan kinerja pemain dan tim.


Aplikasi Computer vision di 2022

Meskipun kemampuan mata manusia luar biasa, computer vision saat ini bekerja keras untuk mengejar ketinggalan. Di bawah ini adalah 10 aplikasi computer vision teratas pada tahun 2022.

  1. Pendidikan

Dengan meningkatnya pendidikan jarak jauh karena pandemi COVID-19, industri teknologi pendidikan juga memanfaatkan computer vision untuk berbagai aplikasi. Misalnya, guru menggunakan solusi computer vision untuk mengevaluasi proses pembelajaran secara non-obstruktif. Solusi ini memungkinkan guru untuk mengidentifikasi siswa yang tidak terlibat dan menyesuaikan proses pengajaran untuk memastikan bahwa mereka tidak ketinggalan.

Selain itu, visi AI digunakan untuk aplikasi seperti dukungan logistik sekolah, perolehan pengetahuan, pemantauan kehadiran, dan penilaian reguler. Salah satu contoh umum dari hal ini adalah kamera web berkemampuan computer vision, yang digunakan untuk memantau siswa selama ujian. Ini membuat praktik yang tidak adil lebih mudah dikenali melalui analisis gerakan mata dan perilaku tubuh.

  1. Pertanian

Pertanian secara tradisional tidak terkait dengan teknologi mutakhir. Namun, metodologi dan alat yang sudah ketinggalan zaman perlahan-lahan dihapus dari lahan pertanian di seluruh dunia. Saat ini, petani memanfaatkan computer vision untuk meningkatkan produktivitas pertanian.

Perusahaan yang berspesialisasi dalam teknologi pertanian sedang mengembangkan computer vision canggih dan model kecerdasan buatan untuk tujuan penaburan dan pemanenan. Solusi ini juga berguna untuk menyiangi, mendeteksi kesehatan tanaman, dan analisis cuaca tingkat lanjut.

Computer vision memiliki banyak aplikasi yang ada dan yang akan datang di bidang pertanian, termasuk pemantauan tanaman berbasis drone, penyemprotan pestisida otomatis, pelacakan hasil, dan penyortiran & klasifikasi tanaman cerdas. Solusi bertenaga AI ini memindai bentuk, warna, dan tekstur tanaman untuk analisis lebih lanjut. Melalui teknologi computer vision, catatan cuaca, data kehutanan, dan keamanan lapangan juga semakin banyak digunakan.

  1. Pengenalan wajah

Sementara pengenalan wajah sudah digunakan pada tingkat pribadi, seperti melalui aplikasi ponsel cerdas, industri keamanan publik juga merupakan pendorong solusi deteksi wajah yang patut diperhatikan. Mendeteksi dan mengenali wajah di depan umum adalah aplikasi computer vision kontroversial yang telah diterapkan di yurisdiksi tertentu dan dilarang di yurisdiksi lain.

Deteksi wajah yang sukses bergantung pada pembelajaran mendalam dan visi mesin. Algoritme computer vision mendeteksi dan menangkap gambar wajah orang di depan umum. Data ini kemudian dikirim ke sistem backend untuk dianalisis. Solusi pengenalan wajah tipikal untuk penggunaan publik berskala besar menggabungkan analisis dan algoritme pengenalan.

Para pendukung mendukung pengenalan wajah yang didukung computer vision karena dapat berguna untuk mendeteksi dan mencegah aktivitas kriminal. Solusi ini juga memiliki aplikasi dalam melacak orang tertentu untuk misi keamanan.

  1. Human pose tracking

Model pelacakan pose manusia menggunakan computer vision untuk memproses input visual dan memperkirakan postur tubuh manusia. Melacak pose manusia adalah kemampuan lain dari computer vision yang diterapkan dalam industri seperti game, robotika, aplikasi kebugaran, dan terapi fisik. 

Misalnya, perangkat game Microsoft Kinect dapat memantau tindakan pemain secara akurat melalui penggunaan visi AI. Ini bekerja dengan mendeteksi posisi sendi kerangka manusia pada bidang 3D dan mengenali gerakannya.

  1. Interactive entertainment

Lewatlah sudah hari-hari ketika hiburan digital membuat penonton harus duduk dan menonton tanpa berpartisipasi. Saat ini, solusi hiburan interaktif memanfaatkan computer vision untuk menghadirkan pengalaman yang benar-benar imersif. Layanan hiburan mutakhir menggunakan kecerdasan buatan untuk memungkinkan pengguna mengambil bagian dalam pengalaman dinamis.

Misalnya, Google Glass dan kacamata pintar lainnya mendemonstrasikan bagaimana pengguna dapat menerima informasi tentang apa yang mereka lihat saat melihatnya. Informasi tersebut langsung dikirim ke bidang pandang pengguna. Perangkat ini juga dapat merespons gerakan kepala dan perubahan ekspresi, memungkinkan pengguna mengirimkan perintah hanya dengan menggerakkan kepala.

  1. Pencitraan medis

Sistem medis sangat bergantung pada deteksi pola dan prinsip klasifikasi gambar untuk diagnosis. Sementara aktivitas ini sebagian besar dilakukan secara manual oleh profesional perawatan kesehatan yang berkualifikasi, solusi computer vision secara perlahan ditingkatkan untuk membantu dokter mendiagnosis kondisi medis.

Telah ada peningkatan penting dalam penerapan teknik computer vision untuk pemrosesan citra medis. Ini sangat lazim dalam patologi, radiologi, dan oftalmologi. Pengenalan pola visual, melalui computer vision, memungkinkan produk lanjutan, seperti Microsoft InnerEye, untuk memberikan diagnosis yang cepat dan akurat di semakin banyak spesialisasi medis.

  1. Manufaktur

Manufaktur adalah salah satu proses yang paling intensif teknologi di dunia modern. Computer vision populer di pabrik manufaktur dan umumnya digunakan dalam sistem inspeksi bertenaga AI. Sistem seperti itu lazim di laboratorium R&D dan gudang dan memungkinkan fasilitas ini beroperasi dengan lebih cerdas dan efektif.

Misalnya, sistem pemeliharaan prediktif menggunakan computer vision dalam sistem inspeksi mereka. Alat-alat ini meminimalkan kerusakan mesin dan cacat produk dengan memindai lingkungan secara konstan. Jika kemungkinan kerusakan atau produk berkualitas rendah terdeteksi, sistem akan memberi tahu personel manusia, memungkinkan mereka untuk memicu tindakan lebih lanjut. Selain itu, computer vision digunakan oleh pekerja dalam kegiatan pengemasan dan pemantauan kualitas.

Berkat kemajuan yang dibawa oleh Industri 4.0, computer vision juga digunakan untuk mengotomatiskan proses padat karya seperti perakitan produk dan manajemen. Perakitan produk bertenaga AI paling sering terlihat di jalur perakitan untuk komoditas yang rentan, seperti elektronik. Perusahaan seperti Tesla menghadirkan otomatisasi lengkap proses manufaktur di pabrik mereka.

  1. Manajemen ritel

Meskipun pengalaman berbelanja tanpa interaksi selalu menjadi masa depan yang tak terelakkan, pandemi COVID-19 tentu saja membantu mempercepat adopsi aplikasi computer vision oleh industri ritel. Saat ini, raksasa teknologi seperti Amazon secara aktif mengeksplorasi bagaimana ritel dapat direvolusi menggunakan visi AI untuk memungkinkan pelanggan 'ambil dan pergi'.

Toko ritel sudah menggunakan solusi computer vision untuk memantau aktivitas pembelanja, membuat pencegahan kerugian tidak mengganggu dan ramah pelanggan. Computer vision juga digunakan untuk menganalisis suasana hati pelanggan dan mempersonalisasi iklan. Selain itu, solusi visi berbasis AI digunakan untuk memaksimalkan ROI melalui program retensi pelanggan, pelacakan inventaris, dan penilaian strategi penempatan produk.

  1. Autonomous vehicles

2022 adalah tahun mobil self-driving. Pemimpin pasar seperti Tesla, yang didukung oleh teknologi canggih seperti computer vision dan 5G, membuat langkah besar.

Mobil otonom Tesla menggunakan pengaturan multi-kamera untuk menganalisis sekelilingnya. Ini memungkinkan kendaraan untuk menyediakan fitur-fitur canggih kepada pengguna, seperti autopilot. Kendaraan ini juga menggunakan kamera 360 derajat untuk mendeteksi dan mengklasifikasikan objek melalui computer vision.

Pengemudi mobil otonom dapat mengemudi secara manual atau membiarkan kendaraan membuat keputusan otonom. Jika pengguna memilih untuk menggunakan pengaturan yang terakhir, kendaraan ini menggunakan computer vision untuk terlibat dalam proses lanjutan seperti perencanaan jalur, persepsi pemandangan mengemudi, dan arbitrase perilaku.


Autonomous Vehicle


  1. Transportasi

Terakhir, sistem computer vision semakin banyak diterapkan untuk meningkatkan efisiensi transportasi. Misalnya, computer vision digunakan untuk mendeteksi pelanggar sinyal lalu lintas, sehingga memungkinkan lembaga penegak hukum untuk meminimalkan perilaku tidak aman di jalan raya.

Solusi penginderaan dan pemrosesan yang cerdas juga digunakan untuk mendeteksi pelanggaran mengemudi yang melaju kencang dan sisi yang salah, di antara perilaku mengganggu lainnya. Selain itu, computer vision digunakan oleh sistem transportasi cerdas untuk analisis arus lalu lintas.


Selanjutnya

Computer vision adalah teknologi inovatif dengan banyak aplikasi menarik. Solusi canggih ini menggunakan data yang dihasilkan setiap hari untuk membantu komputer 'melihat' dunia dan memberi wawasan bermanfaat yang akan membantu meningkatkan kualitas hidup secara keseluruhan. Pada tahun 2022, computer vision diharapkan membuka potensi dari banyak teknologi baru dan menarik, membantu kita menjalani kehidupan yang lebih aman, lebih sehat, dan lebih bahagia.


 Copyright stekom.ac.id 2018 All Right Reserved