Mengenal library computer vision dan jenis library yang populer |D3 Komputer Grafis A.Md.Ds

Jl. Majapahit 605 Semarang , Jawa Tengah 50232

CALL CENTER 0-8888-9999-10 081-777-5758 08138-777-5758

stekom.ac.id
home
profil
Informasi
Galeri
Kontak
D3 KOMPUTER GRAFIS (A.MD.DS)
STEKOM SEMARANG

08.00 s/d 20.45

Jl. Majapahit 605 Semarang , Jawa Tengah 50232

komputergrafis@stekom.ac.id

Mengenal library computer vision dan jenis library yang populer

Kamis, 04 Mei 2023 16:41:06
295
SETIYO ADI NUGROHO S.E, S.Kom, M.Kom

Kita, manusia, dapat dengan cepat mengidentifikasi objek karena sensor biologis kita: mata. Namun, komputer tidak "melihat" hal-hal seperti yang kita lakukan. Dibutuhkan banyak data dan perangkat keras (kamera, sensor) agar komputer dapat mengenali satu objek. Sama seperti mata manusia yang membantu kita melihat dan bereaksi terhadap dunia di sekitar kita, computer vision memungkinkan mesin mengidentifikasi, mengklasifikasikan, dan merespons objek yang dilihatnya.

Saat ini, bukan rahasia lagi bahwa computer vision memiliki banyak aplikasi di banyak industri termasuk keamanan, pertanian, kedokteran, dan banyak lagi. Jadi, permintaan akan tools dan library computer vision yang berkualitas meningkat. Ada berbagai library visi, library pengenalan gambar, dan library pengenalan wajah, itulah sebabnya kami memutuskan untuk menyusun daftar library computer vision yang kuat ini agar Anda dapat memfilter dengan mudah dan menemukan yang paling sesuai dengan kebutuhan Anda.

Apa itu library computer vision?

library computer vision pada dasarnya adalah sekumpulan kode dan data yang telah ditulis sebelumnya yang digunakan untuk membangun atau mengoptimalkan program komputer. library computer vision sangat banyak dan disesuaikan dengan kebutuhan khusus atau bahasa pemrograman.

library computer vision populer

kami telah mengumpulkan daftar library computer vision paling populer di artikel ini untuk membantu Anda memulai. mari selami.

OpenCV
Scikit-Gambar
Bantal (Garpu PIL)
TorchVision
MMCV
TensorFlow
Keras
MATLAB
NVIDIA CUDA-XKerKeras
Primitif Performa NVIDIA
open VINO
PyTorch
Wajah Pelukan
Albumenasi
Kafe
Deteksi2

1.openCV

OpenCV adalah library computer vision open source tertua dan sejauh ini yang paling populer, yang bertujuan untuk visi waktu nyata. Ini adalah library lintas platform yang mendukung Windows, Linux, Android, dan macOS dan dapat digunakan dalam berbagai bahasa, seperti Python, Java, C++, dll. OpenCV memiliki Pembungkus Python dan menggunakan model CUDA untuk GPU. Awalnya dikembangkan oleh Intel, sekarang gratis untuk digunakan di bawah lisensi open-source BSD. Ini juga berisi beberapa model yang dapat diubah menjadi model TensorFlow. Beberapa kasus penggunaan OpenCV meliputi:

Toolkit fitur 2D dan 3D
Aplikasi pengenalan wajah
Pengenalan gerakan
Pemahaman gerak
Interaksi manusia-komputer
Deteksi objek
Segmentasi dan pengakuan

2. Scikit-image

Scikit-Image dianggap sebagai library Python yang paling nyaman dan alami yang merupakan "ekstensi" dari Scikit-Learn. Ini adalah salah satu tools yang paling umum digunakan untuk pembelajaran mesin yang diawasi dan tidak diawasi. Scikit-Learn adalah paket Python yang digunakan untuk pemrosesan gambar dan mengoperasikan array NumPy secara native sebagai objek gambar. Karena ini adalah Naturally Python dan menggunakan modul Scikit-cuda, Scikit-Image bebas biaya dan pembatasan. Untuk menggunakan Scikit-Learn dengan benar, Anda hanya perlu menginstalnya dan Anda siap melakukannya. Kasus penggunaannya beragam:

Menemukan exoplanet
Klasifikasi, identifikasi, dan pengenalan data
Mengelompokkan data serupa ke dalam kumpulan data
Mendeteksi penipuan dalam transaksi kartu kredit
Interoperabilitas dengan library lain

3. Pillow (Fork PIL)

Berikutnya dalam daftar library computer vision kami adalah Pillow, oleh Jeffrey A. Clark (Alex) dan kontributor, library open source untuk bahasa pemrograman Python. Ini dapat digunakan oleh Windows, Mac OS X, dan Linux. library Pencitraan Python menyediakan kemampuan pemrosesan gambar ke juru bahasa Python dan library gambarnya dimodifikasi untuk akses data yang cepat. Ini dapat digunakan dalam bahasa C dan Python dan memiliki Pembungkus Python. Sebagian besar digunakan untuk membaca dan menyimpan gambar dengan format berbeda, Pillow juga terdiri dari berbagai transformasi gambar dasar seperti rotasi, penggabungan, penskalaan, dll. Sekali lagi, untuk penggunaannya, Anda hanya perlu menginstalnya. Kasus penggunaan pillow adalah:

Akses cepat ke data yang disimpan
Menyimpan berbagai format file gambar.
Dukungan format file yang luas

Kemampuan pemrosesan gambar.

4. TorchVision

Sebagai perpanjangan dari library PyTorch, TorchVision berisi transformasi gambar yang paling umum untuk computer vision. Ini juga berisi kumpulan data dan arsitektur model untuk jaringan saraf computer vision. Salah satu tujuan utama TorchVision adalah menyediakan cara alami menggunakan transformasi gambar computer vision dengan model PyTorch tanpa mengubahnya menjadi larik NumPy dan sebaliknya. Paketnya terdiri dari kumpulan data umum, arsitektur model, dan transformasi gambar computer vision biasa. TorchVision adalah Naturally Python dan dapat digunakan untuk bahasa Python dan C++. Anda dapat menggunakannya dengan library PyTorch dengan menginstal pip.

5.MMCV

MMCV adalah jenis ekstensi PyTorch yang menyediakan pemrosesan dan transformasi gambar/video, visualisasi gambar dan anotasi, dan juga banyak arsitektur CNN. Ini mendukung sistem seperti Linux, Windows, dan macOS, dan ini adalah salah satu toolkit paling bermanfaat bagi peneliti computer vision. Ini digunakan untuk Python, C++, dan CUDA dan memiliki Pembungkus Python. Anda dapat mem-pip atau mim menginstalnya dan menggunakannya di notebook jupyter Anda. Beberapa kasus penggunaan MMCV adalah:

API IO Universal
Utilitas yang berguna (timer, progress bar, dll)
menjalankani PyTorch dengan mekanisme pengait

6. TensorFlow

Dibuat oleh tim GoogleBrain,TensorFlow dirilis pada November 2015 dan ditujukan untuk memfasilitasi proses pembuatan model AI. Ini memiliki solusi khusus seperti TensorFlow.js, library JavaScript untuk melatih dan menerapkan model di browser dan di Node.js, atau TensorFlow Lite, library ringan untuk menerapkan model di perangkat seluler dan embedded. TensorFlow kini hadir dengan framework yang lebih baik,TensorFlow Hub. Ini adalah platform yang mudah digunakan di mana Anda dapat melakukan hal berikut:

Gunakan kembali model terlatih seperti BERT dan Faster R-CNN.
Temukan model yang siap diterapkan untuk proyek AI Anda.
Host model Anda untuk digunakan orang lain.

7. Keras

Keras adalah library perangkat lunak open source berbasis Python yang sangat berguna bagi pemula karena memungkinkan pembuatan model jaringan saraf dengan cepat dan menyediakan dukungan backend. Ini adalah kotak tools dari blok bangunan modular yang dapat dimanfaatkan oleh insinyur computer vision untuk dengan cepat merakit jalur produksi, pelatihan canggih, dan jaringan inferensi. Dengan lebih dari 400.000 pengguna individu, Keras memiliki dukungan komunitas yang kuat. Ini menggunakan TensorFlow dan Anda dapat menginstalnya. Beberapa kasus penggunaan Keras meliputi:

Segmentasi dan klasifikasi gambar
Pengenalan tulisan tangan
klasifikasi gambar 3D
Pengelompokan gambar semantik

8. MATLAB

MATLAB adalah kependekan dari Matrix Laboratory dan merupakan platform pemrograman berbayar yang cocok untuk berbagai aplikasi seperti pembelajaran mesin, pembelajaran mendalam, gambar, video, dan pemrosesan sinyal. Pengguna dapat membeli Lisensi MATLAB dan menginstalnya di PC Anda sendiri. Itu datang dengan kotak tools computer vision yang memiliki banyak fungsi, aplikasi, dan algoritme untuk membantu tugas terkait computer vision, seperti:

Mendeteksi dan melacak objek dalam bingkai video
Mengenali objek
Mengkalibrasi kamera
Melakukan penglihatan stereo
Memproses beban titik 3D

9. NVIDIA CUDA-X

Saat pertama kali diperkenalkan, CUDA adalah akronim untuk Compute Unified Device Architecture, tetapi NVIDIA kemudian menghentikan penggunaan umum akronim tersebut.NVIDIA CUDA-X adalah versi terbaru dari CUDA. Ini adalah kumpulan library dan tools yang dipercepat GPU untuk memulai dengan aplikasi baru atau akselerasi GPA. NVIDIA CUDA-X berisi:

10. NVIDIA Performance primitives

NVIDIA Performance primitives (NPP) library menyediakan fungsi pemrosesan gambar, video, dan sinyal yang dipercepat GPU yang bekerja jauh lebih cepat daripada implementasi yang hanya menggunakan CPU. library ini dirancang untuk para insinyur, ilmuwan, dan peneliti yang bekerja di berbagai bidang seperti computer vision, inspeksi industri, robotika, pencitraan medis, telekomunikasi, pembelajaran mendalam, dan banyak lagi. library NPP hadir dengan 5000+ primitif untuk pemrosesan gambar dan sinyal untuk melakukan tugas-tugas berikut:

Konversi warna
Kompresi gambar
Penyaringan, ambang batas
Manipulasi gambar

11. open VINO

open VINO singkatan dari Open Visual Inference dan Neural Network Optimization. Ini adalah seperangkat tools computer vision yang komprehensif untuk mengoptimalkan aplikasi yang meniru visi manusia. Untuk menggunakan OpenVINO, Anda memerlukan model yang telah dilatih sebelumnya, mengingat ini adalah perangkat pengoptimalan dan penyebaran model. Dikembangkan oleh Intel, ini adalah kerangka kerja lintas platform yang bebas digunakan dengan model untuk beberapa tugas:

Deteksi objek
Pengenalan wajah
Pewarnaan
Pengenalan gerakan

12. PyTorch

PyTorch adalah library pembelajaran mesin open source untuk Python yang dikembangkan terutama oleh grup riset AI Facebook. Ini menggunakan perhitungan dinamis, yang memungkinkan fleksibilitas yang lebih besar dalam membangun arsitektur yang kompleks. Pytorch menggunakan konsep inti Python seperti kelas, struktur, dan loop bersyarat dan kompatibel dengan C++. Anda perlu pip install timm dan Anda akan siap. PyTorch mendukung perhitungan CPU dan GPU dan berguna untuk:

Model estimasi gambar
Segmentasi gambar
Klasifikasi gambar

13. hugging Face

Didirikan pada tahun 2016,hugging Face awalnya adalah perusahaan chatbot yang kemudian menjadi penyedia teknologi NLP open source. Itu dianggap sebagai sumber daya besar dan kuat yang berisi berbagai arsitektur jaringan saraf dan model pra-terlatih. Untuk menginstal Hugging Face, Anda dapat mem-pip install datasets. Hugging Face menawarkan banyak model melalui banyak toolsnya termasuk Hugging Face Hub, diffusers, transformer, dll. Kasus penggunaan yang paling umum adalah:

Klasifikasi urutan
Menjawab pertanyaan
Pemodelan bahasa
Terjemahan

14. Albumentation

Albumentation adalah library Python open-source yang menyediakan berbagai macam algoritme augmentasi gambar. Ini gratis di bawah lisensi MIT dan dihosting digithub. library adalah bagian dari ekosistem PyTorch, dan mudah diintegrasikan dengan kerangka pembelajaran mendalam seperti PyTorch dan Keras. Albumentasi mendukung berbagai macam operasi transformasi gambar untuk tugas-tugas seperti:

Klasifikasi
Segmentasi semantik
Segmentasi instan
Deteksi objek
Estimasi pose

15. Caffe

Caffe singkatan dari Convolutional Architecture for Fast Feature Embedding. Ini adalah pembelajaran mendalam open source dan kerangka computer vision yang mudah digunakan yang dikembangkan di University of California, Berkeley. Itu ditulis dalam C ++ dan mendukung banyak bahasa dan beberapa arsitektur pembelajaran mendalam yang terkait dengan klasifikasi dan segmentasi gambar. Caffe digunakan dalam proyek penelitian akademik, prototipe startup, dan bahkan aplikasi industri skala besar dalam visi, ucapan, dan multimedia. Dukungan kafe:

Segmentasi gambar
Klasifikasi gambar
CNN
RCNN
LSTM

16. Detectron2

Detectroni2 adalah library deteksi objek modular berbasis PyTorch oleh Riset AI Facebook (ADIL). Itu dibangun untuk memenuhi permintaan AI Facebook dan menutupi kasus penggunaan deteksi objek di Facebook. Detectron2 adalah versi Deteksi yang disempurnakan; itu mencakup semua model Detectron asli, seperti Faster R-CNN, Mask R-CNN, RetinaNet, dan DensePose. Ini juga menampilkan beberapa model baru, termasuk Cascade R-CNN, Panoptic FPN, dan TensorMask. Detecrton2 sangat cocok untuk:

Prediksi pose padat
segmentasi panoptik
segmentasi sinaptik
Deteksi objek

SAM (Segment Anything Model) adalah generasi berikutnya dari algoritma Riset AI Facebook yang menyediakan segmentasi gambar berkualitas tinggi. Baik Detectron2 dan SAM diimplementasikan dengan menggunakan PyTorch..

Kesimpulan

Bergantung pada keahlian, proyek, dan anggaran Anda, Anda mungkin memerlukan program computer vision, perangkat, dan library yang berbeda. Beberapa library yang disarankan memerlukan sedikit pengetahuan sebelumnya tentang pembelajaran mendalam, tetapi mungkin tidak gratis. Di sisi lain, ada banyak tools dan sumber daya open source yang tersedia untuk Anda gunakan kapan saja.

sumber https://www.superannotate.com/blog/computer-vision-libraries

Kembali Print