Računarski vid

Računarski vid, kompjuterska vizija ili kompjuterski vid uključuje metode za prikupljanje, obradu, analizu i razumijevanje digitalnih slika, te ekstrakciju visokodimenzionalnih podataka iz stvarnog svijeta kako bi se proizvele numeričke ili simboličke informacije, koje se kasnije mogu koristiti za donošenje nekih odluka.

Razumijevanje u ovom kontekstu znači transformaciju vizuelnih slika (prolaz informacija kroz mrežnicu kao analog u ljudskoj anatomiji) u neke interpretabilne informacije koji će biti od koristi za izvođenje neke akcije. Ova interpretacija razumijevanje slike može se posmatrati kao razdvajanje simboličkih informacija u vidu slikovnih podataka, korištenjem modela konstruiranih uz pomoć geometrije, fizike, statistike i teorije učenja.

Oblast računarskog vida bavi se teorijom koja stoji iza razvoja veštačkih sistema koji izvlače informacije iz slika. Podaci o slici mogu imati različite oblike, kao što su video sekvence, prikazi sa više kamera, višedimenzionalni podaci sa 3D skenera, 3D oblaci tačaka sa LiDaR senzora ili medicinski uređaji za skeniranje. Tehnološka disciplina kompjuterskog vida nastoji da svoje teorije i modele primeni na konstrukciju sistema računarskog vida.

Podoblasti računarskog vida uključuju rekonstrukciju scene, detekciju objekata, detekciju događaja, prepoznavanje aktivnosti, video praćenje, prepoznavanje objekata, restoraciju slika itd.

Usvajanje tehnologije računarskog vida može biti mukotrpan posao za organizacije jer za to trenutno ne postoji jednoznačno rješenje. Vrlo malo kompanija pruža objedinjene i distribuirane platforme ili operativni sistem gdje se applikacije bazirane na računarskom vidu mogu lako implementirati i manipulisati.

Definicija

Računarski vid je interdisciplinarno polje koje se bavi tehnologijama i tehnikama koje se mogu upotrebiti za automatizaciju računara, da mogu da steknu bolje razumijevanje konteksta iz digitalnih slika ili video zapisa . Iz perspektive inženjerstva, ova oblast nastoji da emulira ponašanje i mogućnost interpretiranja sveta oko sebe iz ljudskog vizuelnog sistema "Kompjuterski vid se bavi automatskim prikupljanjem, analizom i razumijevanjem korisnih informacija iz jedne slike ili niza slika. To uključuje razvoj teorijske i algoritamske osnove za postizanje automatskog vizualnog razumijevanja." Kao naučna disciplina, kompjuterski vid se bavi teorijom koja stoji iza vještačkih sistema koji izvlače informacije iz slika. Podaci o slici mogu biti u različitim formatima i oblicima, kao što su video sekvence, prikazi sa više kamera ili višedimenzionalni podaci sa medicinskog skenera . Kao tehnološka disciplina, kompjuterska vizija nastoji da svoje teorije i modele primeni za konstrukciju sistema kompjuterskog vida. Mašinski vid se odnosi na disciplinu sistemskog inženjeringa, posebno u kontekstu automatizacije posla u tvornicama. U novije vreme, termini računarski vid i mašinski vid su se u većoj meri približili. ^[1] ^:13

Primene računarskog vida su različite, npr. industrijski mašinski vid može da se koristi u tvornicama za inspekciju kvaliteta nekog proizvoda na pokretnoj traci. Polje računarskog vida i mašinskog vida značajno se preklapaju. Računarski vid pokriva osnovnu tehniku automatske analize slike koja se koristi u mnogim poljima. Mašinski vid se obično odnosi na proces kombinovanja automatizovane analize slike sa drugim metodama i tehnologijama kako bi se obezbedila automatska kontrola i navođenje robota u industrijskom kontekstu. U mnogim primenama računarskog vida, aalgoritmi su unapred definisani da reše određeni zadatak, ali metode zasnovane na učenju sada nalaze sve veću primenu u praksi. Primjeri primjene računarskog vida uključuju sisteme za:

Primene

Primene računarskog vida su različite, npr. industrijski mašinski vid može da se koristi u tvornicama za inspekciju kvaliteta nekog proizvoda na pokretnoj traci. Polje računarskog vida i mašinskog vida značajno se preklapaju. Računarski vid pokriva osnovnu tehniku automatske analize slike koja se koristi u mnogim poljima. Mašinski vid se obično odnosi na proces kombinovanja automatizovane analize slike sa drugim metodama i tehnologijama kako bi se obezbedila automatska kontrola i navođenje robota u industrijskom kontekstu. U mnogim primenama računarskog vida, aalgoritmi su unapred definisani da reše određeni zadatak, ali metode zasnovane na učenju sada nalaze sve veću primenu u praksi. Primjeri primjene računarskog vida uključuju sisteme za:

Učenje 3D objekata predstavlja jedan od težih problema u domenu računarskog vida. Skorašnji napredak u tehnikama dubokog učenja omogućio je istraživačima da izgrade modele koji su u stanju da generišu i rekonstruišu 3D oblike od jedne ili više dubinskih mapa (eng. <i>depth maps</i>) na lak i efikasan način. ^[2]

Automatska inspekcija, npr . u kontekstu tvorničke proizvodnje;
Pomaganje ljudima u zadacima identifikacije, npr. sistem identifikacije vrsta ; ^[3]
Kontroliranje procesa, npr . industrijski robot ;
Detektovanje događaja, npr . za vizuelni nadzor ili brojanje ljudi, npr. u restoranskoj industriji ;
Interakcija, npr., kao ulaz u uređaj za interakciju računar-čovek ;
Modeliranje objekata ili okruženja, npr . analiza medicinske slike ili topografsko modeliranje;
Navigacija, npr . autonomna vozila ili mobilni roboti ;
Organiziranje informacija, npr . za indeksiranje baza podataka slika i sekvenci slika.
Praćenje površina ili ravni u 3D koordinatama za omogućavanje korišćenja Augmentovane stvarnosti.

Medicina

Jedno od najistaknutijih područja primjene je medicinski računarski vid, ili obrada medicinske slike, koju karakterizira ekstrakcija informacija iz vizuelnih podataka za pomoć pri dijagnosticiranju pacijenata . Može se koristiti za otkrivanje tumora, arterioskleroze ili drugih malignih promjena, te raznih dentalnih patologija; kao i mjerenja dimenzija organa, protoka krvi itd. Takođe podržava medicinska istraživanja pružanjem novih informacija: npr . o strukturi mozga, kvalitetu medicinskih tretmana ili u razvijanju poboljšanja već postojećih sistema za detekciju oboljenja. Primene računarskog vida u medicinskoj oblasti takođe uključuju poboljšanje slika koje tumače ljudi – ultrazvučne slike ili rendgenske slike, na primer – da bi se smanjio uticaj šuma.

Mašinski vid

Drugo područje primjene računarskog vida jeste industrija, gde se ponekad naziva i mašinski vid, jer se informacije izdvajaju u svrhu podrške mašinskom, odnosno proizvodnom procesu. Jedan primjer je kontrola kvalitete gdje se detalji proizvoda ili konačni proizvodi automatski provjeravaju kako bi se pronašle anomalije i defekti. Jedno od najzastupljenijih polja za takvu inspekciju je inspekcija voća gde se koriste modeli računarskog vida da detektuju defekte poput truleža, nedovoljne zrelosti ili premale veličine na voćkama koje se kreću na pokretnoj traci. Proces koji se koristi za automatsko sortiranje hrane se također i naziva optičko sortiranje .

Vojna primena

Iako nije poznata potpuna širina upotrebe računarskog vida za vojne upotrebe, može se pretpostaviti da ima određenu primenu.

Neki od primera su detekcija neprijateljske tehnike i pešadije, kao i navođenje projektila.

Trenutno najsavremeniji sistemi za navođenje projektila dovedu projektil u određenu oblast, gde zatim odluke donose ljudi.

Upotreba u sistemima

Organizacija sistema računarskog vida u velikoj meri zavisi od konteksta sistema u kojem se koristi. Neki sistemi predstavljaju samostalne aplikacije koje rješavaju određeni problem mjerenja ili detekcije, dok u drugim slučaejvima čine podsistem većeg dizajna koji, na primjer, sadrži druge podsisteme koji upravljaju mehaničkim sistemima, planskim, i informacijskim bazama podataka, mašinskim interfejsima itd. Specifična implementacija sistema računarskog vida zavisi i od toga da li je njegova funkcionalnost unapred specificirana ili se neki deo može naučiti ili modifikovati tokom rada. Mnoge funkcije su jedinstvene za sistem u kojem se koristi. Međutim, postoje tipične funkcije koje se nalaze u mnogim sistemima kompjuterskog vida.

Akvizicija slike – Digitalna slika se može proizvesti na mnogo različitih načina, u zavisnosti od tipa senzora koji se koristi. To mogu biti senzori daljine, tomografski uređaji, radar,itd. U zavisnosti od toga, rezultirajući slikovni podaci mogu biti obična 2D slika, 3D volumen ili sekvenca slike. Vrijednosti piksela obično odgovaraju intenzitetu svjetlosti u jednom ili nekoliko spektralnih opsega (sive slike ili slike u boji), ali se također mogu povezati s različitim fizičkim mjerama, kao što su dubina, apsorpcija ili refleksija zvučnih ili elektromagnetnih valova, ili magnetna rezonanca .
Predprocesiranje – Prije nego što bi se neka metoda kompjuterskog vida mogla primijeniti na slikovne podatke radi izvlačenja bitnih informacija, obično je potrebno obraditi podatke kako bi se osiguralo da zadovoljavaju određene uslove koje metoda postavlja. Primjeri su:
- Ponovno uzorkovanje kako bi se osiguralo da je koordinatni sistem slike ispravan.
- Smanjenje šuma kako bi se osiguralo da šum senzora ne daje lažne informacije.
- Poboljšanje kontrasta kako bi se osiguralo da se relevantne informacije mogu detektovati.
- Skaliranje raznih parametara u slici tako da bi se prilagodilo zahtevima metode koju koristimo.
Ekstrakcija karakteristika (eng. <i>Feature Extraction</i><b id="mwAeA">)</b> – Karakteristike slike na različitim nivoima složenosti izdvajaju se iz podataka slike. Tipični primjeri takvih karakteristika su:
- Linije, ivice i grebeni .
- Lokalizovane interesne tačke kao što su uglovi, mrlje ili tačke.

Složenije karakteristike mogu biti povezane s teksturom, oblikom ili kretanjem.

Reference

↑ Computer Vision Principles, algorithms, Applications, Learning 5th Edition by E.R. Davies Academic Press, Elsevier 2018 ISBN 978-0-12-809284-2
↑ Soltani, A. A.; Huang, H.; Wu, J.; Kulkarni, T. D.; Tenenbaum, J. B. (2017). „Synthesizing 3D Shapes via Modeling Multi-view Depth Maps and Silhouettes with Deep Generative Networks”. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). str. 1511–1519. DOI:10.1109/CVPR.2017.269. ISBN 978-1-5386-0457-1.
↑ Wäldchen, Jana; Mäder, Patrick (2017-01-07). „Plant Species Identification Using Computer Vision Techniques: A Systematic Literature Review” (en). Archives of Computational Methods in Engineering 25 (2): 507–543. DOI:10.1007/s11831-016-9206-z. ISSN 1134-3060. PMC 6003396. PMID 29962832.

[davies5-1] Computer Vision Principles, algorithms, Applications, Learning 5th Edition by E.R. Davies Academic Press, Elsevier 2018 ISBN 978-0-12-809284-2

[3DVAE-2] Soltani, A. A.; Huang, H.; Wu, J.; Kulkarni, T. D.; Tenenbaum, J. B. (2017). „Synthesizing 3D Shapes via Modeling Multi-view Depth Maps and Silhouettes with Deep Generative Networks”. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). str. 1511–1519. DOI:10.1109/CVPR.2017.269. ISBN 978-1-5386-0457-1.

[3] Wäldchen, Jana; Mäder, Patrick (2017-01-07). „Plant Species Identification Using Computer Vision Techniques: A Systematic Literature Review” (en). Archives of Computational Methods in Engineering 25 (2): 507–543. DOI:10.1007/s11831-016-9206-z. ISSN 1134-3060. PMC 6003396. PMID 29962832.

[1]

[2]

[3]