23.11.14

Microsoft radi na softveru za prepoznavanje fotografija

Microsoft-Research-Image

Microsoft, točnije 12 stručnjaka iz Microsoftovog Odjela za istraživanje (Microsoft Research) radi na novom softveru koji će moći prepoznavati fotografije, odnosno ono što se nalazi na fotografijama. Automatsko prepoznavanje sadržaja na fotografijama je jako inovativan sustav koji bi mogao imati široku primjenu u svakodnevnom životu.

 

Softver za sada automatski dodaje kratki opis fotografije i to radi poprilično uspješno obzirom da je još u razvojnoj fazi. Znači prepozna što se nalazi na fotografiji, posloži moguće riječi i nizom algoritama odredi najbolji opis onoga što se nalazi na fotografiji.

 

Testiranja koja su obavljena pokazuju jako dobre rezultate, neki su čak bolji od ljudskih. Prema BLEU metodi mjerenja ovaj softver je ostvario prosječnu točnost od  21.05% dok je čovjek po istoj metodi mjerenja ostvario prosječnu točnost od 19.32%. METEOR metoda mjerenja je pokazala 20.71% točnosti kod softvera dok je čovjek prema toj metodi ostvario 24.07%. Također, ispitana su mišljenja ljudi koja su možda i najtočnija te se pokazalo da za 23.3% testnih fotografija ljudi misle da je softver smislio isti ili čak bolji opis nego što bi smislio čovjek. Navedeni rezultati možda nama ne daju previše jasnu sliko o tome koliko je to uspješno no iz Microsoftovog Odjela za istraživanje ističu kako su jako zadovoljni postignutim rezultatima.

 

AIC-2.jpg-550x0

Da ne bi izgledao sve tako savršeno, postoje situacije gdje algoritam ne može odrediti čemu pridodati veću važnost na fotografiji. U situaciji kao na fotografiji iznad ne zna odrediti je li važnije reći da mačka sjedi pokraj čovjeka ili da čovjek sjedi pokraj mačke.

 

Budući da je softver u fazi razvoja, ako se pokaže kao pouzdan sigurno neće ostati samo na opisivanju slika. Na primjer, isto kao što može dodati opis fotografije mogao bi jednog dana biti sposoban tražiti fotografiju prema opisu. Što vi mislite ima li budućnosti za takav softver, odnosno možete li zamisliti njegovu primjenu u svakodnevnom životu?

 

izvor: WMP, TechNet

17 komentara :

  1. Izuzetno sam povjerljiv u novu tehnologiju medjutim ovo je prilicno prerano trebaju neke druge faze da se zasnuju nekoliko skala ispod trenutno zamisljene ideje,po meni preveliki ne korak pravi skoro iz mjesta

    ReplyDelete
  2. Ne znam, ali moje je misljenje da u ovome ne vidim za sto bi to moglo posebno bit potrebno. Ali dobro, kao sto sam rekao to je moje misljenje. Mozda mi za par godina bude glavna aplikacija bez koje necu moci. 😃

    ReplyDelete
  3. ...i tako masine pocnu raspoznavati sta zaista vide svojim kamerama i lakse ce upravljati svojim postupcima ... dok ne pocnu same razvijati svoju svest... Pogledajte film "Automata".

    ReplyDelete
  4. netko bi rekao znanstvena fantastika ali ako pogledamo uz današnju tehnologiju to i nije tako nemoguće..

    ReplyDelete
  5. Pa i je i nije prerano, ovisi za šta bi se iskoristilo.. Računala već odavno u raznim stvarima zamjenjuju čovjeka ili barem nadopunjuju i u mnogim svakodnevnim stvarima računala nas osiguravaju a nekad nismo niti svjesni svega toga. Ja bi rekao da postaje pomalo zastrašujuće to da će strojevi/računala imati "oči" jer to otvara niz drugih mogućnosti i problema pa s tom tehnologijom treba biti pažljiv.

    ReplyDelete
  6. Ni jedan stroj ne moze samostalno da funcionise ukoliko covjek u njega predhodno nije ugradio inteligenciju sad ja kazem dali je covjek toliko sazreo da moze programirati uredjaj da raspoznaje fotografije ima mnogo prototila i experimenata ali ja priznajem samo savrseno

    ReplyDelete
  7. Pre 2-3 godine je bio clanak gde Google radi na softveru za prepoznavanje lica. Ubacis sliku i Google ti kaze ko je na slici :D

    ReplyDelete
  8. Dobro pitanje.. kad pogledaš koliku je prašinu digla PhotoMath aplikacija, šta bi tek bilo da dobijemo računalo koje vidi.


    Stroj je pametan onoliko koliko je pametan njegov tvorac ili koliko mu je to njegov tvorac dopustio. Računala mogu jako dobro raditi u izoliranom sustavu gdje se neće dogoditi nešto nepredviđeno ili da moraju paziti i automatski se prilagođavati na veliki broj drugih faktora.

    ReplyDelete
  9. Stefan Ivanović23 November, 2014

    Interesantna stvar skroz. Elem, mogli bi da prorade na revolucionarnom software zvani Office jer sam upravo video da Office na WP ne može da edituje .doc dokumente. Mal ne sam pao u nevest! Imam ih jedno 2000 na OneDrive i uvek su uz mene ali ne mogu da ih editujem niti može u letu da ih konvertuje. Samo da ne kaže neko kako je .doc zastareo jer mnogo intitucija i dalje koristi .doc i kod nas (u Srbiji) a i preko. Pa kod dokumenata je najvažnija stvar da NE SMEJU da zastare uvsmislu formata. Znači, ne postoji backward compatibility i ko mi onda garantuje da sve što danas imam u .docx neću morati da konvertujem za 5 godina u nešto novo da bih to koristio. Ajde ja, zamisli firmu sa 100.000+ dokumenata. Sad sa Google Play da skinem neki Office mogao bih da editujem isti taj Majkrosoftov .doc koji na Majkrosoftovom WP ne mogu. Blamaža.

    ReplyDelete
  10. Dobra ideja za diskusiju :) svi znamo da se napredak ne moze zaustaviti jer je to prirodna pojava. Isto kao sto su pametni telefoni danas tako vjerujem da ce i umjetna inteligencija biti kasnije, ovo sto sada vidimo samo su prvi koraci u tome.


    Po meni sve u zivotu ima dvije strane, dobru ili losu. Tako isto i sa tehnologijom. Ja npr ovo vidim u medicinske svrhe, npr. slijepac ima kameru na nekoj traci na celu npr. i onda prepoznaje okolinu i objasnjava slijepom covjeku sta se nalazi ispred njega i dali je neka opsanost u blizini. Jer ako ova tehnologija moze da raspozna stvari onda moze i reci da li je nesto potencijalno opasno za tog covjeka koji je slijep i upozori ga.

    Drugo nauka, u skoli npr mogu se razviti racunari ili tableti koje ce djeca svakako koristiti uskoro po skolama, na kojim ima aplikacije koje raspoznaju stvari, i ja kao djete volio bi da sam imao ovako nesto da mogu uskenirati neku stvar i otvori mi sve informacije koje internet sadrzi o toj stvari. Wikipedia, opis objekta, hemijski sastav, video zapisi toga itd. itd. kao leksikon zivi. Djeca bi tako vise ucila i usmjeravala bi se ka onome sto zele da uce a ne sto moraju da uce.

    Pored toga ima milion drugih podrucja gdje se moze ovo primjeniti, ne direktno ovako ali slicno. Primjera radi trazim fotografiju na Bing, nije vise vazno da li uz fotografiju ima meta podatak "cvijece, sunce" itd. nego ce Bing sam raspoznati i prikazati sto ja zelim. Nije samo ovo raspoznavanje fotografija nego je to sav algoritam koji to omogucuje, on je put ka buducnosti koju ne mozemo zaustaviti. i ne trebamo.

    ReplyDelete
  11. .doc je iz koje godine 2007.? a mi smo trenutno u 2014. Tako da ne treba se cuditi tome. I te firme koje imaju office legalno dobiju i novi office legalno za malu nadoknadu.

    ReplyDelete
  12. To za prepoznavanje lica nisam znao ali Google ima onu fora tražilicu za slike.. ubaciš sliku u tražilicu i nađe istu takvu sliku- nekad zna biti korisno

    ReplyDelete
  13. Da, tako sam ja dok sam fotografirao aktivno trazio svoje fotografije po netu. i pronasao ih na vise mjesta :D

    ReplyDelete
  14. Pa nece .doc dokunente da im prebace u .docx ako im daju nov Office. Ok, Office na pc-u moze i sa .doc ali telefon i dalje nista, a na sav glas pricaju o nekoj sinhronizaciji, dostupno svuda, sa bilo kog uredjaja. Jes malo tupavo da dokument moze da zastari. Zamisli koliko dokumenata imaju bolnice, skole, banke, poste, trgovine....za svakog od nas imaji neki .doc :)

    ReplyDelete
  15. Stefan Ivanović24 November, 2014

    Nije stvar u ofisu nego u legacy formatu. Kažem, zamisli firmu koja mora da konveruje ogromnu količinu dokumentacije na file serveru u stotinama foldera. Imaš li i najmanju ideju koliko je to posla... :) i kako neki skript za bulk konverziju može da nepovratno ošteti gomilu dokumenata. A MS Compatibility Pack nema alatku za konverziju nego samo omogućuje da se dokument otvori, znači svaki dokument bi morao da se konveruje "peške" jedan po jedan.


    Zato .odt dokument iz 2002. može da se edituje i dan danas, a moći će i za 100 godina jer je standardizovan, baš zbog problema sa zastarevanjem formata. MS je, sa druge strane, otišao u suštu suprotnost i napravio neviđenu papazjaniju uvođenjem .docx formata. Na fakultetu sam imao jedan ispit sa katedre za bibliotekarstvo i sećam se priče koja me tad nije mnogo zanimala, a ticala se baš formata i (ne)dugovečnosti dokumenata i zašto se svaka ozbiljna bibliotečka građa čuva u .odt jer ne planiraju da na svaki Majkrosoftov ćef rade konverziju tone dokumenata i miliona strana teksta pa da ga još posle ponovo indeksiraju, jer XML struktura nije ista i tako svakih nekoliko godina.


    OpenOffice i slični nisu rešenje u biznis svetu jer uvek imaju malo problema sa Majkrosoftovim formatima, mada i MS Office ima problema sa .odt (prelom često zna da se "prelomi" gde ne reba). Zato na poslu moram da čuvam svaki dokument u 3 formata: .doc, .docx i .pdf. Radim i editjuem .docx pa snimam dodatno u .doc i .pdf, pa ko mi javi da ne može da čita .docx (poreska uprava), šaljem u .doc, a ako ne želim da mi neko edituje dokument šaljem Digitaly Signed PDF. Dok sam se dokumentima bavio samo privatno mogao sam da ih čuvam kako kod, ali u biznis varijanti to uopšte nije tako jednostavno, još kad pomislim da će MS (možda) opet izmeniti format, jeza me podiđe. Za sad desktop Office može da edituje .doc, ali Mobile Office več ne može, ako je to tiha najava toga da Office 2015 možda neće podržavati .doc.... e tad bi nastao haos :)

    ReplyDelete
  16. Evo komentar za oba komentara iznad. Pricamo o velikim kompanijama i onda se okrecemo na telefon?! velike kompanije ne rade svoj posao na telefonu, tako jednostavno :) osim toga kada je WP izasao .doc je vec poceo da stari. sada imamo WP8.1 i vrijeme je da gledamo naprijed, a ne unazad. One firme koje imaju .doc formate njima nije problem kada otvore prvi put kada im zatreba taj dokument da ga nakon rada spreme kao docx. Nece se naravno sada sve rucno ici sve dokumente koje ima firma, ali ce se ici po potrebi, sve koje otvorim danas dokumente automatski spremam kao docx i gdje je problem?! Office na racunaru to radi bez problema. Ok razumijem kod nas se jos koristi .doc i neki ne zele nesto novo jer se boje da ce se nesto pokvariti ili da nece raditi kao sa .doc, to sve razumijem ali takve ljude treba poceti odbijati.


    Evo primjer, imao sam posao za jedan logotip sa stamparijom, nisu htjeli prihvatiti ni pdf ni adobe illustrator, ni PSD, ni Corel Draw format. Ja sam njima ovako ba otvoreno rekao "dovidenja naci cu sebi drugu stampariju". I slijedeca je mogla raditi sa pdf. Tako da onog ko ne zeli da napreduje treba samo ostaviti i tacka. Razumijem ja i finansijsku situaciju kod nas i da office nije bas jeftin ali office sada imamo i na webu koji je besplatan i ko ne zeli da plati ima to za izbor tako da ja ne vidim problem ovdje nikakav.

    I u kranjem slucaju ako firma zeli da konvertuje kao sto je Stefan iznad rekao postoje bulk skripte koje kada se kodiraju tacno i rade svoj posao tacno. Ja sam pravio par takvih skripti za doc-doxc format i png-jpeg konverzije i takve stvari.

    ReplyDelete
  17. Ilon Mask je ovde lepo sve objasio: http://www.blic.rs/IT/512977/Ilon-Mask-o-vestackoj-inteligenciji-Opasnost-preti-za-svega-pet-godina
    Inače čovek je poznat kao veliki protivnik Google Inc.

    ReplyDelete

Ostavite komentar