Apple predstavio AI model koji uređuje fotografije na osnovu tekstualnih komandi

Apple danas još uvijek nije jedan od najvećih igrača na polju umjetne inteligencije, no sada je kompanija predstavila novi open source AI model za uređivanje fotografija, kojim je pokazala da može dati doprinos na ovom polju.

Riječ je o modelu nazvanom MLLM-Guided Image Editing (MGIE), koji koristi multimodalne velike jezičke modele (MLLM) kao bi interpretirao komande bazirane na tekstu prilikom manipulisanja fotografijama. Drugim riječima, alat ima mogućnost uređivanja fotografija na osnovu teksta koji korisnik upisuje.

Kompanija je razvila MGIE u saradnji s istraživačima s Univerziteta u Kaliforniji. MLLM-ovi imaju mogućnost da transformišu jednostavne ili dvosmislene tekstualne upute u detaljnije i jasnije upute, koje sam uređivač može slijediti. Na primjer, ako korisnik želi urediti fotografiju pizze kako bi je “učinio zdravijom”, MLLM to može protumačiti kao zahtjev za dodavanje povrća te na taj način urediti fotografiju.

Pored velikih promjena na fotografijama, MGIE također može izrezivati, mijenjati veličinu i rotirati fotografije, ali i poboljšati svjetlinu, kontrast i balans boja, sve kroz tekstualne naredbe. Također, može urediti i specifične dijelove fotografije, ali i modificirati kosu, oči i odjeću na osobi te ukloniti elemente koji se nalaze u pozadini.

Apple je plasirao model preko GitGuba, no oni koji su zainteresovani mogu ispobati demo verziju dostupnu putem Higging Faces Spacesa.

Apple još uvijek nije otkrio da li planira iskoristiti naučeno u ovom projektu za alat ili funkciju koju bi integrisao u neki od svojih proizvoda.

Pregledi: 144