Con la super-risoluzione di Google la fantascienza diventa realtà
Nonostante venga spesso ridicolizzata in film e programmi tv, la ricerca nel miglioramento delle immagini si sta effettivamente insinuando sempre più nel regno della fantascienza. Basta dare un'occhiata all'ultima tecnologia AI di Google per l'upscaling delle foto.
In un post intitolato "High Fidelity Image Generation Using Diffusion Models" pubblicato sul Google AI Blog, i ricercatori del Brain Team di Google condividono le nuove scoperte che hanno fatto nel campo della super-risoluzione.
Nella super-risoluzione, un modello di apprendimento automatico viene addestrato per trasformare una foto a bassa risoluzione in una foto dettagliata ad alta risoluzione, e le potenziali applicazioni vanno dal restauro di vecchie foto di famiglia al miglioramento dell'imaging medico.
Google ha esplorato un concetto chiamato "modelli di diffusione", che è stato proposto per la prima volta nel 2015, ma che, fino a poco tempo fa, era stato messo in secondo piano rispetto a una famiglia di metodi di apprendimento profondo chiamati "modelli generativi profondi". L'azienda ha scoperto che i suoi risultati con questo nuovo approccio battono le tecnologie esistenti.
Il primo approccio si chiama SR3, o Super-Resolution via Repeated Refinement. Ecco la spiegazione tecnica:
"SR3 è un modello di diffusione di super-risoluzione che prende come input un'immagine a bassa risoluzione, e costruisce una corrispondente immagine ad alta risoluzione dal rumore", scrive Google. "Il modello è addestrato su un processo di corruzione dell'immagine in cui il rumore viene progressivamente aggiunto a un'immagine ad alta risoluzione fino a quando rimane solo rumore puro."
Da qui il processo si inverte, sintetizzando i dati dal rumore puro, eliminandolo gradualmente. Si ottiene così la stessa immagine in una definizione migliore, anche fino a quattro volte migliore di quella iniziale.SR3 ha dimostrato di funzionare bene nell'upscaling di ritratti e immagini naturali. Quando viene utilizzato per fare l'upscaling 8x sui volti, ha un "tasso di confusione" di quasi il 50% mentre i metodi esistenti arrivano solo al 34%, suggerendo che i risultati sono davvero foto-realistici.
Google ha pubblicato una serie di esempi che mostrano foto a bassa risoluzione upscalate a cascata. Una foto 32×32 può essere migliorata a 64×64 e poi a 256×256. Una foto 64×64 può essere scalata a 256×256 e poi a 1024×1024.