Root NationNotiziaGiornale informaticoCome nei film: la nuova intelligenza artificiale di elaborazione delle foto di Google rende il ridimensionamento e il miglioramento delle immagini una realtà

Come nei film: la nuova intelligenza artificiale di elaborazione delle foto di Google rende il ridimensionamento e il miglioramento delle immagini una realtà

-

Probabilmente hai visto film fantasy o programmi TV in cui il personaggio principale chiede di ingrandire l'immagine e migliorare il risultato: mostrare un volto, una targa o qualsiasi altro dettaglio chiave. Gli ultimi sistemi di intelligenza artificiale (AI) di Google, basati sul cosiddetto modelli di diffusione, sono in grado di eseguire questo trucco.

È un processo complicato da padroneggiare perché essenzialmente si tratta di aggiungere dettagli a un'immagine che la fotocamera non ha originariamente catturato, usando supposizioni super intelligenti basate su altre immagini simili.

Google

In Google, questa tecnica è chiamata sintesi naturale dell'immagine e, in questo particolare scenario, risoluzione dell'immagine ultraelevata. Inizi con una piccola foto pixelata e finisci con qualcosa di nitido, chiaro e naturale. Potrebbe non essere esattamente l'originale, ma è abbastanza vicino da sembrare reale all'occhio umano.

Google ha introdotto due nuovi strumenti di intelligenza artificiale per questo lavoro. Il primo si chiama SR3, o Super-Resolution via Repeated Refinement, e funziona aggiungendo rumore a un'immagine e poi rimuovendolo. Attraverso una serie di calcoli probabilistici basati su un ampio database di immagini e alcune magie di apprendimento automatico, SR3 può immaginare come appare una versione ad altissima risoluzione di un'immagine pixel a bassa risoluzione.

Il secondo strumento è CDM, o Cascaded Diffusion Models. Google li descrive come "pipeline" lungo le quali i modelli di diffusione, incluso SR3, possono essere indirizzati per l'upscaling di immagini di alta qualità. Prende modelli di miglioramento e li trasforma in immagini più grandi.

Google

Utilizzando diversi modelli di miglioramento a diverse risoluzioni, l'approccio CDM è in grado di superare i metodi alternativi di upscaling delle immagini, secondo Google. Il nuovo motore AI è stato testato su ImageNet, un gigantesco database di immagini di addestramento comunemente utilizzate per la ricerca nel riconoscimento visivo degli oggetti.

I risultati finali di SR3 e CDM sono impressionanti. In un test standard con 50 volontari umani, le immagini di volti umani generate da SR3 sono state scambiate per foto reali circa il 50% delle volte e considerando che un algoritmo ideale dovrebbe raggiungere il 50%, è impressionante. Vale la pena ripetere che queste immagini migliorate non sono corrispondenze esatte degli originali, sono simulazioni attentamente calcolate basate sulla matematica della probabilità.

Google

Google promette molto di più dai suoi nuovi motori di intelligenza artificiale e tecnologie correlate, non solo in termini di aumento delle immagini di volti e altri oggetti naturali, ma anche in altre aree della modellazione probabilistica.

Leggi anche:

Iscrizione
Avvisare su
ospite

0 Commenti
Recensioni incorporate
Visualizza tutti i commenti