La straordinaria rete neurale di Google ti dice dove è stata scattata una foto

Rete neurale PlaNet

La rete neurale di Google continua a stupire. Con una nuova macchina di deep learning chiamata PlaNet, che è stata addestrata da 126 milioni di immagini e dai loro accompagnando i dati EXIF, ha raccolto la capacità "sovrumana" di individuare la posizione di quasi tutti foto.

Un team guidato da Tobias Weyand, uno specialista di visione artificiale di Google, ha creato PlaNet prendendo tutte quelle immagini e usandole per dividere il mondo in una griglia di oltre 26.000 quadrati. La dimensione di questi quadrati varia a seconda del numero di immagini associate a ciascuna posizione.

Ad esempio, le grandi città come New York, dove vengono scattate molte foto ogni giorno, hanno "una struttura a griglia più fine rispetto alle regioni più remote dove le fotografie sono meno comuni", spiega Revisione della tecnologia del MIT. Google ha ignorato gli oceani e le regioni polari.

Utilizzando 91 milioni di immagini, il team è stato in grado di insegnare a PlaNet a calcolare la posizione della griglia utilizzando solo l'immagine stessa. Il risultato è una macchina in grado di individuare la posizione oi probabili candidati quando viene alimentata una foto.

Il team ha testato PlaNet utilizzando 2,3 milioni di immagini georeferenziate da Flickr. È stato in grado di individuarne il 3,6% con "accuratezza a livello di strada", afferma Weyand, e un altro 10,1% con precisione a livello di città. PlaNet potrebbe determinare il paese di origine di 28,4 foto e il contenuto del 48 percento.

PlaNet è stato quindi messo alla prova contro gli esseri umani, che hanno la capacità di individuare le immagini utilizzando tutti i tipi di segnali, inclusi segnali stradali, stili architettonici e persino il tipo di vegetazione.

"Weyand e co hanno messo alla prova PlaNet in un test contro 10 umani ben viaggiati", aggiunge MIT. "Per il test, hanno utilizzato un gioco online che presenta un giocatore con una vista casuale presa da Google Street View e gli chiede di individuare la sua posizione su una mappa del mondo".

PlaNet è stata in grado di battere i giocatori umani vincendo 28 dei 50 round con un errore di localizzazione medio di 1131,7 km, mentre l'errore di localizzazione umano medio è stato di 2320,75 km.

"[Questo] esperimento su piccola scala mostra che PlaNet raggiunge prestazioni sovrumane nel compito di geolocalizzare le scene di Street View", ha affermato il team di Weyand.

"Pensiamo che PlaNet abbia un vantaggio sugli umani perché ha visto molti più posti di quanti un essere umano possa mai visitare e ha appreso sottili spunti di scene diverse che sono persino difficili da distinguere per un essere umano che ha viaggiato bene", hanno Inserisci.

PlaNet può persino individuare le immagini scattate in interni utilizzando foto simili legate ad album a cui sono allegati i dati sulla posizione. La cosa più impressionante della macchina è che richiede solo 377 MB di spazio, il che significa che si adatta facilmente al tuo smartphone o tablet.

Ultimo post sul blog

Il Nexus 6 ha le carte in regola per affrontare i nuovi iPhone di Apple?
August 20, 2021

Gli ultimi iPhone di Apple sono in spedizione da alcune settimane, ma molti hanno aspettato che Google mostrasse la sua mano prima di decidere qual...

Sony spera di salvare Xperia con aggiornamenti annuali simili a iPhone
August 20, 2021

Sony spera di salvare Xperia con aggiornamenti annuali simili a iPhoneA differenza di ogni altra grande azienda di smartphone, Apple lancia i nuovi...

Spotify Family consente a un massimo di 5 persone di condividere lo stesso abbonamento
August 21, 2021

Spotify Family consente a un massimo di 5 persone di condividere lo stesso abbonamentoSpotify sta finalmente consentendo agli amanti della musica d...