Root NationmorbidoRecensioni dei serviziRevisione di metà viaggio: creazione di immagini generate dall'intelligenza artificiale

Revisione di metà viaggio: creazione di immagini generate dall'intelligenza artificiale

-

Hai mai sognato di trasferire facilmente le immagini dalla tua immaginazione alla carta? Questo è ora possibile grazie a generatori di immagini come Midjourney.

Che tu sia un artista di talento o che tu non abbia alcuna esperienza con il pennello, ora puoi creare capolavori. Cioè, grazie all'intelligenza artificiale, puoi creare in pochi minuti immagini che prima rimanevano solo nella tua testa. Basta descriverli a parole e in un attimo l'immagine sarà pronta. Tutto questo grazie ad un interessante servizio Metà viaggio, che crea immagini generate dall'intelligenza artificiale. Incuriosito? Allora ti consiglio di scoprire più nel dettaglio cos'è Midjourney, come funziona e tutte le informazioni più importanti su questo strumento di intelligenza artificiale.

Leggi anche: Ho testato e intervistato il chatbot di Bing

Metà viaggio: di cosa si tratta?

Da Papa Francesco con una giacca brillante ai poster cinematografici ispirati a Wes Anderson, le immagini generate dall'intelligenza artificiale stanno diventando sempre più comuni su Internet. È facile capire perché: i moderni strumenti di intelligenza artificiale sono diventati così convincenti che le foto che creano hanno persino vinto prestigiosi premi fotografici.

- Annuncio pubblicitario -

Midjourney è un esempio di intelligenza artificiale generativa in grado di creare grafica basata su istruzioni testuali. Questo è solo uno dei tanti generatori di immagini basati sull'apprendimento automatico emersi di recente. Nonostante ciò, Midjourney è diventato uno degli strumenti di intelligenza artificiale più grandi e popolari nel suo genere, insieme a DALL-E e Stable Diffusion.

Non hai bisogno di hardware o software speciale per utilizzare Midjourney perché funziona tramite l'app di chat Discord. L'unico lato negativo? Così è. È la necessità di pagare una certa somma per iniziare a generare immagini che distingue Midjourney dalla maggior parte delle soluzioni concorrenti, che spesso offrono almeno una generazione gratuita di immagini.

Utilizzare Midjourney è però estremamente facile e accessibile a chiunque, in quanto il costo non è eccessivo e i risultati ottenuti possono essere davvero sorprendenti.

Interessante anche: L'artiglieria moderna è la super arma dell'Ucraina. E perché Elon Musk è qui?

La storia delle origini di Midjourney

A differenza di DALL-E, che è supportato dallo sviluppatore di Chat GPT, Midjourney si descrive come un progetto indipendente e autofinanziato. Il servizio è stato fondato da David Holtz, che è anche co-fondatore di Leap Motion, una nota startup di realtà virtuale e aumentata acquisita da UltraHaptics nel 2019.

- Annuncio pubblicitario -

Il team di Midjourney comprende figure di spicco come Jim Keller (ingegnere del processore Apple, AMD, Tesla, Intel e coautore di x86-64), Nat Friedman (CEO di Github e presidente della Fondazione GNOME) e Philip Rosedale (fondatore di Second Life).

Lo sviluppo dell'intelligenza artificiale del testo e delle immagini di Midjourney è iniziato in beta chiusa, che è stata poi spostata in beta aperta nel luglio 2022. Ciò ha consentito al pubblico di accedere e utilizzare lo strumento. È stata questa mossa che ha aiutato il servizio Midjourney a guadagnare popolarità. A differenza di altri strumenti di intelligenza artificiale, Midjourney era redditizio già nell’agosto 2022, confermando il suo successo sul mercato.

Interessante anche: ChatGPT: semplici istruzioni per l'uso

Come utilizzare Midjourney?

All'inizio l'uso di Midjourney può sembrare un po' complicato. Soprattutto da quando i creatori hanno deciso una decisione insolita. Vale a dire, invece di un'applicazione dedicata per la generazione di immagini, otteniamo un collegamento a un bot Discord chiamato Midjourney Bot. Quindi, esaminiamo tutti i passaggi necessari per creare un grafico utilizzando lo strumento Midjourney.

Iscriviti a Discord

Per iniziare con Midjourney, devi avere un account Discord. Discord è un'app di chat in qualche modo simile a Slack. Sebbene sia stato originariamente sviluppato per i giocatori che hanno bisogno di coordinare le tattiche mentre giocano a giochi online multiplayer come League of Legends e World of Warcraft, ora è estremamente popolare anche tra le altre comunità.

Quindi, come puoi vedere, prima di poter utilizzare Midjourney, devi creare un account Discord. È gratis. Visita la pagina Discord per iscriverti. Lì, segui tutti i passaggi secondo le istruzioni che appariranno. Se hai già, o hai appena creato, un account Discord, puoi passare al passaggio successivo.

Iscriviti a metà viaggio

Dopo aver configurato il tuo account Discord, vai su Midjourney e fai clic su "Partecipa alla beta". Si aprirà un invito a unirsi al canale Discord di Midjourney. Fai clic su "Accetta invito".

Come membro gratuito non potrai creare immagini, ma potrai visualizzare l'interfaccia. Puoi anche vedere le creazioni di altri utenti visitando le diverse stanze (denominate #newbies-14 e #newbies-21) per capire come funziona Midjourney.

- Annuncio pubblicitario -

Iscriviti a Midjourney

Per iniziare a generare immagini con Midjourney, devi acquistare un abbonamento. Per fare questo, visita Midjourney.com/account, accedi con il tuo account Discord verificato e scegli il piano di abbonamento adatto alle tue esigenze. Scriveremo dei prezzi dei singoli piani più avanti nel testo.

Unisciti al server Discord di Midjourney

Una volta che ti sei iscritto al server Discord di Midjourney e ti sei iscritto a un piano, puoi iniziare a generare immagini. Segui questi passi:

  • Apri Discord e assicurati di selezionare il server Midjourney nel menu a sinistra.
  • Dovresti vedere un lungo elenco di canali sul lato sinistro dello schermo.
  • Scegli uno dei canali che inizia con "newbies". Potrebbe essere necessario scorrere l'elenco per trovarlo.
  • Puoi scorrere il feed per vedere quali suggerimenti hanno utilizzato altri utenti per creare le loro immagini.

Come generare comandi

Nel canale per principianti o nel tuo canale, digita "/imagine" seguito dal testo delle istruzioni. Per avviare una chat privata con il bot, cerca l'icona del Bot Midjourney nell'elenco degli utenti sul lato destro dello schermo. Fare clic destro su di esso e selezionare "Invia messaggio" o "Messaggio".

Sii il più specifico possibile nella descrizione per fornire all'IA informazioni sufficienti per creare l'immagine desiderata. Ad esempio, puoi includere dettagli come stile, genere, umore e altri elementi per aiutare l'intelligenza artificiale a creare l'aspetto che immagini. Ne leggerete più avanti nel testo.

Interessante anche: Cosa sono le reti neurali e come funzionano?

Come creare suggerimenti efficaci in Midjourney

Chiunque abbia utilizzato Midjourney sa che meglio descrivi l'immagine che vuoi ottenere, più luminoso e unico sarà il risultato. Gli utenti di solito utilizzano istruzioni brevi e dirette. Ad esempio, dopo aver dato una semplice istruzione come “il robot usa l’intelligenza artificiale per creare grafica”, Midjourney creerà, tra le altre cose, qualcosa del genere:

l'immagine viene creata a metà viaggio

Come puoi vedere, istruzioni così semplici non sono sufficienti (o almeno non sempre) per ottenere i risultati desiderati, quindi la chiave del successo è scrivere il tooltip esplicativo perfetto.

Ti piace lo stile di questo o quell'artista? Vuoi che la tua grafica sia realizzata nello stile di un'altra epoca? Oppure c'è una tecnica specifica che vuoi che il generatore di immagini utilizzi? Tutto questo può essere raggiunto. L'intelligenza artificiale è un sistema addestrato che prende innumerevoli immagini di input per creare da esse una grafica perfetta. L’unica cosa di cui devi occuparti è fornire all’IA la migliore descrizione possibile di ciò che ti aspetti che faccia. ma come farlo? Fortunatamente conosciamo la risposta.

Punteggiatura

La maggior parte della punteggiatura utilizzata nei suggerimenti verrà ignorata da Midjourney. L'unica punteggiatura che Midjourney capisce è:

  • Le opzioni sono separate da doppi trattini, come “–ar 16:9” o “–v 5”.
  • I due punti separano i numeri interi, sia positivi che negativi. Ad esempio, "::-0.5".
  • Gli spazi servono come simbolo principale che separa gli elementi lessicali.

Strutturare i suggerimenti di metà viaggio

Innanzitutto ricordiamo che in Midjourney i prompt devono essere scritti in inglese, poi il programma li capirà al meglio. Ogni invito inizia con il comando /imagine e deve contenere la descrizione di ciò che desideri ricevere. È bene dare una struttura ai tuoi suggerimenti. Non è necessario, ma è sicuramente molto utile per ottenere la grafica desiderata il più rapidamente possibile e modificarla facilmente se necessario.

Nella prima parte della descrizione includi tutti gli elementi che meglio descrivono la tua immagine. Ad esempio, puoi chiedere a Midjourney di seguire un certo stile artistico, offrendoti di prenderlo come base. Ecco un esempio: "Immagine di un elefante nello stile di Van Gogh":

l'immagine viene creata a metà viaggio

Tuttavia, ciò che è veramente interessante di Midjourney è la sua capacità di riprodurre immagini che sembrano fotografie. Ci sono diverse cose da considerare per questo. Ad esempio, puoi scegliere il tipo di fotocamera che l'IA dovrebbe emulare: SLR per fotocamere a pellicola e DSLR per fotocamere DSLR. Puoi anche suggerire il tipo di obiettivo (18, 35, 50 o anche 250 mm) e il modello specifico di fotocamera.

Quindi puoi eseguire comandi aggiuntivi. Devono essere preceduti da un segno "-" e consentono di indirizzare l'IA verso aspetti specifici, come la versione Midjourney (v 4, v 5), proporzioni (3:2, 16:9, ecc.) o opzioni di stile (s 100 per medio, p 250 per alto o p 750 per molto alto). Valori bassi per l'opzione di stile producono immagini che corrispondono molto al tooltip, ma sono meno artistiche. Valori elevati creano una grafica molto più artistica, ma meno legata al tooltip.

Un elenco completo di opzioni e comandi è disponibile sul sito Web Midjourney.

Ecco un esempio del prompt e dell'immagine risultante:

immagine di un dolce topolino sdraiato sulla spiaggia. Foto con Canon R5, 50mm, DSLR, –v 5 –ar 3:2 –s 750

(immagine di un simpatico topo sdraiato sulla spiaggia. Foto con Canon R5, 50 mm, DSLR, –v 5 –ar 3:2 –s 750)

Illuminazione, ambiente, prospettiva: pensa ad ogni dettaglio

Per dare contesto alle tue foto, posiziona gli oggetti che hai creato in un ambiente specifico. Midjourney ti consente di rendere ultra realistiche scene incredibili. Potresti voler posizionare il tuo personaggio in una casa arredata in un certo stile, su una spiaggia o per le strade di una certa città.

Un altro aspetto a cui vale la pena prestare attenzione, poiché porta grandi effetti, è la luce. Nessuno ha bisogno di convincersi di quanto questo sia importante quando si scattano foto. Lo stesso vale per la grafica AI, che spesso assomiglia molto alle foto reali.

A seconda dell'ora del giorno, l'illuminazione è diversa. Pertanto, i colori e i contrasti nelle foto sono diversi. Midjourney è in grado di riprodurre questi contrasti. Ad esempio, non dovrai più aspettare il tramonto, basta chiedere di creare una foto specifica aggiungendo la parola "golden hour".

Un altro fattore con cui puoi giocare è l'angolo di visione dell'immagine. In alcuni casi, è necessario regolare l'ottica per questo, il che può modificare in modo significativo la grafica.

Ecco alcuni esempi di angoli che possono essere inclusi nei suggerimenti di metà viaggio: per scatti distanti, scatto grandangolare, scatto ultragrandangolare, scatto lungo, vista aerea o satellitare, scatto all'altezza degli occhi; primo piano – Primo piano, Ritratto glamour, Macro-Scatto o Macrofotografia.

Ecco una query di esempio e il suo risultato:

un bell'uomo che cammina per le strade di Los Angeles, ora d'oro Foto con una Canon R5, 50 mm, DSLR, –v 5 –ar 3:2 –s 750

(bel uomo che cammina per le strade di Los Angeles, foto dell'ora d'oro su Canon R5, 50mm, DSLR, –v 5 –ar 3:2 –s 750)

l'immagine viene creata a metà viaggio

Modifica le immagini con ridimensionamento e dispersione

Sotto ogni serie di immagini generate vedrai otto pulsanti: U1, U2, U3, U4, V1, V2, V3 e V4. Tutti questi pulsanti ti consentono di mettere a punto e controllare meglio il tipo di immagini da Midjourney.

Se stai utilizzando una versione precedente alla V5, i pulsanti U verranno utilizzati per ingrandire, ovvero ridimensionare l'immagine originale, creando una nuova versione più grande e con più dettagli. Sono numerati U1–U4, che vengono utilizzati per identificare le immagini nella sequenza. Ad esempio, se desideri ingrandire la seconda immagine, premi il pulsante U2 nella riga superiore. Gli ultimi modelli hanno per impostazione predefinita immagini da 1024×1024 pixel, quindi i pulsanti U le evidenziano semplicemente per modificarle successivamente e salvarle più facilmente.

A destra nella prima riga c'è il pulsante Reroll. Questo è un ottimo strumento se non sei soddisfatto della prima serie di immagini che Midjourney ha creato per te. Fai clic su questo pulsante di ricreazione per chiedere a Midjourney di provare un concetto diverso in base alla richiesta originale e otterrai quattro nuove immagini.

I pulsanti V creano quattro nuove varianti dell'immagine selezionata che si abbinano a loro per stile e composizione. Scegliendo tra V1 – V4, puoi selezionare il pulsante che corrisponde all'immagine per la quale desideri creare variazioni.

E ultimo ma non meno importante: la funzione /describe

Infine, ho lasciato dietro di me una grande squadra per renderti molto più semplice la creazione del suggerimento perfetto. Questa è una funzione /descrivere, che ti consente di caricare la tua immagine e generare quattro possibili query basate su quell'immagine. Come funziona? Dopo l'introduzione /descrivere apparirà una finestra di selezione delle foto dal disco del computer. Seleziona il file grafico appropriato, caricalo sul server e Midjourney ti offrirà 4 suggerimenti testuali che lo descrivono. Di seguito la descrizione della foto che ho inviato:

Come puoi vedere nello screenshot qui sopra, per ognuna delle quattro descrizioni fornite, saranno presenti dei pulsanti che permetteranno di utilizzare il suggerimento generato da Midjourney. Dopo aver selezionato un'immagine, viene visualizzata una finestra di testo con la descrizione selezionata. A questo punto puoi decidere se modificare il testo o lasciarlo così com'è stato creato.

Se vuoi ottenere i migliori risultati, ti suggerisco di ampliare il più possibile la descrizione e di utilizzare come base solo il testo generato dal programma. Dopo aver fatto clic su Invia, accetta semplicemente l'invito e invialo a Midjourney. Dopo un po' riceverai una risposta con immagini di esempio:

l'immagine viene creata a metà viaggio

Per confronto, di seguito è riportata la foto che ho caricato come esempio e la foto che ho selezionato tra i suggerimenti presentati:

Leggi anche: A proposito di computer quantistici in parole semplici

Quanto costa Midjourney? Può essere utilizzato gratuitamente?

Anche se siamo abituati a chatbot come ChatGPT e Bing Chat che offrono un utilizzo gratuito quasi illimitato, non è il caso dei generatori di immagini. Quasi tutti presentano alcune limitazioni e Midjourney non è più gratuito tranne che per alcuni brevi periodi promozionali.

Quando il servizio è stato lanciato per la prima volta nel luglio 2022, chiunque poteva utilizzarlo per creare 25 immagini gratuitamente. Tutto quello che dovevi fare era creare un account Discord gratuito e unirti al server Midjourney. La versione di prova gratuita è stata attivata subito dopo l'invio della prima richiesta. Tuttavia, quando raggiungevi il limite di 25 immagini, dovevi passare a un piano a pagamento.

Tutto è cambiato nell'aprile 2023, quando il CEO di Midjourney ha annunciato la sospensione del programma di prova gratuita. Nell'ultimo anno, Midjourney è diventato molto popolare e gli utenti sono ansiosi di condividere la grafica che creano sui social network. Perché i creatori hanno deciso di fare un passo del genere?

La decisione di abbandonare la versione gratuita è facilmente comprensibile. Ogni attività di imaging richiede molta potenza di calcolo, in particolare unità di elaborazione grafica (GPU). Inoltre, ogni GPU ha una memoria video limitata, che viene utilizzata in grandi volumi per il processo di denoising.

Nello specifico, i generatori di immagini utilizzano GPU assetate di energia, che non solo costano molti soldi, ma sono anche disponibili solo in quantità limitate. Pertanto, al fine di mantenere la qualità dei servizi, l'azienda ha interrotto il periodo di prova gratuita fino a nuovo avviso, il che non dovrebbe sorprendere nessuno.

Ma un giorno la prova gratuita potrebbe tornare. Ad esempio, con il lancio della versione 5.1, Midjourney ha ripristinato la prova gratuita di una settimana.

Tuttavia, per utilizzare Midjourney in qualsiasi momento, è necessario acquistare uno dei quattro piani di abbonamento. Il prezzo più basso è $ 10 al mese. Cosa ottieni in cambio? In media, Midjourney crea una nuova immagine in un minuto. Tuttavia, potresti dover dedicare un po' più di tempo se desideri un'immagine ridimensionata o un'immagine con proporzioni non quadrate. Quindi possiamo supporre che il piano Basic più economico offra 3,3 ore di tempo GPU, che è sufficiente per generare circa 200 generazioni di immagini.

Con ogni abbonamento più alto, ottieni un limite più alto che ti consente di creare più immagini al mese. Pertanto, il piano successivo, Standard, fornisce 15 ore di generazione rapida di immagini e generazione illimitata più lenta (modalità Relax) per $ 30 al mese. Poi arriva il piano Pro, che costa $ 60 al mese e offre 30 ore di imaging veloce, imaging lento illimitato e modalità invisibile.

Nel luglio 2023 è stato aggiunto il piano Mega, che costa $ 120 e ti offre 60 ore di generazione rapida di immagini e, ovviamente, ore illimitate di modalità Relax.

Come puoi vedere, tutti i piani Midjourney di livello superiore offrono foto illimitate in modalità Relax, ma devi attendere fino a 10 minuti per ottenere le immagini.

Il livello più basso non ha questa funzionalità, ma a $ 10 al mese vale la pena iniziare il tuo viaggio di Midjourney. Questo piano ti consente di esplorare la piattaforma, creare immagini e familiarizzare con l'interfaccia e con il funzionamento dei suggerimenti di testo. Se ti piace ciò che vedi, puoi sempre portarlo al livello successivo semplicemente digitando il messaggio /iscriviti per accedere al tuo account dove potrai aggiornare facilmente il tuo strumento Midjourney.

Vale anche la pena ricordare che Midjourney a volte lancia promozioni e offre piani annuali con uno sconto del 20%:

  • Piano base con abbonamento annuale: $ 8 al mese
  • Il piano standard con abbonamento annuale è di $ 24 al mese
  • Piano Pro con abbonamento annuale: $ 48 al mese
  • Piano mega con abbonamento annuale: $ 96 al mese.

Midjourney e diritti di proprietà

I generatori di immagini AI imparano da miliardi di immagini di fotografi e artisti. La metà del viaggio non fa eccezione. Molti artisti ritengono che i generatori di immagini basati sull’intelligenza artificiale stiano violando il diritto d’autore utilizzando il loro lavoro per scopi educativi. Alcuni artisti hanno addirittura presentato denunce negli Stati Uniti contro generatori di intelligenza artificiale come Midjourney, Stability AI e DeviantArt. Tuttavia, l’altra parte sostiene che il processo di apprendimento rientra nella categoria del fair use. Quindi chi è l’effettivo proprietario di un’immagine generata dall’intelligenza artificiale?

Il fondatore di Midjourney, David Holtz, ha ammesso in un'intervista a Forbes di utilizzare le immagini senza il consenso dei proprietari, perché è praticamente impossibile con una serie di dati così grande.

Quindi, sappiamo che queste immagini sono libere da copyright, ma la grafica che hai creato potrebbe essere soggetta a copyright? La risposta non è semplice, ma in generale gli artisti AI possono utilizzare, anche a fini commerciali, le immagini create da Midjourney, ma non possono impedire ad altri di utilizzarle.

Leggi anche: 7 usi più interessanti di ChatGPT

Alternative a metà viaggio

DALL-E

DALL-E è la prima intelligenza artificiale generativa diventata molto popolare nei social network. Inizialmente, quando è stato lanciato nel 2021, la grafica prodotta lasciava molto a desiderare. Tuttavia, l'ultima versione, DALL-E 2, è di un altro livello grazie ad una migliore comprensione del linguaggio e ad una maggiore qualità dell'immagine. DALL-E può anche modificare immagini esistenti, consentendoti di sostituire o aggiungere oggetti completamente nuovi.

Creatore di immagini Bing

Se desideri un'alternativa gratuita a Midjourney, puoi scegliere Bing Image Creator. Bing Image Creator è integrato nella barra laterale Microsoft Edge, in modo da potervi accedere mentre si utilizza il browser. Grazie alla partnership Microsoft con OpenAI puoi utilizzare gratuitamente il generatore di immagini DALL-E 2 tramite Bing.

Studio dei sogni

Midjourney attualmente funziona solo tramite Discord, che potrebbe non essere molto intuitivo da usare. DreamStudio, invece, offre un sito ricco di tanti pulsanti e manopole da personalizzare, ma può sembrare piuttosto complicato. DreamStudio utilizza il modello aperto di diffusione stabile.

Sam Stable Diffusion è un software gratuito e open source che puoi installare ed eseguire sul tuo computer. Tuttavia, ciò richiede alcune conoscenze di programmazione e una notevole potenza di calcolo. Per questo motivo Stability AI, la società responsabile di questo modello, ha creato una piattaforma chiamata DreamStudio. Similmente al modello Midjourney, Stable Diffusion crea quattro immagini diverse basate su un singolo comando (cue). L'utente potrà poi modificarli o utilizzarli come base per la creazione di nuova grafica. Il modello può anche essere perfezionato in modo che le immagini generate siano più coerenti con la richiesta dell'utente oppure possono essere utilizzate più fasi di calcolo, il che può portare a un risultato più accurato.

Midjourney merita la tua attenzione?

Midjourney è noto per la produzione di immagini ben strutturate, definite e realistiche, rendendolo un forte concorrente di altri strumenti di intelligenza artificiale come DALL-E e Stable Diffusion.

Questo strumento può creare immagini con una risoluzione fino a 1792×1024 pixel, che fornisce immagini più dettagliate.

Midjourney è alimentato da Discord, una piattaforma di comunicazione ampiamente utilizzata. Gli utenti possono interagire con il bot AI utilizzando semplici comandi, rendendolo accessibile anche a persone senza esperienza di programmazione. Anche se allo stesso tempo questo è uno dei suoi svantaggi, perché è legato solo alla piattaforma Discord. Non piacerà a tutti. Personalmente ho trovato più semplice installare separatamente l'app Midjourney.

l'immagine viene creata a metà viaggio

Sebbene gli sviluppatori assicurino che è il server Discord di Midjourney a fornire una comunità attiva in cui gli utenti possono condividere le proprie creazioni, porre domande e ottenere aiuto sia dagli altri utenti che dal team di Midjourney.

Non mi piaceva che le immagini generate fossero pubbliche. Cioè, le immagini che crei con Midjourney non ti appartengono. Puoi usarli (con restrizioni), anche a scopo commerciale, ma possono anche essere usati in modo del tutto legale da altri utenti. Midjourney mostra anche le creazioni di maggior successo, inclusi i messaggi di testo, sul proprio sito web.

Il team di Midjourney lavora costantemente per migliorare ed espandere le capacità dell'intelligenza artificiale, garantendo che lo strumento rimanga rilevante nell'ambiente dell'intelligenza artificiale in continua evoluzione. Ecco perché lo strumento non dispone di una versione gratuita. Questo potrebbe non piacere a molti potenziali utenti, ma vale la pena spendere $ 10 per generare i tuoi "veri" capolavori con Midjourney.

Interessante anche: