Laa controversia continua a circondare il mondo delle immagini generate da intelligenza artificiale
La controversia continua a circondare il mondo delle immagini generate da intelligenza artificiale e, anche se questa settimana al World Economic Forum le immagini generate da IA utilizzate nelle elezioni sono diventate motivo di preoccupazione, le startup continuano a sviluppare nuovi strumenti di IA per i creatori.
L'ultima è Recraft, un generatore di grafica AI rivolto a professionisti, che ha raccolto una serie A da 12 milioni di dollari guidata da Khosla Ventures nella Silicon Valley, insieme all'ex CEO di GitHub, Nat Friedman. Hanno partecipato anche RTP Global, Abstract VC, Basis Set Ventures, Elad Gil e vari altri investitori angeli.
A dire il vero, ora ci sono molti strumenti di progettazione AI generativa, come Jasper, Adobe Sensei, Let's Enhance e molti altri. Tuttavia, Recraft afferma di essere uno dei primi a essere uno strumento "fondamentale", nel senso che sta costruendo il suo Modello Fondamentale - un algoritmo di apprendimento profondo preaddestrato - per generare elementi di design coerenti, come icone e immagini, che possono essere personalizzati e utilizzati all'interno dei controlli di stile di un marchio. Afferma anche di averne raccolti più di 300.000 dal suo lancio otto mesi fa.
Ma questo non è progettato come uno strumento per generare immagini divertenti di cani cowboy che cavalcano cavalli, o simili. Oltre a essere in grado di produrre queste "immagini raster", può anche generare immagini vettoriali che sono infinitamente scalabili e utilizzate nelle sfere professionali della grafica, a differenza delle piattaforme in cui la qualità delle immagini spesso è limitata.
Forse questo è da aspettarsi, dato che la fondatrice, Anna Veronika Dorogush, non è esattamente una fondatrice non tecnica. Ha creato CatBoost, una libreria open source ad alte prestazioni per il boosting su alberi decisionali, ad esempio. Ex responsabile dei sistemi di apprendimento automatico del motore di ricerca Yandex a Mosca, Dorogush e il suo team di 13 persone sono oggi basati a Londra.
Mi ha detto in una chiamata che la raccolta di fondi alimenterà i suoi tentativi di costruire il proprio modello fondamentale: "Dovete fornire molti controlli sulle uscite agli utenti... sullo stile, in modo che si possano ottenere immagini coerenti, e controllo su cose come i colori del marchio o il livello di dettaglio, e anche la possibilità di iterare sull'immagine risultante".
"Ma se il modello inizialmente non può generare un giocatore di biliardo o una ballerina di danza classica, questo significa che semplicemente utilizzare il raffinamento fine non è sufficiente per fornire una generazione di alta qualità, per ora. Quindi dobbiamo costruire il nostro modello e stiamo lavorando su questo proprio ora", ha aggiunto.
Dice che Recraft è molto rivolto ai professionisti: "Ciò che è unico in ciò che stiamo facendo è che non forniamo solo generazione di immagini. Forniamo anche controllo dello stile: la possibilità di creare il proprio stile e quindi generare immagini nel proprio stile... Questo è importante se si vuole creare un marchio e farlo crescere, creare materiali di marketing, creare annunci coerenti".
Le ho chiesto quale fosse la probabilità che potessero essere citati in giudizio da un artista il cui stile fosse stato utilizzato sulla piattaforma Recraft.
"Nelle nostre condizioni affermiamo che se un artista carica qualcosa nel sistema come riferimento sterile - come l'immagine per la quale potranno generare nuove immagini - non utilizziamo quelli per addestrare il nostro modello", afferma Dorogush.
"Non utilizziamo quelli per addestrare il nostro modello."
Ha aggiunto che Recraft aggiunge effettivamente stili generici alle immagini caricate dagli artisti: "Fornisci lo stile al modello. Quindi hai un riferimento di stile. E poi generi immagini utilizzando questo riferimento di stile. Quindi è l'azione dell'utente a fornire lo stile".
Dorogush sostiene anche che, anziché sostituire i grafici, strumenti come Recraft renderanno semplicemente la progettazione grafica più accessibile nelle aree in cui attualmente potrebbe essere stata utilizzata un'immagine stock poco ispirante: "Un anno fa, se stavi scrivendo un libro per bambini, ottenevi immagini stock. Ora, le stesse persone sono in grado di avere illustrazioni e immagini molto più belle nello stesso libro".
Naturalmente, Recraft non è l'unica startup che gioca in questo settore, e l'anno scorso ho coperto come Kittl, con sede a Berlino, aveva raccolto una serie A di 10,8 milioni di euro (11,6 milioni di dollari) per la sua piattaforma di progettazione che consente agli utenti di trasformare le idee in prodotti grafici per creare design di alta qualità, velocemente.
Questa settimana il CEO Nicolas Heymann mi ha detto in una chiamata che prodotti come Recraft fanno parte di un insieme sempre più sofisticato di strumenti che forniscono alternative per i progettisti: "Penso che se Recraft riesce a produrre con successo asset di design - in modo simile a come i modelli di generazione di immagini possono essere una buona sostituzione oggi per le librerie di foto stock - allora sicuramente potrebbero prendere [una parte di mercato] di quelle librerie di icone".
Dorogush dice che c'è spazio per più di un attore in questo momento e che Kittl ha un caso d'uso diverso da Recraft: "Abbiamo una tecnologia unica per la costruzione di immagini coerenti nello stile, ed è lì il nostro principale focus. Ci stiamo concentrando su grafici e marketer che hanno bisogno di una coerenza di stile, mentre Kittl si concentra sulla merce, e ho un grande rispetto per loro. Sono un'ottima azienda".