Νέο AI εργαλείο από τη Google που τροφοδοτείται από εικόνες και όχι κείμενο

0


Εκτός από το πολύ εντυπωσιακό Veo 2, η Google ανακοίνωσε και ένα ακόμη εργαλείο Τεχνητής Νοημοσύνης που ονομάζεται Whisk. Προς το παρόν είναι ένα πειραματικό εργαλείο δημιουργίας εικόνων που σας επιτρέπει να υποβάλλετε εικόνες ως δεδομένα αντί για λεπτομερείς γραπτές υποδείξεις για να λάβετε ως αντάλλαγμα μια αναμειγμένη εικόνα.

Μπορείτε να εισάγετε πολλαπλές εικόνες για διάφορες πτυχές, όπως το θέμα, το στυλ και τη σκηνή. Στη συνέχεια, το Whisk χρησιμοποιεί το Gemini για να δημιουργήσει μια προτροπή κειμένου στο background και την τροφοδοτεί στο μοντέλο δημιουργίας εικόνων Imagen 3 της Google.

Για λόγους αναφοράς, το μοντέλο μετατροπής κειμένου σε εικόνα λανσαρίστηκε νωρίτερα φέτος και η Google ισχυρίζεται ότι το Imagen 3 είναι το «μοντέλο εικόνας με την υψηλότερη ποιότητα, ικανό να παράγει εικόνες με ακόμη καλύτερη λεπτομέρεια, πλουσιότερο φωτισμό και λιγότερα ενοχλητικά τεχνουργήματα από τα προηγούμενα μοντέλα μας».

Η Google εξήγησε ότι το νέο εργαλείο παραγωγικής τεχνητής νοημοσύνης της «αποτυπώνει την ουσία του θέματος, όχι ένα ακριβές αντίγραφο». Το εργαλείο δεν εξάγει όλα τα χαρακτηριστικά από την εικόνα εισόδου, γεγονός που μπορεί να κάνει την εικόνα εξόδου να διαφέρει από τις προσδοκίες σας. Για παράδειγμα, το θέμα της παραγόμενης εικόνας μπορεί να έχει διαφορετικό τόνο δέρματος, ύψος ή χτένισμα.

Το Whisk σάς επιτρέπει να προσαρμόσετε την προτροπή κειμένου ώστε να αναπληρώσει τα σημαντικά στοιχεία που μπορεί να έχει χάσει στην παραγόμενη εικόνα. «Καταλαβαίνουμε ότι αυτά τα χαρακτηριστικά μπορεί να είναι ζωτικής σημασίας για το έργο σας και το Whisk μπορεί να χάσει το στόχο, γι’ αυτό σας δίνουμε τη δυνατότητα να βλέπετε και να επεξεργάζεστε τις υποκείμενες προτροπές ανά πάσα στιγμή», αναφέρει η Google.

Ωστόσο, η εταιρεία πρόσθεσε ότι το πειραματικό εργαλείο δεν είναι ένα παραδοσιακό πρόγραμμα επεξεργασίας εικόνων, αλλά περισσότερο ένα «δημιουργικό εργαλείο» για την εξερεύνηση νέων ιδεών και τη χρήση εικόνων για μια γρήγορη και διασκεδαστική δημιουργική διαδικασία.

Το Whisk κυκλοφορεί προς το παρόν μόνο για όσους χρήστες ζουν στις ΗΠΑ και έχουν εγγραφεί στο πρόγραμμα Google Labs, το οποίο προσφέρει πρόσβαση στις πειραματικές δυνατότητες παραγωγικής AI της Google.

[via]



Πηγή