Categories: Facebook

Το νέο AI μοντέλο παραγωγής video της Google «γονατίζει» το Sora της OpenAI


Πριν από λίγο καιρό, η OpenAI κυκλοφόρησε το Sora, ένα μοντέλο μετατροπής κειμένου σε βίντεο που έχει σχεδιαστεί για τη δημιουργία σύντομων, υψηλής ποιότητας κλιπ, ζωντανεύοντας τις λέξεις με τρόπο που μοιάζει σχεδόν υπερβολικά αληθινό. Η παγίδα είναι ότι έχει ανώτατο όριο τα 20 δευτερόλεπτα και παρέχει περιεχόμενο HD (1080p).

Όμως, η Google DeepMind δεν πάει πίσω και μάλιστα εντείνει τον ανταγωνισμό με την κυκλοφορία του Veo 2, του διαδόχου του Veo 1. Σύμφωνα με την DeepMind, το Veo 2 μπορεί να δημιουργήσει ολοκληρωμένα βίντεο 4K που μπορούν να διαρκέσουν έως και 2 λεπτά. Η DeepMind αναφέρει ότι επεκτείνει την πρόσβαση, ωστόσο, για την ώρα το VideoFX δεν είναι διαθέσιμο στη χώρα μας.

Ένα παράδειγμα που μοιράζονται στην ιστοσελίδα τους είναι ένα video που δημιουργήθηκε από μια προτροπή που είναι όσο πιο λεπτομερής γίνεται. Η προτροπή περιγράφει

Η κάμερα αιωρείται απαλά μέσα από σειρές ξύλινων κυψελών ζωγραφισμένων με παστέλ χρώματα, με τις μέλισσες να βουίζουν και να γλιστρούν μέσα και έξω από το κάδρο. Η κίνηση εγκαθίσταται στον εκλεπτυσμένο αγρότη που στέκεται στο κέντρο, με την πεντακάθαρη λευκή μελισσοκομική του στολή να λάμπει στο χρυσό απογευματινό φως. Σηκώνει ένα βάζο με μέλι, γέρνοντάς το ελαφρά για να πιάσει το φως. Πίσω του, ψηλά ηλιοτρόπια λικνίζονται ρυθμικά στο αεράκι, με τα πέταλά τους να λάμπουν στο ζεστό φως του ήλιου. Η κάμερα γέρνει προς τα πάνω για να αποκαλύψει ένα ρετρό αγροτόσπιτο με πράσινα παραθυρόφυλλα, στους τοίχους του οποίου πέφτουν σκιές από τα δέντρα που λικνίζονται. Γυρισμένο με φακό 35mm σε φιλμ Kodak Portra 400, το χρυσό φως δημιουργεί πλούσιες υφές στα γάντια του αγρότη, στο βάζο μαρμελάδας και στο φθαρμένο ξύλο των κυψελών.

Αν και αυτά τα παραδείγματα είναι εντυπωσιακά, αξίζει να αναφέρουμε ότι η DeepMind πιθανώς τα επέλεξε για να αναδείξει τα καλύτερα από αυτά που μπορεί να κάνει το Veo 2. Δεν είναι όλα τέλεια. Ένας από τους περιορισμούς που έχουν επισημάνει είναι ότι η δημιουργία σύνθετων σκηνών ή κινήσεων μπορεί να εξακολουθεί να αποτελεί πρόκληση για το μοντέλο.

[via]



Πηγή

iTech News

Leave a Comment
Share
Published by
iTech News

Recent Posts

Apple: Ετοιμάζει αλλαγές στο Magic Mouse -Στην κορυφή της λίστας αυτό που ζητάνε εδώ χρόνια οι χρήστες

Η Apple «δουλεύει» προκειμένου να φέρει στην αγορά ένα επανασχεδιασμένο Magic Mouse κάποια στιγμή μέσα στο 2026,…

4 ώρες ago

Ανανεώθηκε για 3η και 4η (και τελευταία) σεζόν!

Η Apple ανακοίνωσε ότι ανανέωσε τη βραβευμένη σειρά επιστημονικής φαντασίας Silo για τρίτη και τέταρτη…

6 ώρες ago

Οι εφαρμογές και τα παιχνίδια με τα περισσότερα downloads για iPhone και iPad το 2024

Καθώς το 2024 πλησιάζει προς το τέλος του, και αφότου η ίδια ανέδειξε τις κορυφαίες…

6 ώρες ago

Νέο AI εργαλείο από τη Google που τροφοδοτείται από εικόνες και όχι κείμενο

Εκτός από το πολύ εντυπωσιακό Veo 2, η Google ανακοίνωσε και ένα ακόμη εργαλείο Τεχνητής…

6 ώρες ago

Οι επιχειρηματικές δαπάνες για την τεχνητή νοημοσύνη αυξήθηκαν κατά 500% φέτος, στα 13,8 δισεκατομμύρια δολάρια

Οι επιχειρηματικές δαπάνες για την τεχνητή νοημοσύνη αυξήθηκαν κατά 500% φέτος, στα 13,8 δισεκατομμύρια δολάρια…

16 ώρες ago

Εντυπωσιακή εμπειρία χρήσης με τη δύναμη του Galaxy AI!

Η Samsung, με την 6η γενιά των Galaxy Z Fold6 και Z Flip6, σηματοδοτεί ένα…

17 ώρες ago

Αυτό το site χρησιμοποιεί cookies, για την παροχή των υπηρεσιών της, να προσαρμόσετε τις διαφημίσεις και να αναλύσει την επισκεψιμότητα. Με τη χρήση αυτής της ιστοσελίδας, συμφωνείτε με τη πολιτική χρήση των cookies.