Η πανίσχυρη AI παραγωγής video του OpenAI έρχεται τον Φεβρουάριο

0


Η OpenAI υπόσχεται να κυκλοφορήσει το Sora, το μοντέλο παραγωγής βίντεο επόμενης γενιάς, από τον Φεβρουάριο. Τη Δευτέρα, η εταιρεία έδωσε τελικά μια λειτουργική έκδοση του στο πλαίσιο της εκδήλωσης «12 Days of OpenAI». «Αυτό είναι ένα κρίσιμο μέρος του χάρτη πορείας της AGI», δήλωσε ο CEO της OpenAI, Sam Altman, κατά τη διάρκεια της ζωντανής μετάδοσης της εταιρείας.

Ο YouTuber Marquis Brownlee φέρεται να απέκτησε πρώιμη πρόσβαση στη μηχανή παραγωγής βίντεο και δημοσίευσε μια σύντομη κριτική στο κανάλι του το πρωί της Δευτέρας. Το Sora φαίνεται να μην είναι χτισμένο πάνω στο GPT-4, όπως είναι σχεδόν όλα τα άλλα εργαλεία παραγωγής της OpenAI. Το μοντέλο δεν είναι διαθέσιμο μέσω της ιστοσελίδας του ChatGPT, αλλά αντ’ αυτού μέσω του Sora.com (το οποίο δεν είναι ακόμα διαθέσιμο μέχρι τη δημοσίευση αυτής της ανάρτησης).

Το μοντέλο είναι ικανό να παράγει βίντεο σε αναλύσεις που κυμαίνονται από 480p έως 1080p και σε διάρκεια από 5 έως 20 δευτερόλεπτα, είτε από προτροπές κειμένου είτε από εικόνες αναφοράς. Είναι επίσης ικανό να επεξεργάζεται και να επεκτείνει υπάρχοντα βίντεο κλιπ. Στους συνδρομητές του ChatGPT Plus θα επιτρέπεται η δημιουργία έως 50 κλιπ σε ανάλυση έως 720p ανά μήνα και λιγότερα βίντεο σε υψηλότερες αναλύσεις, διάρκειας πέντε δευτερολέπτων το καθένα. Στους χρήστες Pro θα επιτραπούν απεριόριστες παραγωγές σε όλες τις αναλύσεις και διάρκειες έως και 20 δευτερόλεπτα. Εκτός από τα εργαλεία επεξεργασίας, το Sora προσφέρει επίσης μια λειτουργία «storyboard» που θα επιτρέπει στους δημιουργούς να συνδυάζουν πολλαπλές προτροπές σε μια ενιαία κινηματογραφική σκηνή.

Ο Brownlee σημειώνει ότι το μοντέλο χρειάζεται «μερικά λεπτά» για να δημιουργήσει ένα κλιπ ανάλυσης 1080p, αλλά σημειώνει ότι «αυτό είναι επίσης, όπως τώρα, όταν σχεδόν κανείς άλλος δεν το χρησιμοποιεί. Αναρωτιέμαι πόσο περισσότερο θα πάρει όταν αυτό θα είναι ανοιχτό για χρήση από οποιονδήποτε». Ο Brownlee επισημαίνει επίσης ότι το μοντέλο έχει σημαντική δυσκολία στη σωστή παραγωγή των ποδιών και των κινήσεών τους, με τα μπροστινά και τα πίσω πόδια να αλλάζουν θέσεις με αφύσικο και ακατανόητο τρόπο.

Σε αντίθεση με το Grok 2, το Sora θα περιορίσει το τι μπορούν να δημιουργήσουν οι χρήστες του και απαγορεύει ρητά τη δημιουργία θεμάτων που προστατεύονται από πνευματικά δικαιώματα, ατόμων κάτω των 18 ετών και οτιδήποτε περιέχει βία ή «ακατάλληλα θέματα».

Παρά την ηγετική θέση της OpenAI στον κλάδο της τεχνητής νοημοσύνης, το Sora υπέστη καθυστερήσεις καθ’ όλη τη διάρκεια της ανάπτυξής του, επιτρέποντας σε ανταγωνιστές όπως το Gen-3 alpha της Runway, το Kling της Kuaishou Technology και τα μοντέλα Movie Gen της Meta να το προλάβουν στην αγορά. Το Sora διέρρευσε επίσης πρόσφατα (έστω και για λίγο) δημόσια από μια ομάδα δοκιμαστών beta, οι οποίοι κατηγόρησαν την εταιρεία για «καλλιτεχνική πλύση» των δυνατοτήτων του μοντέλου.

[via]



Πηγή