Τον περασμένο Μάιο, κατά τη διάρκεια της παρουσίασης του GPT-4o, ο OpenAI ανακοίνωσε τη νέα λειτουργία Advanced Voice που μπορεί να ανταποκριθεί σε εισόδους ήχου σε μόλις 232 χιλιοστά του δευτερολέπτου, με μέσο όρο 320 χιλιοστά του δευτερολέπτου, παρόμοιο με τον ανθρώπινο χρόνο απόκρισης σε μια τυπική συνομιλία. Μετά από μήνες καθυστέρησης, ο OpenAI ξεκίνησε την ανάπτυξη της λειτουργίας Advanced Voice τον Σεπτέμβριο για τους συνδρομητές των ChatGPT Plus και ChatGPT Team στις ΗΠΑ.
Πρόσφατα, ο OpenAI επέκτεινε την εξάπλωση της λειτουργίας Advanced Voice του ChatGPT στους χρήστες στην ΕΕ. Η λειτουργία ChatGPT Advanced Voice είναι τώρα διαθέσιμη για όλους τους χρήστες ChatGPT Plus και Team στην ΕΕ, την Ελβετία, την Ισλανδία, τη Νορβηγία και το Λιχτενστάιν. Για να χρησιμοποιήσουν αυτή τη λειτουργία Advanced Voice mode, οι χρήστες πρέπει να κατεβάσουν την τελευταία έκδοση της εφαρμογής ChatGPT από το Google Play Store και το Apple App Store στις υποστηριζόμενες περιοχές.
Επίσης, ο OpenAI ανακοίνωσε πρόσφατα τη διαθεσιμότητα του Advanced Voice mode για τις desktop εφαρμογές ChatGPT σε macOS και Windows. Είναι σημαντικό να σημειωθεί ότι ο OpenAI έχει ένα ημερήσιο όριο για τη χρήση της λειτουργίας Advanced Voice, ακόμη και σε desktop. Η εφαρμογή ChatGPT θα σας ειδοποιήσει όταν σας απομένουν 15 λεπτά χρήσης της λειτουργίας Advanced Voice για την ημέρα.
Τις τελευταίες εβδομάδες, ο OpenAI έχει κάνει αρκετές βελτιώσεις στη λειτουργία Advanced Voice, συμπεριλαμβανομένης της υποστήριξης πέντε νέων φωνών (Arbor, Maple, Sol, Spruce και Vale), της δυνατότητας των χρηστών να ορίζουν προσαρμοσμένες οδηγίες και να ζητούν από το OpenAI να θυμάται τις συνομιλίες για μελλοντική αναφορά, καθώς και της βελτίωσης της συνολικής ταχύτητας συνομιλίας, της ομαλότητας και των προφορών στις υποστηριζόμενες ξένες γλώσσες.
Στην DevDay 2024, ο OpenAI ανακοίνωσε το Realtime API, το οποίο θα επιτρέπει στους προγραμματιστές να δημιουργούν τις δικές τους φωνητικές εμπειρίες παρόμοιες με τη λειτουργία Advanced Voice του ChatGPT. Οι μάρκες εισόδου κειμένου Realtime API θα κοστίζουν 5 δολάρια ανά 1 εκατομμύριο και 20 δολάρια ανά 1 εκατομμύριο μάρκες εξόδου. Η είσοδος ήχου θα κοστίζει 100 δολάρια ανά 1 εκατομμύριο tokens και η έξοδος 200 δολάρια ανά 1 εκατομμύριο tokens.
Με την επέκταση του Advanced Voice και την εισαγωγή του Realtime API, ο OpenAI κάνει σημαντικά βήματα στη συνομιλιακή Τεχνητή Νοημοσύνη, ανοίγοντας το δρόμο για πιο διαδραστικές και προσβάσιμες εμπειρίες AI.