Categories: Gaming

Ο OpenAI εκπαίδευσε το GPT-4 με εκατομμύρια ώρες video από το YouTube


Σύμφωνα με μια νέα αναφορά, σε μια προσπάθεια να εξασφαλίσουν υψηλής ποιότητας δεδομένα για την εκπαίδευση των AI μοντέλων τους, εταιρείες τεχνολογίας τεχνητής νοημοσύνης όπως ο OpenAI, η Google και η Meta έχουν καταφύγει σε ύποπτες τακτικές. Σε δημοσίευμα των New York Times αναφέρεται ότι ο οργανισμός OpenAI φέρεται να έχει μεταγράψει πάνω από ένα εκατομμύριο ώρες video από το YouTube για να δώσει δεδομένα για να εκπαιδεύσει το πιο προηγμένο μεγάλο γλωσσικό μοντέλο (LLM), το GPT-4.

Σύμφωνα με πληροφορίες, ο OpenAI ανέπτυξε το μοντέλο μεταγραφής ήχου Whisper, το οποίο βοήθησε την εταιρεία στην απόξεση δεδομένων από videos του YouTube. Οι NY Times αναφέρουν ότι ο OpenAI γνώριζε ότι η μέθοδος αυτή θα μπορούσε να τεθεί υπό έλεγχο, αλλά προχώρησε σε αυτήν, επειδή πίστευε ότι επρόκειτο για θεμιτή χρήση. Είναι ενδιαφέρον ότι η Google, στην οποία ανήκει το YouTube, φέρεται επίσης να έχει εμπλακεί στην ίδια πρακτική για τα μοντέλα τεχνητής νοημοσύνης της, παραβιάζοντας έτσι τα πνευματικά δικαιώματα των δημιουργών.

Το δημοσίευμα των NY Times συνάδει με το δημοσίευμα του The Information, όπου τονίστηκε πως ο οργανισμός OpenAI φέρεται να απέσπασε δεδομένα από video και podcasts του YouTube για να εκπαιδεύσει δύο από τα συστήματα Τεχνητής Νοημοσύνης του. Η αναφορά υποδηλώνει επίσης ότι ο πρόεδρος του OpenAI, Greg Brockman, ήταν επίσης στην ομάδα.

Όταν ο Neil Mohan, CEO του YouTube, παραχώρησε συνέντευξη στο Bloomberg, δήλωσε ότι οι πολιτικές της εταιρείας “δεν επιτρέπουν τη λήψη πραγμάτων όπως αντίγραφα ή αποσπάσματα από video, και αυτό αποτελεί σαφή παραβίαση των όρων χρήσης της υπηρεσίας μας“. Ωστόσο, όταν ρωτήθηκε αν τα δεδομένα του YouTube χρησιμοποιήθηκαν από τον OpenAI ή όχι, ο Mohan έδωσε μια διφορούμενη απάντηση, λέγοντας: “Έχω δει αναφορές ότι μπορεί να έχουν χρησιμοποιηθεί ή να μην έχουν χρησιμοποιηθεί. Ο ίδιος δεν έχω καμία πληροφορία“.

Το δημοσίευμα των NY Times υποστηρίζει επίσης ότι κάποιοι άνθρωποι στη Google γνώριζαν για την πρακτική του OpenAI να μεταγράφει δεδομένα του YouTube, αλλά δεν μπορούσαν να κάνουν τίποτα, αφού και η Google κατέφυγε στην ίδια πρακτική για να εκπαιδεύσει το δικό της μοντέλο AI. Η Google, ωστόσο, δήλωσε στους NY Times ότι κάνει απόσπαση δεδομένων από video μόνο αφού ο δημιουργός του video έχει δώσει τη συγκατάθεση του.

Σύμφωνα με το δημοσίευμα, υποστηρίζεται ότι η Google ζήτησε από μια ομάδα να “τροποποιήσει την πολιτική απορρήτου της” τον Ιούνιο του 2023, “για να επιτρέψει στη Google να μπορεί να αξιοποιεί τα δημόσια διαθέσιμα έγγραφα από την υπηρεσία Google Docs, τις κριτικές εστιατορίων στο Google Maps και άλλο διαδικτυακό υλικό για περισσότερα από τα AI προϊόντα της“.

[via]



Πηγή

iTech News

Leave a Comment
Share
Published by
iTech News

Recent Posts

Ανακαλύψτε τις προτάσεις οθονών σε εξαιρετικές τιμές για αυτά τα Χριστούγεννα

Αυτή τη γιορτινή περίοδο, η Philips Monitors δημιουργεί μια σειρά προτάσεων από ευέλικτες και καινοτόμες…

6 ώρες ago

Το open-source AI μοντέλο παραγωγής video της Tencent εντυπωσιάζει!

Στις αρχές της χρονιάς, η OpenAI παρουσίασε το Sora, ένα νέο AI μοντέλο παραγωγής βίντεο…

6 ώρες ago

Η Κίνα ετοιμάζει τραίνα maglev ταχύτητας 1000 km/h με σταθερή σύνδεση 5G!

Η Κίνα πρωταγωνιστεί ολοένα και περισσότερο στην τεχνολογική πρόοδο, όχι μόνο στον τομέα της αεροδιαστημικής,…

7 ώρες ago

Δείτε το launch trailer του πολυαναμενόμενου παιχνιδιού

Στις τρεις πρώτες ταινίες του Indiana Jones, ο Dr. Henry Jones Jr. δεν συνάντησε ποτέ…

7 ώρες ago

Ξεκίνησαν τα γυρίσματα της 2ης σεζόν

Ο Walton Goggins του Fallout λέει ότι είναι «ωραίο συναίσθημα» να επιστρέφει στο ρόλο του…

7 ώρες ago

Πρωτοποριακή τεχνολογία ίσως δώσει λύσει στο πρόβλημα των ναρκοπέδιων και όχι μόνο

Ερευνητές στις ΗΠΑ ανέπτυξαν μια τεχνολογία που μπορεί να ανιχνεύει νάρκες από μακριά και με…

8 ώρες ago

Αυτό το site χρησιμοποιεί cookies, για την παροχή των υπηρεσιών της, να προσαρμόσετε τις διαφημίσεις και να αναλύσει την επισκεψιμότητα. Με τη χρήση αυτής της ιστοσελίδας, συμφωνείτε με τη πολιτική χρήση των cookies.