Categories: Facebook

Το AI μοντέλο που εντοπίζει τα λάθη στις απαντήσεις του…ChatGPT!

Το ChatGPT κατέκτησε τον κόσμο της τεχνολογίας όταν εμφανίστηκε κατά τους τελευταίους μήνες του 2022. Το λανσάρισμα ήταν αρκετά σημαντικό ώστε να ταρακουνήσει τα πράγματα στη Google, με αποτέλεσμα η εταιρεία να τρέξει για να προλάβει τις εξελίξεις προκειμένου να ενσωματώσει την δική της παραγωγική AI στη μηχανή αναζήτησης, με ορισμένα τραγελαφικά να συμβαίνουν στην πορεία. Αν και το ChatGPT δεν προτείνει να βάλετε κόλλα στην πίτσα σας, το chatbot που κάνει τα πάντα δεν είναι τέλειο και κατά περίπτωση μπορεί να κάνει λάθη.

Μία από τις εργασίες που μπορεί να αναλάβει το ChatGPT είναι να γράφει αποσπάσματα κώδικα αφού λάβει προτροπές από τον χρήστη. Ο OpenAI έχει εκπαιδεύσει ένα μοντέλο Τεχνητής Νοημοσύνης με βάση το GPT-4 που ονομάζεται CriticGPT για να βρίσκει λάθη στην έξοδο κώδικα που παρέχει το chatbot. Μπορεί να γράψει κριτικές που επισημαίνουν τις ανακρίβειες στις απαντήσεις του ChatGPT. Το μοντέλο χρησιμοποιείται εσωτερικά και ο OpenAI έχει δημοσιεύσει μια ερευνητική εργασία για να το περιγράψει λεπτομερώς.

Το CriticGPT προορίζεται να βοηθήσει τους ανθρώπους-εκπαιδευτές Τεχνητής Νοημοσύνης, των οποίων η δουλειά είναι να εκπαιδεύουν και να βελτιώνουν τις απαντήσεις του GPT-4 χρησιμοποιώντας μια τεχνική που ονομάζεται Ενισχυτική Μάθηση από Ανθρώπινη Ανατροφοδότηση (Reinforcement Learning from Human Feedback – RLHF). Περιλαμβάνει εκπαιδευτές AI που βαθμολογούν διαφορετικές απαντήσεις του ChatGPT μεταξύ τους.

Ωστόσο, τα πράγματα γίνονται όλο και πιο δύσκολα για τους εκπαιδευτές Τεχνητής Νοημοσύνης, καθώς το ChatGPT γίνεται όλο και πιο ακριβές και τα λάθη του όλο και πιο διακριτικά. “Αυτός είναι ένας θεμελιώδης περιορισμός του RLHF και μπορεί να καταστήσει ολοένα και πιο δύσκολη την ευθυγράμμιση των μοντέλων, καθώς αυτά γίνονται σταδιακά πιο ενημερωμένα από οποιοδήποτε άτομο που θα μπορούσε να παρέχει ανατροφοδότηση“, δήλωσε ο OpenAI.

Το CriticGPT μπαίνει στο παιχνίδι για να σώσει την κατάσταση, αλλά εξακολουθεί να είναι ένα μοντέλο τεχνητής νοημοσύνης και οι απαντήσεις του μπορεί να μην είναι πάντα σωστές. Είναι επίσης επιρρεπές σε προβλήματα της AI, ωστόσο, το μοντέλο μπορεί να βοηθήσει τους ανθρώπους να γίνουν καλύτεροι στην επισήμανση των λαθών από ό,τι όταν κάνουν τη δουλειά μόνοι τους.

Ο OpenAI δήλωσε ότι “ένας δεύτερος τυχαίος εκπαιδευτής προτίμησε τις κριτικές από την ομάδα Human+CriticGPT σε σχέση με εκείνες από ένα άτομο χωρίς βοήθεια σε ποσοστό άνω του 60% των περιπτώσεων“. Το CriticGPT εκπαιδεύτηκε επίσης χρησιμοποιώντας το RLHF και του ανατέθηκε να αναλύσει και να σχολιάσει έναν μεγάλο αριθμό εισροών που περιείχαν λάθη. Το μοντέλο έπρεπε να βρει λάθη που είχαν εισαχθεί σκόπιμα από ανθρώπους και “φυσικά” σφάλματα του ChatGPT που είχαν προηγουμένως εντοπιστεί από έναν εκπαιδευτή. Υπάρχουν μερικοί περιορισμοί που προσπαθεί προς το παρόν να εξαλείψει ο OpenAI.

Το CriticGPT εκπαιδεύτηκε χρησιμοποιώντας σύντομες απαντήσεις του ChatGPT και πρέπει να αναπτυχθούν νέες μέθοδοι που θα μπορούν να βοηθήσουν τους εκπαιδευτές να κατανοήσουν τις μεγάλες και πολύπλοκες εργασίες.

[via]

Πηγή

Download QR Print QR

iTech News

Next Σαν σήμερα 1 Ιουλίου: Η επανάσταση του Walkman – Όταν η μουσική έγινε… προσωπική υπόθεση »

Previous « Παραδοχή της Microsoft: Τα πάντα στο Διαδίκτυο χρησιμοποιούνται για την εκπαίδευση της AI

Published by

iTech News

6 μήνες ago

Αυτές είναι οι νέες κάρτες γραφικών RTX 50 Series της MSI [CES 2025]

Η MSI παρουσίασε στο CES 2025 τις καινοτόμες κάρτες γραφικών NVIDIA GeForce RTX 50 Series,…

32 λεπτά ago

Mobile

Οι έξι τάσεις που διαμορφώνουν τις πληρωμές το 2025

Οι ψηφιακές πληρωμές αυξάνονται παγκοσμίως καθώς οι αγορές μέσα από ιστοτόπους, εφαρμογές ή πλατφόρμες καταστημάτων…

41 λεπτά ago

Apple

Η Apple αρνείται κατηγορηματικά ότι χρησιμοποιεί δεδομένα της Siri για μάρκετινγκ

Η Apple ισχυρίζεται ότι δεν έχει χρησιμοποιήσει ποτέ τα δεδομένα της Siri για τη δημιουργία…

5 ώρες ago

Internet

Το πρώτο laptop με κυλιόμενη οθόνη της Samsung [CES 2025]

Στο φετινό CES 2025, η Samsung Display παρουσίασε διάφορα πρωτότυπα οθονών OLED σε διάφορους παράγοντες…

6 ώρες ago

Microsoft

iPhone SE και νέα iPad έρχονται τον Απρίλιο

Σύμφωνα με πληροφορίες, η Apple θα κυκλοφορήσει ένα νέο iPhone SE και νέα iPad μέσα…

6 ώρες ago

Facebook

Το κλειδί για τα ταξίδια στο Βαθύ Διάστημα

Η φιλοδοξία της Ανθρωπότητας να εξερευνήσει τα αστέρια αντιμετωπίζει ένα θεμελιώδες εμπόδιο: την τεράστια έκταση…

6 ώρες ago

Αυτό το site χρησιμοποιεί cookies, για την παροχή των υπηρεσιών της, να προσαρμόσετε τις διαφημίσεις και να αναλύσει την επισκεψιμότητα. Με τη χρήση αυτής της ιστοσελίδας, συμφωνείτε με τη πολιτική χρήση των cookies.

Το AI μοντέλο που εντοπίζει τα λάθη στις απαντήσεις του…ChatGPT!

Leave a Comment

Recent Posts

Αυτές είναι οι νέες κάρτες γραφικών RTX 50 Series της MSI [CES 2025]

Οι έξι τάσεις που διαμορφώνουν τις πληρωμές το 2025

Η Apple αρνείται κατηγορηματικά ότι χρησιμοποιεί δεδομένα της Siri για μάρκετινγκ

Το πρώτο laptop με κυλιόμενη οθόνη της Samsung [CES 2025]

iPhone SE και νέα iPad έρχονται τον Απρίλιο

Το κλειδί για τα ταξίδια στο Βαθύ Διάστημα