Η Anthropic κυκλοφόρησε Claude 3.5 Sonnet, το νέο μοντέλο τεχνητής νοημοσύνης που βελτιώνει τον προκάτοχό του με ταχύτερες επιδόσεις και καλύτερες δεξιότητες στην κωδικοποίηση, την όραση και την κατανόηση της φυσικής γλώσσας. Παρά το γεγονός ότι το Sonnet θα είναι τελικά το μεσαίο μοντέλο της Claude που τοποθετείται μεταξύ του μικρότερου Haiku και του high-end Opus, η Anthropic ισχυρίζεται ότι ξεπερνά ακόμα και το κορυφαίο Opus με βάση εσωτερικές συγκριτικές δοκιμές.
Σύμφωνα με την Anthropic, το Claude 3.5 Sonnet επεξεργάζεται τα δεδομένα εισόδου δύο φορές πιο γρήγορα από το Opus. Υποστηρίζει ότι το Sonnet ξεπέρασε το προηγούμενο μοντέλο Opus στις δοκιμασίες κωδικοποίησης, διορθώνοντας το 64% των σφαλμάτων του κώδικα σε σύγκριση με το 38% του Opus.
Τα αποτελέσματα της συγκριτικής αξιολόγησης έδειξαν επίσης ότι το Sonnet νίκησε τους ανταγωνιστές σε επτά από τις εννέα γενικές κατηγορίες και σε τέσσερις από τις πέντε εργασίες όρασης. Αν και οι αριθμοί πρέπει να λαμβάνονται με προσοχή, οι βαθμολογίες υποδηλώνουν σημαντική πρόοδο.
Το Claude 3.5 Sonnet είναι το ισχυρότερο μοντέλο όρασης που έχουμε παρουσιάσει μέχρι σήμερα, ξεπερνώντας το Claude 3 Opus στα τυπικά κριτήρια αναφοράς όρασης. Αυτές οι βελτιώσεις σε σχέση με το προηγούμενο μοντέλο είναι πιο αξιοσημείωτες για εργασίες που απαιτούν οπτική σκέψη, όπως η ερμηνεία διαγραμμάτων και γραφικών παραστάσεων. Το Claude 3.5 Sonnet μπορεί επίσης να μεταγράψει με ακρίβεια κείμενο από ατελείς εικόνες, μια βασική ικανότητα για το λιανικό εμπόριο, τα logistics και τις χρηματοπιστωτικές υπηρεσίες, όπου η τεχνητή νοημοσύνη μπορεί να αντλήσει περισσότερες πληροφορίες από μια εικόνα, ένα γραφικό ή μια απεικόνιση παρά μόνο από το κείμενο.
Για να διασφαλίσει την ασφάλεια, η Anthropic υπέβαλε το Sonnet σε εξωτερικές αξιολογήσεις από τα Ινστιτούτα Ασφάλειας Τεχνητής Νοημοσύνης του Ηνωμένου Βασιλείου και των ΗΠΑ. Διαπίστωσαν ότι το μοντέλο παρέμεινε στο επίπεδο ASL 2 μετά τις βελτιώσεις. Η Anthropic ενημέρωσε επίσης τον βοηθό χρησιμοποιώντας την τεχνογνωσία για την ασφάλεια των παιδιών, ώστε να προλαμβάνει καλύτερα τις πιθανές κακοτοπιές.
Εκτός από το Claude 3.5 Sonnet, η εταιρεία εισήγαγε επίσης ένα νέο χαρακτηριστικό που ονομάζεται Artifacts. Με τα Artifacts, οι χρήστες μπορούν πλέον να βλέπουν και να αλληλεπιδρούν με τα αποτελέσματα των συνομιλιών τους με το Claude απευθείας μέσα στην εφαρμογή. Για παράδειγμα, αν ένας χρήστης ζητήσει από την Claude να σχεδιάσει ένα φυλλάδιο για μια επερχόμενη εκδήλωση, μπορεί να παρέχει μια προεπισκόπηση του σχεδίου του φυλλαδίου για να το εξετάσει και να το επεξεργαστεί ο χρήστης.
Αυτή η λειτουργία προεπισκόπησης σηματοδοτεί την εξέλιξη του Claude από μια τεχνητή νοημοσύνη συνομιλίας σε ένα συνεργατικό περιβάλλον εργασίας. Είναι μόνο η αρχή ενός ευρύτερου οράματος για το Claude.ai, το οποίο σύντομα θα επεκταθεί για να υποστηρίξει τη συνεργασία ομάδων. Στο εγγύς μέλλον, οι ομάδες -και τελικά ολόκληροι οργανισμοί- θα μπορούν να συγκεντρώνουν με ασφάλεια τις γνώσεις, τα έγγραφα και τις τρέχουσες εργασίες τους σε έναν κοινόχρηστο χώρο, με την Claude να λειτουργεί ως ένας κατά παραγγελία συνεργάτης.
Όπως και το GPT-4o, το Claude 3.5 Sonnet είναι ελεύθερο να χρησιμοποιηθεί χωρίς περιορισμούς για περιστασιακούς, μη εμπορικούς σκοπούς. Ωστόσο, για συνεχή απεριόριστη πρόσβαση, τα συνδρομητικά πακέτα ξεκινούν από 20 δολάρια/μήνα για ιδιώτες και κλιμακώνονται για επιχειρήσεις.
[via]