Φανταστείτε ένα μοντέλο τεχνητής νοημοσύνης που μπορεί να χειριστεί έναν υπολογιστή μόνος του. Λοιπόν, φανταστείτε, όχι πια, επειδή έχει εμφανιστεί μια τέτοια τεχνητή νοημοσύνη. Την Τρίτη, η Anthropic ανακοίνωσε ότι η τελευταία γενιά του μοντέλου Claude AI μπορεί να χρησιμοποιεί υπολογιστή – όπως εσείς και εγώ. Η τεχνητή νοημοσύνη, που ονομάζεται Claude 3.5 Sonnet, έφτασε σε λειτουργία beta, ώστε οι προγραμματιστές να μπορούν να τη χρησιμοποιούν μέσω ενός API.
Το Claude 3.5 Sonnet, που διαφημίζεται από την Anthropic ως “το πρώτο προηγμένο μοντέλο τεχνητής νοημοσύνης που προσφέρει χρήση υπολογιστή σε δημόσια έκδοση beta”, μπορεί να κωδικοποιηθεί από τους προγραμματιστές για να συνεργαστεί με τον υπολογιστή με διάφορους τρόπους. Χρησιμοποιώντας ένα προϊόν ή μια υπηρεσία που έχει προγραμματιστεί μέσω ενός API, μπορείτε να ζητήσετε από το AI να «κοιτάξει» την οθόνη του υπολογιστή σας, να μετακινήσει τον κέρσορα γύρω από την οθόνη, να πατήσει κουμπιά και να εισαγάγει κείμενο χρησιμοποιώντας το εικονικό πληκτρολόγιο. Η ιδέα είναι να προσομοιώσετε πώς αλληλεπιδράτε με τον υπολογιστή σας.
Επίσης: Το Generative AI δεν χρειάζεται να είναι τελικά ένα “power pig”.
Αυτή τη στιγμή, η νέα τεχνητή νοημοσύνη βρίσκεται σαφώς σε πειραματικό στάδιο, μερικές φορές δυσκίνητη και επιρρεπής σε λάθη. Ωστόσο, η Anthropic κυκλοφόρησε μια νέα έκδοση beta ειδικά για να λάβει σχόλια από τους προγραμματιστές και να βελτιώσει το μοντέλο με την πάροδο του χρόνου.
Γιατί είναι ωφέλιμη η χρήση τεχνητής νοημοσύνης στον υπολογιστή; Η Anthropic προέβλεψε και αντιμετώπισε αυτό το ζήτημα.
«Ένας τεράστιος όγκος σύγχρονης εργασίας γίνεται με χρήση υπολογιστών», είπε ο Anthropic. «Επιτρέποντας στην τεχνητή νοημοσύνη να αλληλεπιδρά απευθείας με το λογισμικό υπολογιστών με τον ίδιο τρόπο που κάνουν οι άνθρωποι, θα ανοίξουμε μια τεράστια γκάμα εφαρμογών που απλά δεν είναι δυνατές με την τρέχουσα γενιά βοηθών AI».
Και πώς μπορούν οι προγραμματιστές και οι χρήστες να επωφεληθούν από την τεχνητή νοημοσύνη που λειτουργεί με υπολογιστή;
«Αντί να δημιουργούμε συγκεκριμένα εργαλεία για να βοηθήσουμε τον Claude να εκτελέσει συγκεκριμένες εργασίες, του διδάσκουμε γενικές δεξιότητες υπολογιστή που του επιτρέπουν να χρησιμοποιεί ένα ευρύ φάσμα τυπικών εργαλείων και προγραμμάτων σχεδιασμένων για ανθρώπους», εξήγησε ο Anthropic. “Οι προγραμματιστές μπορούν να χρησιμοποιήσουν αυτήν την αναδυόμενη ικανότητα για να αυτοματοποιήσουν επαναλαμβανόμενες διαδικασίες, να δημιουργήσουν και να δοκιμάσουν λογισμικό και να εκτελέσουν εργασίες ανοιχτού τύπου, όπως η έρευνα.”
Σύμφωνα με το Anthropic, αρκετές εταιρείες χρησιμοποιούν ήδη την εμπειρία του Claude 3.5 Sonnet, όπως οι Asana, Canva, Cognition, DoorDash, Replit και The Browser Company. Για παράδειγμα, η πλατφόρμα ανάπτυξης και ανάπτυξης λογισμικού Replit χρησιμοποιεί αυτές τις δυνατότητες για την αξιολόγηση εφαρμογών για το προϊόν Replit Agent.
Επίσης: Πώς λειτουργεί ο Claude; Το Anthropic αποκαλύπτει τα μυστικά του
Ο προγραμματισμός του Claude για να μάθει πώς να χρησιμοποιεί υπολογιστές, συγκεκριμένα πώς να βλέπει μια οθόνη και να απαντά με συγκεκριμένες ενέργειες, χρειάστηκε πολλές δοκιμές και λάθη, είπε ο Anthropic.
Η χρήση υπολογιστή απαιτεί τη δυνατότητα προβολής και ερμηνείας εικόνων, όπως αυτές στην οθόνη ενός υπολογιστή. Περιλαμβάνει επίσης τη δυνατότητα προσδιορισμού του πώς και πότε να εκτελούνται ορισμένες λειτουργίες με βάση αυτό που εμφανίζεται στην οθόνη. Για να ικανοποιήσει αυτές τις απαιτήσεις, το Claude 3.5 Sonnet προβάλλει στιγμιότυπα οθόνης αυτού που βλέπετε. Στη συνέχεια, το AI μετράει τον αριθμό των κάθετων και οριζόντιων εικονοστοιχείων για να καθορίσει πού θα μετακινήσετε τον κέρσορα. Αυτή η ικανότητα απαιτείται για την ικανότητα του AI να εκδίδει εντολές ποντικιού.
Πώς είναι ο Claude;
Σε δοκιμές OSWorld που αξιολογούν τις προσπάθειες μοντέλων τεχνητής νοημοσύνης να χρησιμοποιούν υπολογιστές, το Claude 3.5 Sonnet έλαβε βαθμολογία 14,9%. Αν και αυτό είναι πολύ χαμηλότερο από το 70-75% των δεξιοτήτων σε ανθρώπινο επίπεδο, είναι σχεδόν διπλάσιο από το 7,7% που επιτυγχάνεται από το επόμενο καλύτερο μοντέλο τεχνητής νοημοσύνης στην ίδια κατηγορία, λέει ο Anthropic.
Αυτή η προσπάθεια χρήσης της τεχνητής νοημοσύνης του υπολογιστή βρίσκεται ακόμα στα αρχικά της στάδια. Έτσι, ο Claude δεν μπορεί να εκτελέσει πιο «σύνθετες» εργασίες υπολογιστή, όπως το σύρσιμο ενός παραθύρου ή το ζουμ της οθόνης. Επιπλέον, ο τρόπος που ο Claude αλληλεπιδρά με τον υπολογιστή του, προβάλλοντας και συλλέγοντας στιγμιότυπα οθόνης, σημαίνει ότι μπορεί να χάσει ορισμένες ενέργειες και ειδοποιήσεις.
Επίσης: Καλύτερο AI για κωδικοποίηση (και τι δεν πρέπει να χρησιμοποιείτε)
«Αναμένουμε ότι η χρήση των υπολογιστών θα βελτιωθεί γρήγορα και θα γίνει πιο γρήγορη, πιο αξιόπιστη και πιο χρήσιμη για τις εργασίες που θέλουν να ολοκληρώσουν οι χρήστες μας», δήλωσε ο Anthropic. «Θα είναι επίσης πολύ πιο εύκολο να εφαρμοστεί για όσους έχουν λιγότερη εμπειρία ανάπτυξης λογισμικού. Σε κάθε στάδιο, οι ερευνητές μας θα συνεργαστούν στενά με τις ομάδες ασφαλείας μας για να διασφαλίσουν ότι οι νέες δυνατότητες του Claude συνοδεύονται από κατάλληλα μέτρα ασφαλείας».
Το Σονέτο του Claude 3.5 είναι πλέον διαθέσιμο σε όλους. Οι προγραμματιστές μπορούν να δημιουργήσουν εφαρμογές χρησιμοποιώντας την έκδοση beta για υπολογιστές που υποστηρίζεται από το Anthropic API, το Amazon Bedrock και το Vertex AI του Google Cloud.