Ο ανοιχτός κώδικας και η τεχνητή νοημοσύνη έχουν μια περίπλοκη σχέση. Η τεχνητή νοημοσύνη δεν μπορεί να υπάρξει χωρίς ανοιχτό κώδικα, αλλά λίγες εταιρείες θέλουν να χρησιμοποιούν ανοιχτού κώδικα τα προγράμματα τεχνητής νοημοσύνης τους ή τα μεγάλα γλωσσικά μοντέλα (LLM). Εκτός από την IBM, η οποία προηγουμένως προμήθευε ανοιχτού κώδικα τα μοντέλα Granite. Τώρα το Big Blue διπλασιάζει την τεχνητή νοημοσύνη ανοιχτού κώδικα με την κυκλοφορία των τελευταίων μοντέλων Granite AI 3.0 με την άδεια Apache 2.0.
Η IBM το έκανε αυτό χρησιμοποιώντας δεδομένα προεκπαίδευσης από δημόσια σύνολα δεδομένων όπως το GitHub Code Clean, τα δεδομένα Starcoder, τα δημόσια αποθετήρια κώδικα και τα ζητήματα GitHub. Και η IBM έχει καταβάλει κάθε δυνατή προσπάθεια για να αποφύγει πιθανά ζητήματα πνευματικών δικαιωμάτων ή νομικά ζητήματα.
Επίσης: Μπορεί το AI να είναι καν ανοιχτού κώδικα; Είναι περίπλοκο
Γιατί άλλες μεγάλες εταιρείες τεχνητής νοημοσύνης δεν το έχουν κάνει αυτό; Ένας από τους κύριους λόγους είναι ότι τα σύνολα δεδομένων τους είναι γεμάτα με δεδομένα που προστατεύονται από πνευματικά δικαιώματα ή άλλη πνευματική ιδιοκτησία. Εάν αποκαλύψουν τα στοιχεία τους, θα υποστούν και νομικές ενέργειες. Για παράδειγμα, εκδόσεις της News Corp όπως η Wall Street Journal και η New York Post μηνύουν την Perplexity για κλοπή του περιεχομένου τους.
Τα μοντέλα γρανίτη, από την άλλη πλευρά, είναι προγράμματα LLM ειδικά σχεδιασμένα για επαγγελματική χρήση, με έμφαση στον προγραμματισμό και την ανάπτυξη λογισμικού. Η IBM λέει ότι αυτά τα νέα μοντέλα εκπαιδεύτηκαν με τρεις φορές περισσότερα δεδομένα από αυτά που κυκλοφόρησαν νωρίτερα φέτος. Έχουν επίσης μεγαλύτερη ευελιξία μοντελοποίησης και υποστήριξη για εξωτερικές μεταβλητές και κυλιόμενες προβλέψεις.
Συγκεκριμένα, τα νέα μοντέλα γλωσσών Granite 3.0 8B και 2B έχουν σχεδιαστεί ως μοντέλα «λειτουργίας» για εταιρική τεχνητή νοημοσύνη, παρέχοντας ισχυρή απόδοση για εργασίες όπως η επαυξημένη παραγωγή αναζήτησης (RAG), η ταξινόμηση, η σύνοψη, η εξαγωγή οντοτήτων και η επεξεργασία εργαλείων.
Αυτά τα μοντέλα διατίθενται επίσης σε παραλλαγές Instruct και Guardian. Το πρώτο, όπως υποδηλώνει το όνομα, βοηθά τους ανθρώπους να μάθουν μια συγκεκριμένη γλώσσα. Το Guardian έχει σχεδιαστεί για να εντοπίζει κινδύνους στις προτάσεις των χρηστών και στις απαντήσεις AI. Αυτό είναι ζωτικής σημασίας γιατί, όπως σημείωσε ο ειδικός σε θέματα ασφάλειας Bruce Schindler στο συνέδριο Secure Open-Source Software (SOSS) Fusion, «γρήγορη υιοθέτηση [attacks] λειτουργούν επειδή στέλνω δεδομένα στο AI, τα οποία ερμηνεύει ως εντολές», γεγονός που μπορεί να οδηγήσει σε καταστροφικές απαντήσεις.
Επίσης: Η Red Hat αποκαλύπτει σημαντικές βελτιώσεις στο Red Hat Enterprise Linux AI
Τα μοντέλα κωδικών του Granite περιέχουν από 3 έως 34 δισεκατομμύρια παραμέτρους και έχουν εκπαιδευτεί σε 116 γλώσσες προγραμματισμού και 3 έως 4 terabyte tokens, συνδυάζοντας πλούσια δεδομένα κώδικα και σύνολα δεδομένων φυσικών γλωσσών. Αυτά τα μοντέλα είναι διαθέσιμα μέσω πολλών πλατφορμών, συμπεριλαμβανομένων των Hugging Face, GitHub, Watsonx.ai της IBM και Red Hat Enterprise Linux (RHEL) AI. Μια ειδική επιλογή μοντέλων Granite 3.0 είναι επίσης διαθέσιμη στο Ollama και στο Replication.
Επιπλέον, η IBM κυκλοφόρησε μια νέα έκδοση του Watsonx Code Assistant για ανάπτυξη εφαρμογών. Εκεί, το Granite παρέχει βοήθεια κωδικοποίησης μίας στάσης σε γλώσσες όπως C, C++, Go, Java και Python, καθώς και προηγμένες δυνατότητες εκσυγχρονισμού εφαρμογών για εταιρικές εφαρμογές Java. Οι δυνατότητες κώδικα γρανίτη είναι πλέον διαθέσιμες μέσω της επέκτασης κώδικα του Visual Studio, IBM Granite.Code.
Επίσης: Πώς να χρησιμοποιήσετε το ChatGPT για να γράψετε κώδικα: τι κάνει καλά και τι όχι.
Η άδεια Apache 2.0 επιτρέπει τόσο την έρευνα όσο και την εμπορική χρήση, κάτι που αποτελεί σημαντικό πλεονέκτημα έναντι άλλων μεγάλων LLM που μπορεί να ισχυρίζονται ότι είναι ανοιχτού κώδικα, αλλά δεσμεύουν τα LLM τους με εμπορικούς περιορισμούς. Το πιο εντυπωσιακό παράδειγμα αυτού είναι ο Λάμα Μέτα.
Καθιστώντας αυτά τα μοντέλα δωρεάν, η IBM μειώνει τα εμπόδια στην ανάπτυξη και χρήση της τεχνητής νοημοσύνης. Η IBM πιστεύει επίσης σωστά ότι επειδή είναι πραγματικά ανοιχτού κώδικα, οι προγραμματιστές και οι ερευνητές μπορούν γρήγορα να αναπτύξουν και να βελτιώσουν αυτά τα μοντέλα.
Η IBM ισχυρίζεται επίσης ότι αυτά τα μοντέλα μπορούν να παρέχουν επιδόσεις συγκρίσιμες με πολύ μεγαλύτερα και πολύ πιο ακριβά μοντέλα.
Συνδυάστε τα όλα μαζί και είμαι εντυπωσιασμένος. Ναι, το Granite δεν θα βοηθήσει τα παιδιά με την εργασία τους ούτε θα γράψει το σπουδαίο αμερικανικό μυθιστόρημα για την τεχνητή νοημοσύνη, αλλά θα σας βοηθήσει να αναπτύξετε χρήσιμα προγράμματα και εξειδικευμένα συστήματα βασισμένα στην τεχνητή νοημοσύνη.