Οι προσπάθειες της Κίνας να κυριαρχήσει στον κόσμο της τεχνητής νοημοσύνης μπορεί να αποδίδουν καρπούς: Οι γνώστες του κλάδου και οι αναλυτές τεχνολογίας λένε στο CNBC ότι τα κινεζικά μοντέλα τεχνητής νοημοσύνης είναι ήδη εξαιρετικά δημοφιλή και συμβαδίζουν με τα αμερικανικά μοντέλα τεχνητής νοημοσύνης και μάλιστα ξεπερνούν τις επιδόσεις τους.
Η τεχνητή νοημοσύνη έχει γίνει το πιο πρόσφατο πεδίο μάχης μεταξύ των ΗΠΑ και της Κίνας, με τις δύο πλευρές να τη θεωρούν στρατηγική τεχνολογία. Η Ουάσιγκτον συνεχίζει να περιορίζει την πρόσβαση της Κίνας σε προηγμένα τσιπ που έχουν σχεδιαστεί για την υποστήριξη της τεχνητής νοημοσύνης, εν μέσω ανησυχιών ότι η τεχνολογία θα μπορούσε να απειλήσει την εθνική ασφάλεια των ΗΠΑ.
Αυτό ώθησε την Κίνα να υιοθετήσει τη δική της προσέγγιση για τη βελτίωση της ελκυστικότητας και της απόδοσης των μοντέλων τεχνητής νοημοσύνης της, συμπεριλαμβανομένης της χρήσης τεχνολογιών ανοιχτού κώδικα και της ανάπτυξης του δικού της εξαιρετικά γρήγορου λογισμικού και τσιπ.
Η Κίνα δημιουργεί δημοφιλή προγράμματα LLM
Όπως μερικές από τις κορυφαίες εταιρείες των ΗΠΑ στον τομέα, οι κινεζικές εταιρείες τεχνητής νοημοσύνης αναπτύσσουν τα λεγόμενα μεγάλα γλωσσικά μοντέλα ή LLM, τα οποία εκπαιδεύονται σε τεράστιο όγκο δεδομένων και υποστηρίζουν εφαρμογές όπως τα chatbots.
Ωστόσο, σε αντίθεση με τα μοντέλα OpenAI που στηρίζουν το εξαιρετικά δημοφιλές ChatGPT, πολλές από αυτές τις κινεζικές εταιρείες αναπτύσσουν LLMs ανοιχτού κώδικα ή ανοιχτού κώδικα που οι προγραμματιστές μπορούν να κατεβάσουν και να δημιουργήσουν πάνω τους δωρεάν και χωρίς αυστηρές απαιτήσεις αδειοδότησης από τον εφευρέτη.
Τα κινεζικά LLM είναι τα πιο ληφθέντα στο Hugging Face, ένα αποθετήριο LLM, σύμφωνα με τον Tizhen Wang, μηχανικό μηχανικής μάθησης στην εταιρεία. Το Qwen είναι μια οικογένεια μοντέλων τεχνητής νοημοσύνης που δημιουργήθηκε από τον κινεζικό γίγαντα του ηλεκτρονικού εμπορίου. Alibaba“, είναι το πιο δημοφιλές στο Hugging Face”, είπε.
«Η Qwen κερδίζει γρήγορα δημοτικότητα λόγω της εξαιρετικής της απόδοσης σε ανταγωνιστικά σημεία αναφοράς», είπε ο Wang στο CNBC μέσω email.
Πρόσθεσε ότι η Qwen έχει ένα «πολύ ευνοϊκό μοντέλο αδειοδότησης», που σημαίνει ότι οι εταιρείες μπορούν να το χρησιμοποιήσουν χωρίς να χρειάζονται «λεπτομερείς νομικούς ελέγχους».
Το Qwen διατίθεται σε διαφορετικά μεγέθη ή παραμέτρους όπως ονομάζονται στον κόσμο του LLM. Τα μοντέλα με μεγαλύτερες παραμέτρους είναι πιο ισχυρά αλλά απαιτούν υψηλότερο υπολογιστικό κόστος, ενώ τα μοντέλα με μικρότερες παραμέτρους είναι φθηνότερα στη λειτουργία τους.
«Ανεξάρτητα από το μέγεθος που θα επιλέξετε, το Qwen είναι πιθανό να είναι ένα από τα μοντέλα με τις καλύτερες επιδόσεις που είναι διαθέσιμα αυτή τη στιγμή», πρόσθεσε ο Wang.
Η Startup DeepSeek έκανε επίσης πάταγο πρόσφατα με το μοντέλο DeepSeek-R1. Τον περασμένο μήνα, η DeepSeek είπε ότι το μοντέλο R1 της ανταγωνίζεται το μοντέλο o1 του OpenAI, το οποίο έχει σχεδιαστεί για συλλογισμό ή επίλυση πιο περίπλοκων προβλημάτων.
Αυτές οι εταιρείες ισχυρίζονται ότι τα μοντέλα τους μπορούν να ανταγωνιστούν άλλες προσφορές ανοιχτού κώδικα όπως π.χ Μετα‘s Llama, καθώς και ιδιόκτητα LLM όπως το OpenAI για διάφορες λειτουργίες.
«Πέρυσι είδαμε μια αύξηση των κινεζικών συνεισφορών στην τεχνητή νοημοσύνη ανοιχτού κώδικα, η οποία παρουσίαζε πραγματικά υψηλή απόδοση, χαμηλό κόστος συντήρησης και υψηλή απόδοση», δήλωσε στο CNBC η Grace Isford, συνεργάτης της Lux Capital.
Η Κίνα ωθεί τον ανοιχτό κώδικα να γίνει παγκόσμιος
Η τεχνολογία ανοιχτής πηγής εξυπηρετεί διάφορους σκοπούς, συμπεριλαμβανομένης της ώθησης της καινοτομίας καθώς περισσότεροι προγραμματιστές έχουν πρόσβαση σε αυτήν, καθώς και της δημιουργίας μιας κοινότητας γύρω από το προϊόν.
Δεν είναι μόνο οι κινεζικές εταιρείες που έχουν ξεκινήσει προγράμματα LLM ανοιχτού κώδικα. Η μητρική εταιρεία του Facebook Meta, καθώς και η ευρωπαϊκή startup Mistral, διαθέτουν επίσης εκδόσεις ανοιχτού κώδικα μοντέλων τεχνητής νοημοσύνης.
Καθώς όμως η βιομηχανία της τεχνολογίας βρίσκεται στο επίκεντρο μιας γεωπολιτικής μάχης μεταξύ Ουάσιγκτον και Πεκίνου, τα προγράμματα LLM ανοιχτού κώδικα δίνουν στις κινεζικές εταιρείες ένα άλλο πλεονέκτημα: τη δυνατότητα χρήσης των μοντέλων τους σε όλο τον κόσμο.
«Οι κινεζικές εταιρείες θα ήθελαν να δουν τα μοντέλα τους να χρησιμοποιούνται εκτός Κίνας, επομένως αυτός είναι σίγουρα ένας τρόπος για τις εταιρείες να γίνουν παγκόσμιοι παίκτες στην τεχνητή νοημοσύνη», είπε ο Paul Triolo, συνεργάτης στην παγκόσμια εταιρεία συμβούλων DGA Group, στο CNBC μέσω email.
Ενώ η εστίαση αυτή τη στιγμή είναι στα μοντέλα τεχνητής νοημοσύνης, υπάρχει επίσης συζήτηση για το ποιες εφαρμογές θα κατασκευαστούν πάνω από αυτά – και ποιος θα κυριαρχήσει σε αυτό το παγκόσμιο τοπίο του Διαδικτύου στο μέλλον.
«Αν υποθέσουμε ότι αυτά τα προηγμένα βασικά μοντέλα τεχνητής νοημοσύνης είναι τα στοιχήματα, τότε πρόκειται για τι χρησιμοποιούνται αυτά τα μοντέλα, όπως η επιτάχυνση τεχνολογιών αιχμής της επιστήμης και της μηχανικής», δήλωσε ο Isford της Lux Capital.
Τα σημερινά μοντέλα τεχνητής νοημοσύνης έχουν συγκριθεί με λειτουργικά συστήματα όπως π.χ Microsoft Windows, GoogleAndroid και ΜήλοΤο iOS με τη δυνατότητα να κυριαρχήσει στην αγορά όπως κάνουν αυτές οι εταιρείες σε κινητά και υπολογιστές.
Εάν αυτό ισχύει, τότε τα διακυβεύματα για τη δημιουργία ενός κυρίαρχου LLM είναι υψηλότερα.
Η Κίνα εστιάζει σε μεγάλα γλωσσικά μοντέλα (LLM) στον τομέα της τεχνητής νοημοσύνης.
Blackdowfx | Πηγή | Getty Images
“Αυτοί [Chinese companies] αντιλαμβάνονται τα LLM ως το κέντρο των μελλοντικών τεχνολογικών οικοσυστημάτων», είπε στο CNBC μέσω email ο Xin Song, ανώτερος λέκτορας στις κινεζικές και ανατολικοασιατικές επιχειρήσεις στο King’s College του Λονδίνου.
«Τα μελλοντικά επιχειρηματικά τους μοντέλα θα βασίζονται στο ότι οι προγραμματιστές θα ενταχθούν στα οικοσυστήματα τους, θα αναπτύσσουν νέες εφαρμογές βασισμένες στο LLM και θα προσελκύουν χρήστες και δεδομένα από τα οποία μπορούν στη συνέχεια να επωφεληθούν με διάφορα μέσα, συμπεριλαμβανομένων, ενδεικτικά, παραπομπών χρηστών για χρήση των υπηρεσιών cloud τους». Ο Sun πρόσθεσε.
Οι περιορισμοί τσιπ θέτουν υπό αμφισβήτηση το μέλλον της τεχνητής νοημοσύνης στην Κίνα
Τα μοντέλα AI εκπαιδεύονται σε τεράστιες ποσότητες δεδομένων, κάτι που απαιτεί τεράστια υπολογιστική ισχύ. Τη στιγμή, Nvidia είναι ο κορυφαίος προγραμματιστής των τσιπ που απαιτούνται για να γίνει αυτό, γνωστές ως μονάδες επεξεργασίας γραφικών (GPUs).
Οι περισσότερες κορυφαίες εταιρείες τεχνητής νοημοσύνης εκπαιδεύουν τα συστήματά τους στα κορυφαία τσιπ της Nvidia, αλλά όχι στην Κίνα.
Τον τελευταίο χρόνο περίπου, οι ΗΠΑ έχουν αυστηροποιήσει τους περιορισμούς στις εξαγωγές προηγμένου εξοπλισμού κατασκευής ημιαγωγών και τσιπ στην Κίνα. Σημαίνει NvidiaΤα προηγμένα τσιπ δεν μπορούν να εξαχθούν στη χώρα και η εταιρεία έπρεπε να δημιουργήσει ημιαγωγούς συμβατούς με τις κυρώσεις για εξαγωγή.
Ωστόσο, παρά αυτούς τους περιορισμούς, οι κινεζικές εταιρείες εξακολουθούν να έχουν καταφέρει να λανσάρουν προηγμένα μοντέλα τεχνητής νοημοσύνης.
«Οι μεγάλες κινεζικές τεχνολογικές πλατφόρμες έχουν πλέον επαρκή πρόσβαση στην υπολογιστική ισχύ για να συνεχίσουν να βελτιώνουν τα μοντέλα. Αυτό συμβαίνει επειδή έχουν αποθηκεύσει μεγάλο αριθμό GPU της Nvidia και χρησιμοποιούν επίσης εγχώριες GPU από τη Huawei και άλλες εταιρείες», δήλωσε ο Triolo του DGA Group.
Πράγματι, οι κινεζικές εταιρείες εντείνουν τις προσπάθειες για τη δημιουργία βιώσιμων εναλλακτικών λύσεων έναντι της Nvidia. Η Huawei υπήρξε ένας από τους κορυφαίους παίκτες στην επίτευξη αυτού του στόχου στην Κίνα, ενώ εταιρείες όπως π.χ Baidu και η Alibaba επενδύουν επίσης στην ανάπτυξη ημιαγωγών.
«Ωστόσο, το χάσμα στον προηγμένο υπολογισμό υλικού θα γίνει μεγαλύτερο με την πάροδο του χρόνου, ειδικά τον επόμενο χρόνο όταν η Nvidia θα κυκλοφορήσει τα συστήματα που βασίζονται στο Blackwell, τα οποία έχουν περιορισμένες εξαγωγές στην Κίνα», δήλωσε ο Triolo.
Ο Isford της Lux Capital σημείωσε ότι η Κίνα «επενδύει συστηματικά και επεκτείνει ολόκληρη την εγχώρια υποδομή τεχνητής νοημοσύνης πέρα από τη Nvidia με τσιπ τεχνητής νοημοσύνης υψηλής απόδοσης από εταιρείες όπως η Baidu».
«Είτε τα τσιπ Nvidia είναι απαγορευμένα είτε όχι στην Κίνα, δεν θα εμποδίσει την Κίνα να επενδύσει και να δημιουργήσει τη δική της υποδομή για τη δημιουργία και την εκπαίδευση μοντέλων τεχνητής νοημοσύνης», πρόσθεσε.