Οι λύσεις τεχνητής νοημοσύνης και τα σχετικά chatbot που έρχονται στο προσκήνιο ενδέχεται να μην έχουν την παγκόσμια ποικιλομορφία που απαιτείται για την εξυπηρέτηση των διεθνών βάσεων χρηστών. Πολλά από τα σημερινά βασικά γλωσσικά μοτίβα τείνουν να ευνοούν «δυτικούς προσανατολισμούς γεύσεις και αξίες», σύμφωνα με πρόσφατη μελέτη ερευνητών στο Πανεπιστήμιο του Στάνφορντ. Οι προσπάθειες να επιτευχθεί αυτό που ονομάζεται «ευθυγράμμιση» με τους προβλεπόμενους χρήστες συστημάτων ή chatbot συχνά αποτυγχάνουν, υποστηρίζουν.
Δεν είναι έλλειψη προσπάθειας, όπως λένε στη μελέτη τους ερευνητές με επικεφαλής τον Diyi Yang, επίκουρο καθηγητή στο Πανεπιστήμιο του Στάνφορντ και μέρος του Stanford Project on Human-Centered Artificial Intelligence (HAI). «Προτού οι δημιουργοί ενός νέου chatbot AI μπορούν να κυκλοφορήσουν την τελευταία τους εφαρμογή στο κοινό, συχνά ευθυγραμμίζουν τα μοντέλα τους με τις διαφορετικές προθέσεις και τις προσωπικές αξίες των χρηστών για τους οποίους προορίζονται». Ωστόσο, η προσπάθεια επίτευξης μιας τέτοιας αντιστοίχισης «μπορεί να εισάγει τις δικές της προκαταλήψεις που θέτουν σε κίνδυνο την ποιότητα των απαντήσεων του chatbot».
Επίσης: Η Nvidia θα εκπαιδεύσει 100.000 Καλιφορνέζους να χρησιμοποιούν τεχνητή νοημοσύνη σε μια πρώτη στο είδος της συνεργασία
Θεωρητικά, «η ευθυγράμμιση θα πρέπει να είναι καθολική και να κάνει τα μεγάλα γλωσσικά μοντέλα πιο αποδεκτά και χρήσιμα για μια ποικιλία χρηστών σε όλο τον κόσμο και, ιδανικά, για τον μεγαλύτερο δυνατό αριθμό χρηστών», υποστηρίζουν. Ωστόσο, οι σχολιαστές που επιδιώκουν να προσαρμόσουν σύνολα δεδομένων και LLM σε διάφορες περιοχές ενδέχεται να παρερμηνεύσουν αυτά τα εργαλεία.
Τα chatbot που λειτουργούν με τεχνητή νοημοσύνη για σκοπούς που κυμαίνονται από την αλληλεπίδραση με τους πελάτες έως τους έξυπνους βοηθούς συνεχίζουν να πολλαπλασιάζονται με σημαντικό ρυθμό, επομένως διακυβεύονται πολλά. Η παγκόσμια αγορά chatbot τεχνητής νοημοσύνης αναμένεται να έχει αξία περίπου 67 δισεκατομμυρίων δολαρίων έως το 2033, αυξάνοντας με CAGR 26% από το σημερινό της μέγεθος άνω των 6 δισεκατομμυρίων δολαρίων, σύμφωνα με εκτιμήσεις της MarketsUS.
«Η αγορά chatbot της τεχνητής νοημοσύνης γνωρίζει ταχεία ανάπτυξη λόγω της αυξημένης ζήτησης για αυτοματοποιημένες υπηρεσίες υποστήριξης πελατών και της προόδου στην τεχνολογία AI», αναφέρουν οι συντάκτες της έκθεσης. «Είναι ενδιαφέρον ότι πάνω από το 50% των επιχειρήσεων αναμένεται να επενδύουν περισσότερα σε bots και ανάπτυξη chatbot παρά στην παραδοσιακή ανάπτυξη εφαρμογών για κινητά κάθε χρόνο».
Επίσης: Αν αυτά τα Chatbots μπορούσαν να μιλήσουν: Οι πιο δημοφιλείς χρήσεις των εργαλείων AI
Η ουσία είναι ότι ένας τεράστιος αριθμός γλωσσών και κοινοτήτων σε όλο τον κόσμο δεν εξυπηρετούνται επί του παρόντος από την τεχνητή νοημοσύνη και τα chatbot. Οι οδηγίες ή οι ενέργειες στα αγγλικά μπορεί να περιλαμβάνουν φράσεις ή ιδιωματισμούς που μπορεί να παρερμηνευθούν.
Η μελέτη του Stanford υποστηρίζει ότι τα LLM είναι πιθανό να βασίζονται στις προτιμήσεις των δημιουργών τους, οι οποίοι επί του παρόντος είναι πιο πιθανό να εδρεύουν σε αγγλόφωνες χώρες. Οι ανθρώπινες προτιμήσεις δεν είναι καθολικές και τα LLM πρέπει να αντικατοπτρίζουν «το κοινωνικό πλαίσιο των ανθρώπων που αντιπροσωπεύουν, οδηγώντας σε διαφορές στη γραμματική, τα θέματα, ακόμη και τα ηθικά και ηθικά συστήματα αξιών».
Οι ερευνητές του Στάνφορντ προσφέρουν τις ακόλουθες συστάσεις για την αύξηση της ευαισθητοποίησης σχετικά με την παγκόσμια ποικιλομορφία:
Αναγνωρίστε ότι η εναρμόνιση των γλωσσικών μοντέλων δεν είναι μια λύση που ταιριάζει σε όλους. «Οι διαδικασίες συνδιαλλαγής επηρεάζουν διαφορετικά τις διαφορετικές ομάδες».
Προσπαθήστε για διαφάνεια. Αυτό «είναι υψίστης σημασίας για την αποκάλυψη των σχεδιαστικών αποφάσεων που αφορούν την έγκριση LLM. Κάθε βήμα έγκρισης προσθέτει επιπλέον πολυπλοκότητα και επηρεάζει τους τελικούς χρήστες.» Τα περισσότερα σύνολα δεδομένων προτιμήσεων που έχουν γραφτεί από τον άνθρωπο δεν περιλαμβάνουν τα δημογραφικά στοιχεία των τοπικών σχολιαστών προτιμήσεων. “Η κοινοποίηση τέτοιων πληροφοριών, μαζί με τις αποφάσεις σχετικά με το ποιες προτροπές ή εργασίες βρίσκονται στον τομέα, είναι ουσιαστικής σημασίας για την υπεύθυνη διάδοση συνεπών LLM σε ένα διαφορετικό κοινό χρηστών.”
Αναζήτηση για πολύγλωσσα σύνολα δεδομένων. Οι ερευνητές εξέτασαν το σύνολο δεδομένων Tülu που χρησιμοποιείται σε γλωσσικά μοντέλα, από τα οποία το 13% δεν είναι αγγλικά. «Ωστόσο, αυτά τα πολύγλωσσα δεδομένα έχουν ως αποτέλεσμα βελτιωμένη απόδοση σε έξι από τις εννέα γλώσσες που δοκιμάστηκαν για QA ανάκτησης και στις εννέα γλώσσες για κατανόηση ανάγνωσης. Πολλές γλώσσες μπορούν να επωφεληθούν από τα πολύγλωσσα δεδομένα.”
Επίσης: Επιστήμονας AI: “Πρέπει να σκεφτόμαστε έξω από το μεγάλο γλωσσικό μοντέλο”
Η στενή συνεργασία με τους τοπικούς χρήστες είναι επίσης απαραίτητη για να ξεπεραστούν πολιτισμικά ή γλωσσικά κενά ή λάθη στα chatbot AI. «Η συνεργασία με τοπικούς ειδικούς και φυσικούς ομιλητές είναι κρίσιμη για τη διασφάλιση αυθεντικής και σχετικής ενσωμάτωσης», έγραψε ο Vuk Dukic, μηχανικός λογισμικού και ιδρυτής του Anablock, σε πρόσφατο άρθρο του LinkedIn. «Η ενδελεχής πολιτιστική έρευνα είναι απαραίτητη για να κατανοήσουμε τις αποχρώσεις κάθε αγοράς-στόχου. Η εφαρμογή αλγορίθμων συνεχούς μάθησης επιτρέπει στα chatbot να προσαρμόζονται στις αλληλεπιδράσεις και τα σχόλια των χρηστών με την πάροδο του χρόνου».
Ο Ντούκιτς ζήτησε επίσης «εκτεταμένες δοκιμές με τοπικούς χρήστες πριν από την πλήρη κυκλοφορία για να βοηθήσουν στον εντοπισμό και την αντιμετώπιση πολιτιστικών προκαταλήψεων». Επιπλέον, «η προσφορά επιλογής γλώσσας επιτρέπει στους χρήστες να επιλέξουν τη γλώσσα και το πολιτισμικό πλαίσιο που προτιμούν».