Όταν το OpenAI πραγματοποίησε την εκδήλωση Spring Launch τον Μάιο, ένα από τα κυριότερα σημεία ήταν η επίδειξη μιας νέας λειτουργίας φωνής στο ChatGPT, ενισχυμένη από τις νέες δυνατότητες βίντεο και ήχου του GPT-4o. Η πολυαναμενόμενη νέα λειτουργία φωνής είναι επιτέλους εδώ (κάπως).
Επίσης: Καλύτερα Chatbots AI του 2024: ChatGPT, Copilot και Worthy Alternatives
Την Τρίτη, το OpenAI ανακοίνωσε στο Post X ότι η λειτουργία φωνής θα ξεκινήσει σε alpha σε μια μικρή ομάδα χρηστών του ChatGPT Plus, προσφέροντάς τους έναν πιο έξυπνο φωνητικό βοηθό που μπορεί να κάνει παύση και να ανταποκρίνεται στα συναισθήματα των χρηστών.
Οι χρήστες που συμμετέχουν στο τεστ alpha θα λάβουν ένα email με οδηγίες και ένα μήνυμα στην εφαρμογή για κινητά, όπως φαίνεται στο παραπάνω βίντεο. Εάν δεν έχετε λάβει ακόμη την ειδοποίηση, μην ανησυχείτε. Το OpenAI μοιράστηκε ότι θα συνεχίσει να προσθέτει χρήστες καθώς θα είναι διαθέσιμο και σχεδιάζει να παρέχει πρόσβαση σε όλους τους χρήστες του ChatGPT Plus το φθινόπωρο.
Στην αρχική επίδειξη παρουσίασης παρακάτω, η εταιρεία έδειξε τις πολυτροπικές δυνατότητες του Voice Mode, συμπεριλαμβανομένης της βοήθειας με περιεχόμενο στις οθόνες των χρηστών και της χρήσης της κάμερας του τηλεφώνου του χρήστη ως πλαίσιο για την απόκριση.
Ωστόσο, η άλφα έκδοση του Voice Mode δεν θα έχει αυτές τις δυνατότητες. Το OpenAI μοιράστηκε ότι “οι δυνατότητες κοινής χρήσης βίντεο και οθόνης θα κυκλοφορήσουν σε μεταγενέστερη ημερομηνία”. Η εταιρεία είπε επίσης ότι από τότε που επιδείχθηκε αρχικά η τεχνολογία, έχει βελτιώσει την ποιότητα και την ασφάλεια των φωνητικών συνομιλιών.
Το OpenAI δοκίμασε τις δυνατότητες φωνής με περισσότερα από 100 εξωτερικά μέλη της Red Team σε 45 γλώσσες, σύμφωνα με το Thread X. Η εταιρεία εκπαίδευσε επίσης το μοντέλο να μιλά μόνο σε τέσσερις προκαθορισμένες φωνές, να αποκλείει την έξοδο που αποκλίνει από αυτές τις φωνές που έχουν εκχωρηθεί και να εφαρμόζει περιορισμούς για αποκλεισμό αιτήσεων.
Η εταιρεία είπε επίσης ότι τα σχόλια των χρηστών θα ληφθούν υπόψη για την περαιτέρω βελτίωση του μοντέλου και θα μοιραστεί μια λεπτομερή αναφορά για την απόδοση του GPT-4os, συμπεριλαμβανομένων των περιορισμών και των αξιολογήσεων ασφαλείας, τον Αύγουστο.
Επίσης: Τα εργαλεία τεχνητής νοημοσύνης επόμενης γενιάς της Google σάς βοηθούν να στοχεύσετε υπερ-στόχευση τις διαφημιστικές σας καμπάνιες
Μπορείτε να γίνετε συνδρομητής του ChatGPT Plus με 20 $ το μήνα. Άλλα πλεονεκτήματα της συνδρομής περιλαμβάνουν προηγμένες αναλύσεις δεδομένων, δημιουργία εικόνων, πρόσβαση κατά προτεραιότητα στο GPT-4o και πολλά άλλα.
Μια εβδομάδα αφότου το OpenAI παρουσίασε αυτή τη δυνατότητα, η Google παρουσίασε μια παρόμοια λειτουργία που ονομάζεται Gemini Live. Ωστόσο, το Gemini Live δεν είναι ακόμα διαθέσιμο στους χρήστες. Αυτό μπορεί να αλλάξει σύντομα στην εκδήλωση Made by Google που θα πραγματοποιηθεί σε λίγες εβδομάδες.