Νωρίτερα αυτό το μήνα, το OpenAI ανέβασε το ενδιαφέρον στον χώρο δημιουργίας βίντεο κάνοντας το Sora, το υπερσύγχρονο μοντέλο παραγωγής κειμένου σε βίντεο, διαθέσιμο στους χρήστες του ChatGPT Plus με το Sora Turbo. Τώρα η Google προετοιμάζεται να ανταγωνιστεί την κυκλοφορία της πιο προηγμένης συσκευής δημιουργίας βίντεο.
Η Google παρουσίασε τη Δευτέρα το Veo 2, μια συσκευή παραγωγής κειμένου σε βίντεο που διαθέτει βελτιώσεις σε σχέση με το προηγούμενο μοντέλο της εταιρείας, συμπεριλαμβανομένης της καλύτερης κατανόησης της φυσικής του πραγματικού κόσμου που βοηθά την τεχνητή νοημοσύνη να δημιουργήσει καλύτερες γενιές με μεγαλύτερη λεπτομέρεια και ρεαλισμό, σύμφωνα με την Google. .
Επιπλέον: Αυτό το νέο εργαλείο Google AI διευκολύνει τη δημιουργία εικόνων από άλλες φωτογραφίες — δεν απαιτείται προτροπή.
Τα βίντεο που δημιουργούνται μπορούν να φτάσουν την ανάλυση 4K και, σύμφωνα με την Google, μπορούν να λύσουν κοινά προβλήματα με τις γεννήτριες βίντεο, συμπεριλαμβανομένων των παραισθήσεων όπως τα επιπλέον δάχτυλα. Με βάση αξιολογήσεις από αξιολογητές άλλων κορυφαίων μοντέλων βίντεο, συμπεριλαμβανομένων των Sora Turbo, Kiling v1.5 και Meta Movie Gen, το Veo 2 βαθμολογήθηκε ως το καλύτερο για συνολική απόδοση και γρήγορη συμμόρφωση.
Το Veo 2 κατανοεί επίσης κινηματογραφική γλώσσα, όπως ένα συγκεκριμένο είδος, φακό ή γωνία. Για παράδειγμα, εάν ο χρήστης πει “ρηχό βάθος πεδίου”, το Veo 2 ξέρει να θολώνει το φόντο του θέματος για να έχει το εφέ. Το παρακάτω βίντεο δημιουργήθηκε από ένα καρέ που έγραφε: «Τραβήχτηκε με φακό 35 mm σε φιλμ Kodak Portra 400».
Το μοντέλο είναι διαθέσιμο στο κοινό και είναι προσβάσιμο από το VideoFX στο Google Labs. Η φόρμα λίστας αναμονής Early Access ζητά βασικές πληροφορίες όπως ηλικία, όνομα, τοποθεσία, σχετική εργασία και πώς ακούσατε γι’ αυτήν. Η Google είπε ότι οι αιτήσεις εξετάζονται καθώς παραλαμβάνονται.
Η Google είπε επίσης ότι έχει βελτιώσει το μοντέλο δημιουργίας εικόνων της, Imagen 3, για να παράγει εικόνες «πιο ζωντανές και με καλύτερη σύνθεση». Το βελτιωμένο μοντέλο μπορεί να δημιουργήσει πιο διαφορετικά στυλ και να εξάγει εικόνες με μεγαλύτερη ακρίβεια, πλουσιότερες λεπτομέρειες και υφές, λέει η εταιρεία.
Αυτή η έκδοση του Imagen 3 διανέμεται μέσω του ImageFX στα Εργαστήρια Google από σήμερα και, σε αντίθεση με το VideoFX, δεν απαιτεί λίστα αναμονής. Η προηγούμενη έκδοση του Imagen 3 ήταν ήδη πολύ ικανή και θεωρήθηκε η καλύτερη δημιουργία εικόνων AI στην κριτική του ZDNET για το 2024.
Επίσης: Τα Εργαστήρια Google μόλις ενημέρωσαν το σχέδιο. Εδώ είναι 6 λόγοι για να το ελέγξετε
Τέλος, η Google παρουσίασε το Whisk, ένα νέο πείραμα που είναι επίσης διαθέσιμο στα Labs. Αυτό το εργαλείο επιτρέπει στους χρήστες να δημιουργήσουν μια εικόνα (ή να εισάγουν τη δική τους) και να τη μεταμορφώσουν σε μια νέα εικόνα στυλ βελούδινης, εικονιδίου ή αυτοκόλλητου. Χρησιμοποιεί το Imagen 3 και το Gemini για να δημιουργήσει λεπτομερείς λεζάντες για την εικόνα σας που τροφοδοτούνται στο Imagen 3 για τη δημιουργία των τελικών προϊόντων.