H ΟpenAI, δημιουργός του ChatGPT και του DALL-E, παρουσίασε το νέο, επαναστατικό της εργαλείο με την ονομασία “Sora”.
Σύμφωνα με την εταιρεία, το Sora «μπορεί να δημιουργήσει ρεαλιστικές και ευφάνταστες σκηνές από οδηγίες κειμένου». Το μοντέλο κειμένου σε βίντεο επιτρέπει στους χρήστες να δημιουργούν φωτορεαλιστικά βίντεο διάρκειας έως και ενός λεπτού με βάση τις οδηγίες που έχουν δώσει γραπτώς.
Το πρόγραμμα είναι σε θέση να δημιουργήσει «σύνθετες σκηνές με πολλούς χαρακτήρες, συγκεκριμένους τύπους κίνησης και ακριβείς λεπτομέρειες του θέματος και του φόντου», σύμφωνα με την εισαγωγική ανάρτηση blog της OpenAI. Aκόμα, επισημαίνει πως το μοντέλο μπορεί να καταλάβει πώς τα αντικείμενα «υπάρχουν στον φυσικό κόσμο», καθώς και «ερμηνεύει με ακρίβεια τα στηρίγματα και δημιουργεί συναρπαστικούς χαρακτήρες που εκφράζουν ζωντανά συναισθήματα».
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Το Sora μπορεί επίσης να δημιουργήσει ένα βίντεο με βάση μια ακίνητη εικόνα, καθώς και να συμπληρώσει τα καρέ που λείπουν σε ένα υπάρχον βίντεο ή να το επεκτείνει. Κάποια δείγματα του τι μπορεί να κάνει το πρόγραμμα αναρτήθηκαν από την εταιρεία και είναι πραγματικά εντυπωσιακά, αν και έχουν κάποια ενδεικτικά σημάδια τεχνητής νοημοσύνης. Η OpenAI αναφέρει ότι το μοντέλο «μπορεί να δυσκολεύεται να προσομοιώσει με ακρίβεια τη φυσική μιας περίπλοκης σκηνής».
Ο Sam Altman, ο επικεφαλής της OpenAI, δήλωσε στο X πως η εταιρεία του «θα προσφέρει σε περιορισμένο αριθμό δημιουργών την πρόσβαση» σ’ αυτό το νέο εργαλείο, στο πλαίσιο μιας πειραματικής φάσης.
Δείτε κάποια από τα πιο επιτυχημένα, πρώτα βίντεο χρηστών του Sora:
Look at this cat video!
Do you notice anything odd?
Well this is not a real cat! It’s created by OpenAI’s new model called “Sora” ! pic.twitter.com/JYsO5ZdF1A— iArgue (@x_ai_a12) February 16, 2024
This isn’t real.
This is OpenAI’s #Sora pic.twitter.com/PJ2WLL2Z6w
— Wilson 🌉 (@Wilson00000009) February 16, 2024
SORA can animate images pretty amazingly.
Prompt: “In an ornate, historical hall, a massive tidal wave peaks and begins to crash. Two surfers, seizing the moment, skillfully navigate the face of the wave.” pic.twitter.com/rNDB98jTe2
— AP (@angrypenguinPNG) February 16, 2024
Tp Lumiere της Google είναι ένας από τους κύριους ανταγωνιστές της OpenAI και σε αυτόν τον τομέα. Παρόμοια με το Sora, το Lumiere παρέχει στους χρήστες εργαλεία μετατροπής κειμένου σε βίντεο και επίσης τους επιτρέπει να δημιουργούν βίντεο από μια ακίνητη εικόνα.