Apple MGIE: Νέο εργαλείο επεξεργασίας εικόνων με χρήση τεχνητής νοημοσύνης

0
4

Το μοντέλο επεξεργασίας εικόνων με χρήση τεχνητής νοημοσύνης της Apple κυκλοφόρησε και ονομάζεται MGIE, μια συντομογραφία για την επεξεργασία εικόνων καθοδηγούμενη από πολυτροπικά μοντέλα μεγάλων γλωσσών.

Πρόκειται για ένα εργαλείο σε πρώιμη ακόμα μορφή που είναι προς το παρόν διαθέσιμο μόνο στο GitHub. Πιθανότατα δεν θα το δούμε σε καμία συσκευή της εταιρείας, ωστόσο είναι ένα δείγμα του τι ετοιμάζει η Apple για το μέλλον.

Apple MGIE, Apple MGIE: Νέο εργαλείο επεξεργασίας εικόνων με χρήση τεχνητής νοημοσύνης

Για να το χρησιμοποιήσεις πρέπει να δώσεις οδηγίες με γραπτό κείμενο για την αλλαγή και την επεξεργασία εικόνων. Μπορεί να κάνει απλές εργασίες επεξεργασίας εικόνας όπως η αύξηση της αντίθεσης ή της φωτεινότητας και η αλλαγή της ισορροπίας λευκού. Μπορεί, όμως, να ακολουθήσει και πιο σύνθετες εντολές, όπως να κάνει την εικόνα μιας πίτσας να φαίνεται πιο υγιεινή προσθέτοντας περισσότερα λαχανικά από πάνω, για παράδειγμα.

Το μοντέλο MGIE, στο οποίο η Apple συνεργάστηκε με το Πανεπιστήμιο της Καλιφόρνιας στη Σάντα Μπάρμπαρα, μπορεί να προχωρήσει σε περικοπές και σε αλλαγές μεγέθους να συμπληρώσει αυτόματα περιγράμματα εικόνας, να αλλάξει τα μαλλιά, τα μάτια και τα ρούχα του υποκειμένου και να αφαιρέσει αντικείμενα.

“Αντί για μια σύντομη αλλά διφορούμενη καθοδήγηση, το MGIE αντλεί μια σαφή πρόθεση με οπτική επίγνωση και οδηγεί σε λογική επεξεργασία εικόνας. Διεξάγουμε εκτεταμένες μελέτες από διάφορες πτυχές της επεξεργασίας και αποδεικνύουμε ότι το MGIE μας βελτιώνει αποτελεσματικά την απόδοση, διατηρώντας παράλληλα την ανταγωνιστική αποδοτικότητα. Πιστεύουμε επίσης ότι το πλαίσιο καθοδήγησης MLLM μπορεί να συμβάλει στη μελλοντική έρευνα για την όραση και τη γλώσσα“, αναφέρουν οι ερευνητές στη δημοσίευση.

Πηγή