
Ένα νέο δημοσίευμα από το The Information αποκαλύπτει μεγάλο μέρος του εσωτερικού χάους στην Apple πίσω από την ανανεωμένη έκδοση του Siri της Apple Intelligence.
Η Apple προφανώς στάθμισε πολλαπλές επιλογές. Μια αρχική ιδέα ήταν να κατασκευαστούν τόσο μικρά όσο και μεγάλα γλωσσικά μοντέλα, που ονομάστηκαν “Mini Mouse” και “Mighty Mouse”, για να εκτελούνται τοπικά σε iPhone και στο cloud, αντίστοιχα. Στη συνέχεια, οι αρμόδιοι του Siri αποφάσισαν να προχωρήσουν σε διαφορετική κατεύθυνση και να δημιουργήσει ένα ενιαίο μεγάλο γλωσσικό μοντέλο για να χειριστεί όλα τα αιτήματα μέσω του cloud, πριν από μια σειρά περαιτέρω τεχνικών περιστροφών. Η αναποφασιστικότητα και οι επαναλαμβανόμενες αλλαγές κατεύθυνσης φέρεται να απογοήτευσαν τους μηχανικούς και ώθησαν ορισμένα μέλη του προσωπικού να εγκαταλείψουν την Apple.
Εκτός από την εμμονή της Apple με το απόρρητο, αντικρουόμενες προσωπικότητες εντός της εταιρείας συνέβαλαν στα προβλήματα. Πάνω από μισή ντουζίνα πρώην υπάλληλοι που εργάζονταν στην ομάδα τεχνητής νοημοσύνης και machine learning της Apple είπαν στο The Information ότι η κακή ηγεσία ευθύνεται για τα προβλήματα εκτέλεσης, επικαλούμενοι μια υπερβολικά χαλαρή κουλτούρα, καθώς και την έλλειψη φιλοδοξίας και όρεξης για ανάληψη κινδύνων κατά το σχεδιασμό μελλοντικών εκδόσεων του Siri.
Η ομάδα AI/ML της Apple έχει ονομαστεί “AIMLless” εσωτερικά, ενώ οι εργαζόμενοι λέγεται ότι αναφέρονται στη Siri ως μια περίπτωση που μεταφέρεται συνεχώς μεταξύ διαφορετικών ομάδων χωρίς σημαντικές βελτιώσεις. Υπήρχαν επίσης συγκρούσεις σχετικά με υψηλότερες αμοιβές, ταχύτερες προαγωγές, μεγαλύτερες διακοπές κ.α. για τους εργαζομένους στο τμήμα ΑΙ.
Ο επικεφαλής τεχνητής νοημοσύνης της Apple, John Giannandrea, ήταν προφανώς σίγουρος ότι θα μπορούσε να διορθώσει το Siri με τα σωστά δεδομένα εκπαίδευσης και καλύτερη απόξεση ιστού για απαντήσεις σε ερωτήσεις γενικής γνώσης. Οι ανώτεροι ηγέτες δεν ανταποκρίθηκαν με την αίσθηση του επείγοντος στο ντεμπούτο του ChatGPT το 2022. Ο Giannandrea είπε στους υπαλλήλους ότι δεν πίστευε ότι τα chatbots όπως το ChatGPT πρόσθεταν μεγάλη αξία στους χρήστες.
Το 2023, οι διευθυντές της Apple είπαν στους μηχανικούς ότι τους απαγορεύτηκε να συμπεριλάβουν μοντέλα από άλλες εταιρείες στα τελικά προϊόντα της Apple και μπορούσαν να τα χρησιμοποιήσουν μόνο για συγκριτική αξιολόγηση έναντι των δικών τους μοντέλων, αλλά τα μοντέλα της Apple “δεν είχαν την ίδια απόδοση με την τεχνολογία της OpenAI”.
Εν τω μεταξύ, ο επικεφαλής του Siri, Robby Walker, εστίασε σε «μικρές νίκες», όπως η μείωση του χρόνου αναμονής για τις απαντήσεις του Siri. Ένα από τα projects του Walker ήταν η αφαίρεση του “hey” από τη φωνητική εντολή “hey Siri” που χρησιμοποιήθηκε για την κλήση του βοηθού, κάτι που χρειάστηκε πάνω από δύο χρόνια για να επιτευχθεί. Κατέρριψε επίσης μια προσπάθεια από μια ομάδα μηχανικών να χρησιμοποιήσει LLM για να δώσει στο Siri περισσότερη συναισθηματική ευαισθησία, ώστε να μπορεί να ανιχνεύσει και να δώσει τις κατάλληλες απαντήσεις σε χρήστες που βρίσκονται σε κίνδυνο.
Η Apple ξεκίνησε ένα έργο με την κωδική ονομασία “Link” για την ανάπτυξη φωνητικών εντολών για τον έλεγχο εφαρμογών και την ολοκλήρωση εργασιών για το Vision Pro, με σχέδια να επιτρέπει στους χρήστες να πλοηγούνται στο διαδίκτυο και να αλλάζουν μέγεθος παραθύρων μόνο με φωνή, καθώς και να υποστηρίζουν εντολές από πολλά άτομα σε έναν κοινόχρηστο εικονικό χώρο για συνεργασία. Τα περισσότερα από αυτά τα χαρακτηριστικά απορρίφθηκαν λόγω της αδυναμίας της ομάδας Siri να τα επιτύχει.
To δημοσίευμα υποστηρίζει ότι η επίδειξη των πιο εντυπωσιακών χαρακτηριστικών της Apple Intelligence στο WWDC 2024, όπως το σημείο όπου η Siri αποκτά πρόσβαση στα email ενός χρήστη για να βρει δεδομένα πτήσης σε πραγματικό χρόνο και παρέχει μια υπενθύμιση σχετικά με τα μεσημεριανά σχέδια χρησιμοποιώντας μηνύματα και σχεδιάζει μια διαδρομή σε χάρτες, ήταν ουσιαστικά πλασματική. Η επίδειξη προφανώς προκάλεσε έκπληξη για τα μέλη της ομάδας Siri, που δεν είχαν δει ποτέ λειτουργικές εκδόσεις των δυνατοτήτων.
Το μόνο χαρακτηριστικό από την επίδειξη του WWDC που ενεργοποιήθηκε σε συσκευές δοκιμής ήταν η παλλόμενη, πολύχρωμη κορδέλα της Apple Intelligence γύρω από την άκρη της οθόνης. Η απόφαση να παρουσιάσει μια τεχνητή επίδειξη ήταν μια σημαντική απόκλιση από την προηγούμενη συμπεριφορά της Apple, όπου θα έδειχνε μόνο χαρακτηριστικά και προϊόντα στις εκδηλώσεις της που λειτουργούσαν ήδη σε συσκευές δοκιμής και που η ομάδα μάρκετινγκ είχε εγκρίνει για να διασφαλίσει ότι θα μπορούσαν να κυκλοφορήσουν εντός του χρονοδιαγράμματος.
Ορισμένοι υπάλληλοι της Apple λέγεται ότι είναι αισιόδοξοι ότι ο Craig Federighi και ο Mike Rockwell μπορούν να γυρίσουν τη Siri. Ο Federighi προφανώς έχει δώσει οδηγίες στους μηχανικούς της Siri να κάνουν “ό,τι χρειάζεται για να δημιουργήσουν τις καλύτερες δυνατότητες AI”, ακόμα κι αν αυτό σημαίνει ότι χρησιμοποιούν μοντέλα ανοιχτού κώδικα από άλλες εταιρείες στα προϊόντα λογισμικού της σε αντίθεση με τα μοντέλα της ίδιας της Apple.