Η Google έκανε ένα νέο βήμα στην επιθετική της πορεία εφαρμοσμένη τεχνητή νοημοσύνη σε βιντεοπαιχνίδια και εικονικούς κόσμους Με την κυκλοφορία του Project Genie, ενός πρωτοτύπου που επιτρέπει στους χρήστες να δημιουργούν και να πλοηγούνται σε διαδραστικά περιβάλλοντα με βάση μερικές προτροπές κειμένου ή μια εικόνα, η εταιρεία παρουσιάζει το εργαλείο ως ένα πείραμα που βρίσκεται ακόμη σε στάδιο δοκιμών. Ωστόσο, οι αρχικές του επιδείξεις έχουν προκαλέσει τόσο ενθουσιασμό όσο και αμφιβολίες στον κλάδο.
Προς το παρόν, η πρόσβαση περιορίζεται σε συνδρομητές του προγράμματος Google AI Ultra στις Ηνωμένες Πολιτείεςμε σύντομες συνεδρίες και απόδοση που χαρακτηρίζεται σαφώς από την πειραματική φύση του συστήματος. Ακόμα κι έτσι, το έργο υποδεικνύει ένα μέλλον στο οποίο οποιοσδήποτε χρήστης θα μπορούσε δημιουργήστε έναν μικρό «παιχνιδιάρικο κόσμο» σε λίγα δευτερόλεπτα, χωρίς να χρειάζεται να γνωρίζετε πώς να προγραμματίζετε ή να χειρίζεστε μηχανές γραφικών.
Τι είναι το Project Genie και ποιες τεχνολογίες συνδυάζει;

Το Project Genie είναι ένα ερευνητικό πρωτότυπο που αναπτύχθηκε από την Google DeepMind και την Google AI το οποίο λειτουργεί ως μια διαδραστική γεννήτρια κόσμων. Η τεχνική του βάση στηρίζεται σε τρεις πυλώνες: το μοντέλο Genie 3, που ειδικεύεται στην προσομοίωση δυναμικών περιβαλλόντων, το Nano Banana Pro, που είναι υπεύθυνο για τις οπτικές πτυχές και τα σκίτσα, και το Gemini, το πολυτροπικό μοντέλο που ερμηνεύει τις οδηγίες χρήστη και λειτουργεί ως βοηθός κατά τη δημιουργία.
Η καρδιά του συστήματος είναι Genie 3, ένα μοντέλο «κόσμου» ικανό να προβλέπει καρέ προς καρέ τι συμβαίνει στην οθόνηΣε αντίθεση με προηγούμενες τεχνολογίες που δημιουργούσαν μόνο στατικές τρισδιάστατες σκηνές, αυτή η προσέγγιση επιτρέπει στο περιβάλλον να αντιδρά στις κινήσεις του παίκτη σε πραγματικό χρόνο, με ανάλυση περίπου 720p και αρκετά λεπτά οπτικής συνοχής, σύμφωνα με τα εσωτερικά πειράματα του DeepMind.
Με βάση αυτό, ενσωματώνεται Nano Banana Pro, υπεύθυνο για τη δημιουργία της αρχικής εικόνας της σκηνής Ξεκινώντας με ένα περιγραφικό κείμενο ή μια εικόνα αναφοράς, αυτή η πρώτη προβολή χρησιμεύει ως σκίτσο για να αποφασιστεί το γραφικό στυλ, η σύνθεση του κόσμου και η εμφάνιση του χαρακτήρα που θα ελεγχθεί κατά την εξερεύνηση.
Τέλος, Ο Δίδυμος λειτουργεί ως ενορχηστρωτικό στρώμα και βοηθόςΕρμηνεύει οδηγίες σε φυσική γλώσσα, βοηθά στην προσαρμογή του κόσμου εν κινήσει και διευκολύνει εργασίες όπως η αλλαγή της προοπτικής (πρώτου ή τρίτου προσώπου), η αναμίξη ενός ήδη δημιουργημένου περιβάλλοντος ή ο συνδυασμός πολλών ιδεών σε ένα μόνο σενάριο παιχνιδιού.
Πώς δημιουργούνται και εξερευνώνται οι εικονικοί κόσμοι

Η λειτουργία του Project Genie είναι δομημένη γύρω από ένα προοδευτική διαδικασία σε τρία στάδια Η Google το συνοψίζει ως σκιαγράφηση, εξερεύνηση και ανάμειξη κόσμων. Ο στόχος είναι ο καθένας να μπορεί να μεταβεί από μια ιδέα σε μια μικρή διαδραστική εμπειρία χωρίς πρόσθετα εργαλεία.
Στο πρώτο στάδιο, ο χρήστης γράφει μια περιγραφή του κόσμου που θέλει να δημιουργήσει ή ανεβάζει μια εικόνα αναφοράς. Από αυτήν την εισαγωγή, Το Nano Banana Pro δημιουργεί μια στατική προεπισκόπηση. Το σκηνικό μπορεί να είναι ένα δάσος σε στυλ low-poly, ένα φουτουριστικό αστικό περιβάλλον, ένα ιστορικό τοπίο ή οτιδήποτε περιγράφεται στο κείμενο. Σε αυτή τη φάση ορίζονται επίσης ο τύπος χαρακτήρα, η λειτουργία κάμερας και ορισμένες βασικές παράμετροι κίνησης.
Μόλις το σκίτσο γίνει δεκτό, το Genie 3 μπαίνει στο παιχνίδι για να επιτρέψει στον παίκτη Εξερευνήστε ελεύθερα το περιβάλλον, χρησιμοποιώντας τυπικά χειριστήρια υπολογιστή, όπως τα πλήκτρα W, A, S και DΤο μοντέλο δημιουργεί εν κινήσει αυτό που εμφανίζεται μπροστά από τον χαρακτήρα, προβλέποντας κάθε καρέ με βάση τα προηγούμενα και διατηρώντας μια συγκεκριμένη συνέπεια όταν η κάμερα γυρίζει ή επιστρέφει σε μια περιοχή που έχει ήδη επισκεφθεί.
Η τρίτη βασική ικανότητα είναι η συνδυασμός και αναμίξη κόσμωνΤο σύστημα επιτρέπει στους χρήστες να επανεξετάσουν σενάρια που έχουν δημιουργηθεί προηγουμένως, να τα τροποποιήσουν με νέες παραμέτρους, να τα συγχωνεύσουν ή ακόμα και να χρησιμοποιήσουν προ-δημιουργημένους κόσμους από την Google ως βάση για τη δημιουργία παραλλαγών. Επιπλέον, μπορούν να κοινοποιηθούν βίντεο από τις συνεδρίες για να τα δουν ή να τα χρησιμοποιήσουν άλλοι χρήστες ως έμπνευση.
Όλα αυτά εκτελούνται από μια διαδικτυακή εφαρμογή παρόμοια με άλλες υπηρεσίες τεχνητής νοημοσύνης της Google, έτσι ώστε Δεν χρειάζεται να εγκατασταθούν πρόσθετα προγράμματα, ούτε απαιτούνται προηγμένες τεχνικές γνώσεις.Απλώς αποκτήστε πρόσβαση στο εργαλείο, εισαγάγετε την οδηγία και ξεκινήστε τη δοκιμή συνδυασμών μέχρι να βρείτε ένα ενδιαφέρον αποτέλεσμα.
Τεχνικοί περιορισμοί: χρόνος, απόδοση και ρεαλισμός

Η Google επιμένει να ορίσει το Project Genie ως... ερευνητικό πρωτότυπο με έντονο πειραματικό χαρακτήραΑυτή η ετικέτα δεν είναι μια απλή τυπικότητα: η τρέχουσα εμπειρία παρουσιάζει αρκετούς σαφείς περιορισμούς που καθορίζουν την πρακτική χρήση του εργαλείου πέρα από την αρχική περιέργεια.
Το πιο προφανές είναι το Όριο 60 δευτερολέπτων ανά συνεδρία δημιουργίας και εξερεύνησηςΜετά από αυτό το λεπτό, ο κόσμος κλείνει και πρέπει να ξεκινήσει μια νέα εμπειρία. Η εταιρεία εξηγεί ότι αυτός ο περιορισμός επιτρέπει την καλύτερη κατανομή των υπολογιστικών πόρων, καθώς κάθε συνεδρία δεσμεύει ένα ειδικό τσιπ για τον χρήστη που παίζει.
Όσον αφορά την απόδοση, οι δημόσιες δοκιμές περιγράφουν ανάλυση κοντά στα 720p και συχνότητα μεταξύ 20 και 24 καρέ ανά δευτερόλεπτοΑυτά τα χαρακτηριστικά συνοδεύονται από αισθητή καθυστέρηση εισόδου κατά την μετακίνηση του χαρακτήρα ή την αλλαγή της κάμερας. Σύμφωνα με ορισμένους πρώτους δοκιμαστές, η εμπειρία μοιάζει περισσότερο με ένα διαδραστικό βίντεο παρά με ένα πλήρως ρευστό, παραδοσιακό βιντεοπαιχνίδι.
Θα πρέπει επίσης να σημειωθεί ότι το Genie 3 Δεν είναι μια κλασική μηχανή γραφικών, αλλά ένα μοντέλο που προβλέπει το επόμενο καρέ. Με βάση τα παραπάνω. Αυτό έχει ως αποτέλεσμα παράξενες συμπεριφορές: διαδρομές που αλλάζουν υφή χωρίς προφανή λόγο, στοιχεία που εξαφανίζονται, απίθανη φυσική ή κινούμενα σχέδια που παραμορφώνονται τυχαία.
Η ίδια η Google προειδοποιεί ότι οι δημιουργημένοι κόσμοι «Μπορεί να μην φαίνονται απολύτως αληθινά ή να μην συμμορφώνονται πάντα με τις ενδείξεις ή τους νόμους της φυσικής».Και τα χειριστήρια των χαρακτήρων μπορεί να είναι ανακριβή. Με άλλα λόγια, η τεχνολογία δείχνει πολλά υποσχόμενη, αλλά απέχει πολύ από το να προσφέρει μια άψογη εμπειρία παιχνιδιού όσον αφορά το gameplay και την οπτική σταθερότητα.
Περιορισμένη πρόσβαση και διεθνής χάρτης πορείας

Σε αυτήν την πρώτη φάση, το Project Genie είναι διαθέσιμο μόνο για Πελάτες της Google AI Ultra στις Ηνωμένες ΠολιτείεςΤο πιο προηγμένο πρόγραμμα συνδρομής της εταιρείας απευθύνεται σε επιχειρήσεις και δημιουργούς που χρειάζονται δυνατότητες τεχνητής νοημοσύνης υψηλής απόδοσης. Πρόκειται για μια premium υπηρεσία, η οποία περιορίζει τον αριθμό των χρηστών με πρόσβαση στο πείραμα.
Η απόφαση για περιορισμό των δοκιμών εξηγείται τόσο από το υπολογιστικό κόστος κάθε συνεδρίας Αυτό οφείλεται στο ενδιαφέρον της Google για τη συλλογή λεπτομερών σχολίων πριν από μια ευρύτερη κυκλοφορία. Η Διευθύντρια Έρευνας της DeepMind, Shlomi Frutcher, τόνισε ότι είναι «συναρπαστικό» που μπορούμε να ανοίξουμε αυτά τα εργαλεία σε περισσότερους ανθρώπους για να συλλέξουμε απόψεις σχετικά με τη χρήση τους στον πραγματικό κόσμο, αλλά προς το παρόν δεν υπάρχει συγκεκριμένη ημερομηνία για την άφιξή τους στην Ευρώπη ή σε άλλες αγορές.
Από την οπτική γωνία των Ισπανών και Ευρωπαίων χρηστών και μελετών, αυτό μεταφράζεται στο γεγονός ότι, τουλάχιστον βραχυπρόθεσμα, Ο πιο ρεαλιστικός ρόλος θα είναι αυτός του παρατηρητήΠαρακολουθήστε στενά τις δοκιμές, αναλύστε τα βίντεο που κυκλοφορούν ήδη στα μέσα κοινωνικής δικτύωσης και αξιολογήστε σε ποιο βαθμό αυτή η τεχνολογία θα μπορούσε να ενσωματωθεί σε ροές εργασίας για σχεδιασμό επιπέδων, ταχεία δημιουργία πρωτοτύπων ή οπτικοποίηση ιδεών.
Η Google έχει δηλώσει την πρόθεσή της να σταδιακά επεκτείνετε την πρόσβαση Υπό την προϋπόθεση ότι η απόδοση, το κόστος και τα νομικά ζητήματα το επιτρέπουν. Ωστόσο, ο ρυθμός αυτής της επέκτασης θα εξαρτηθεί επίσης από την ανταπόκριση της κοινότητας και από το πώς θα εξελιχθούν οι συζητήσεις γύρω από τα πνευματικά δικαιώματα και την υπεύθυνη χρήση περιεχομένου τρίτων.
Ικανότητα μίμησης γνωστών παιχνιδιών και συζήτησης για τα πνευματικά δικαιώματα
Ένα από τα πιο ευαίσθητα σημεία του Project Genie ήταν το ικανότητα αναδημιουργίας, με ποικίλους βαθμούς επιτυχίας, κόσμων σαφώς εμπνευσμένων από υπάρχοντα βιντεοπαιχνίδιαΜερικοί εξειδικευμένοι δημοσιογράφοι κατάφεραν να δημιουργήσουν σενάρια που έμοιαζαν σαφώς με τίτλους όπως το Super Mario 64, το Metroid Prime ή το The Legend of Zelda: Breath of the Wild.
Στην περίπτωση της Zelda, έχουν μάλιστα εμφανιστεί χαρακτήρες που αναπτύσσουν ένα αλεξίπτωτο πλαγιάς κατά το άλμαΑυτή η χειρονομία συνδέεται στενά με το παιχνίδι της Nintendo. Αυτές οι συμπτώσεις υποδηλώνουν ότι το μοντέλο έχει εκπαιδευτεί χρησιμοποιώντας έναν μεγάλο αριθμό δημόσια διαθέσιμων βίντεο παιχνιδιού, εγείροντας ερωτήματα σχετικά με τον χειρισμό της πνευματικής ιδιοκτησίας στην εκπαίδευση στην Τεχνητή Νοημοσύνη.
Μετά από αρκετές δοκιμές στις οποίες αναδημιουργήθηκαν κόσμοι εμπνευσμένοι από εξαιρετικά αναγνωρίσιμα franchise, η Google άρχισε να... μπλοκάρει τη δημιουργία ορισμένων σεναρίων και χαρακτήρωνειδικά όταν αναφέρονται συγκεκριμένα ονόματα ή εμπορικά σήματα. Σε ορισμένες περιπτώσεις, το εργαλείο αποτρέπει άμεσα τη δημιουργία κόσμων που βασίζονται σε συγκεκριμένα έπη, επικαλούμενο «συμφέροντα τρίτων παρόχων περιεχομένου».
Η εταιρεία εξηγεί ότι το Project Genie είναι «εκπαιδευμένοι κυρίως με δημόσια διαθέσιμα δεδομένα ιστού»Αλλά να θυμάστε ότι αυτό το περιεχόμενο εξακολουθεί να υπόκειται σε νόμους περί πνευματικών δικαιωμάτων. Το αποτέλεσμα είναι ένα σύστημα εποπτείας που βρίσκεται ακόμη υπό κατασκευή, στο οποίο ορισμένες προσπάθειες αναπαραγωγής έργων που προστατεύονται από πνευματικά δικαιώματα αποκλείονται ρητά, ενώ άλλες δεν εφαρμόζονται εφόσον αποφεύγονται οι υπερβολικά άμεσες αναφορές.
Αυτή η ασυνήθιστη συμπεριφορά τροφοδοτεί τη συζήτηση σχετικά με Σε ποιο βαθμό μπορεί ή πρέπει η Τεχνητή Νοημοσύνη να εμπνευστεί από υπάρχοντα παιχνίδια; Και πού χαράσσεται η γραμμή μεταξύ τιμής, μίμησης και αντιγραφής; Μια συζήτηση που πιθανότατα θα είναι ιδιαίτερα σημαντική σε περιοχές όπως η Ευρωπαϊκή Ένωση, όπου τα κανονιστικά πλαίσια για τα δεδομένα εκπαίδευσης και τα πνευματικά δικαιώματα στην Τεχνητή Νοημοσύνη εξακολουθούν να ορίζονται.
Πιθανές επιπτώσεις στη βιομηχανία βιντεοπαιχνιδιών
Πέρα από την ελκυστικότητα των μέσων ενημέρωσης για την παρακολούθηση κόσμοι «σαν τον Mario» ή «σαν τον Zelda» που δημιουργούνται σε δευτερόλεπταΤο Project Genie αποτελεί μέρος ενός ευρύτερου αγώνα δρόμου μεταξύ των μεγάλων εταιρειών τεχνολογίας για την εφαρμογή της γενετικής τεχνητής νοημοσύνης στην ανάπτυξη παιχνιδιών. Η Microsoft, για παράδειγμα, έχει αποκαλύψει έργα όπως το Muse για την αυτοματοποίηση τμημάτων της διαδικασίας σχεδιασμού και παραγωγής, ενώ άλλες εταιρείες διερευνούν παρόμοιες λύσεις για τη μείωση του κόστους και την επιτάχυνση της ανάπτυξης.
Σε αυτό το πλαίσιο, η πρόταση της Google στοχεύει να γίνει ένα εργαλείο γρήγορης δημιουργίας πρωτοτύπων και πειραματισμού Αυτό θα μπορούσε να ενδιαφέρει τόσο ανεξάρτητα στούντιο όσο και μεγάλους εκδότες. Η δυνατότητα δημιουργίας ενός σεναρίου που μπορεί να παιχτεί από ένα σκίτσο ή μια παράγραφο κειμένου μπορεί να διευκολύνει την έγκαιρη επικύρωση ιδεών, τη δημιουργία εσωτερικών demos ή τη δοκιμή μηχανισμών χωρίς να χρειαστεί να δαπανηθούν μήνες εργασίας.
Ωστόσο, η άνοδος αυτού του είδους λύσεων προκαλεί ανησυχία σε ορισμένους στον τομέα. Αφενός, Υπάρχει ανησυχία σχετικά με τον πιθανό αντίκτυπο σε ορισμένα επαγγελματικά προφίλ. Εάν μέρος του περιεχομένου δημιουργείται αυτόματα. Από την άλλη πλευρά, πολλοί προγραμματιστές είναι επιφυλακτικοί απέναντι σε επιχειρηματικά μοντέλα στα οποία η Τεχνητή Νοημοσύνη εκπαιδεύεται σε ήδη δημοσιευμένα έργα χωρίς σαφή αποζημίωση για τους δημιουργούς τους.
Στις ευρωπαϊκές και ισπανικές αγορές, όπου η συζήτηση για την προστασία της πολιτιστικής δημιουργίας είναι ιδιαίτερα έντονη, θα είναι κρίσιμο να δούμε πώς εργαλεία όπως το Project Genie εντάσσονται σε μελλοντικούς κανονισμούς. Πτυχές όπως η διαφάνεια σχετικά με τα δεδομένα εκπαίδευσης, τα συστήματα εξαίρεσης για τους κατόχους δικαιωμάτων και η απόδοση του παραγόμενου περιεχομένου μπορούν να κάνουν τη διαφορά μεταξύ της συνετής υιοθέτησης και της συνεχιζόμενης σύγκρουσης με τους προγραμματιστές και τους εκδότες.
Προς το παρόν, το Project Genie παραμένει σε πρώιμο στάδιο όπου Λειτουργεί περισσότερο ως δημόσιο εργαστήριο παρά ως τελικό προϊόν.Η εξέλιξή του, και ο τρόπος με τον οποίο η Google χειρίζεται τα σχετικά νομικά και ηθικά ζητήματα, θα καθορίσει εάν τελικά θα ενσωματωθεί στις ροές εργασίας των στούντιο ή θα παραμείνει ένα φανταχτερό αλλά περιορισμένο πείραμα.
Ωστόσο, η εμφάνιση αυτού του πρωτοτύπου καθιστά σαφές ότι οι μεγάλες εταιρείες τεχνολογίας βλέπουν στο Αυτόματη δημιουργία διαδραστικών κόσμων ένα στρατηγικό έδαφος πρώτης τάξεως. Αν και η πραγματική χρήση του σήμερα είναι περιορισμένη και μαστίζεται από τεχνικές ατέλειες, η κατεύθυνση είναι σαφής: μοντέλα που είναι ολοένα και πιο ικανά να μετατρέπουν κείμενο και εικόνες σε εμπειρίες που μπορούν να παιχτούν, και μια βιομηχανία που θα πρέπει να αποφασίσει πώς θέλει να συνυπάρχει με αυτά τα νέα εργαλεία.