Skip to content Skip to sidebar Skip to footer

Project Genie και Google Street View μετατρέπουν τοποθεσίες του πραγματικού κόσμου σε εικονικούς

Το πολυαναμενόμενο Project Genie αποτελεί τη νεότερη, πειραματική προσπάθεια της Google να δημιουργήσει ένα general-purpose world model, ένα παγκόσμιο μοντέλο δηλαδή γενικού σκοπού, το οποίο έχει την ικανότητα να παράγει ποικιλόμορφα και πλήρως διαδραστικά περιβάλλοντα σε πραγματικό χρόνο.

Από την πρώτη κιόλας στιγμή της επίσημης παρουσίασής του, το συγκεκριμένο σύστημα έχει αναδειχθεί σε ένα απολύτως θεμελιώδες εργαλείο για την τεχνολογική έρευνα αιχμής. Η πολύπλοκη αρχιτεκτονική του επιτρέπει σε αυτόνομους ψηφιακούς agents να εκπαιδεύονται, να αναλύουν δεδομένα και να εξάγουν λογικά συμπεράσματα μέσα σε εξαιρετικά περίπλοκες εικονικές συνθήκες.

Ένα εξαιρετικό δείγμα της τεράστιας δυναμικής του εντοπίζεται στην πρακτική εφαρμογή του από την εταιρεία Waymo, όπου το λογισμικό αξιοποιείται για την προσομοίωση υπερ-ρεαλιστικών οδικών συνθηκών. Αυτή η διαδικασία βοηθά τα αυτόνομα οχήματα να εκπαιδευτούν με απόλυτη ασφάλεια σε απρόβλεπτα σενάρια πλοήγησης, αποδεικνύοντας τη μεγάλη αξία της τεχνολογίας generative AI στην ανάπτυξη της επόμενης γενιάς αυτόνομων συστημάτων και της βιομηχανικής ρομποτικής.

Η σύνδεση του ψηφιακού με τον πραγματικό κόσμο μέσω του Street View

Project Genie: Η τεχνητή νοημοσύνη της Google αλλάζει το Street View

Σήμερα, η Google πραγματοποιεί ένα τεράστιο τεχνολογικό άλμα, αποφασίζοντας να συνδέσει άμεσα την τεράστια παραγωγική δύναμη του συστήματος με τις πραγματικές εικόνες που συλλέγει εδώ και χρόνια το γνωστό Street View. Αυτή η στρατηγική αναβάθμιση αποτελεί σημείο καμπής, καθώς επιτρέπει στα μοντέλα μηχανικής μάθησης να αντλούν τα δεδομένα τους απευθείας από την ίδια την πραγματικότητα, λειτουργώντας με αυτό που στη βιομηχανία ονομάζεται spatial computing.

Το νέο Project Genie της Google συνδυάζει την παραγωγική τεχνητή νοημοσύνη με τα δεδομένα του Street View, δημιουργώντας ρεαλιστικούς ψηφιακούς κόσμους.

Αντί να βασίζονται αποκλειστικά σε πλήρως συνθετικά, φανταστικά περιβάλλοντα που συχνά υποφέρουν από αλγοριθμικές παραισθήσεις και έλλειψη συνοχής, τα μοντέλα διαθέτουν πλέον μια στερεή, αξιόπιστη βάση πραγματικών γεωχωρικών δεδομένων.

Η νέα εποχή της χωρικής υπολογιστικής: Το Project Genie συναντά το Google Maps

Αυτή η επέκταση των δυνατοτήτων δημιουργεί ένα ασφαλές, εξαιρετικά ακριβές εικονικό sandbox, μέσα στο οποίο τα συστήματα τεχνητής νοημοσύνης και τα φυσικά ρομπότ μπορούν να πλοηγηθούν και να αλληλεπιδράσουν με την ασύλληπτη πολυπλοκότητα των σύγχρονων αστικών και αγροτικών υποδομών.

Με το νέο rollout, το ερευνητικό πρωτότυπο αποκτά νέα πνοή και άμεση πρακτική εφαρμογή. Οι χρήστες της πλατφόρμας αποκτούν τη δυνατότητα να αξιοποιήσουν τη χαρτογράφηση του πραγματικού κόσμου για να εξερευνήσουν ψηφιακά τα αγαπημένα τους σημεία στον πλανήτη ή, ακόμα πιο εντυπωσιακά, να επέμβουν στον κώδικα και να τα αναδημιουργήσουν ριζικά, εφαρμόζοντας τις δικές τους δημιουργικές κατευθύνσεις μέσω εξειδικευμένων text prompts.

Δημιουργία δυναμικών κόσμων με γεωγραφική ακρίβεια

Η μεθοδολογία παραγωγής αυτών των ευφάνταστων ψηφιακών κόσμων έχει απλοποιηθεί σε εντυπωσιακό βαθμό, διατηρώντας ωστόσο στο ακέραιο τη βαθιά της τεχνική υπόσταση. Όταν οι ερευνητές και οι δημιουργοί περιεχομένου πειραματίζονται με την πλατφόρμα, μπορούν να θέσουν ως σημείο μηδέν απολύτως υπαρκτές τοποθεσίες.

Η διαδικασία ξεκινά με την επιλογή μιας τοποθεσίας στον χάρτη -η οποία προσφάτως υποστηρίζεται αποκλειστικά για περιοχές εντός των συνόρων των Ηνωμένων Πολιτειών- και συνεχίζεται με την προαιρετική εφαρμογή ενός συγκεκριμένου εικαστικού rendering. Οι διαθέσιμες οπτικές επιλογές ποικίλουν εντυπωσιακά από θεματολογίες όπως η απέραντη έρημος μέχρι την παλαιολιθική εποχή.

Στη συνέχεια, ο χρήστης καλείται να ορίσει τα βασικά χαρακτηριστικά του κεντρικού του agent, είτε πρόκειται για ένα απλό ψηφιακό avatar, είτε για εξαιρετικά πολύπλοκους, φανταστικούς χαρακτήρες. Το σύστημα επεξεργάζεται ακαριαία τα δεδομένα σε πραγματικό χρόνο και πλάθει έναν διαδραστικό κόσμο, του οποίου η γεωμετρία και τα φυσικά όρια υπαγορεύονται αυστηρά από τις πανοραμικές λήψεις του Street View.

Όλη αυτή η τεράστια υπολογιστική προσπάθεια τροφοδοτείται από το σύστημα Maps Imagery Grounding, μια τεχνολογία αιχμής που χρησιμοποιούν οι προγραμματιστές για να κλειδώνουν τα οπτικά στοιχεία πάνω στον πραγματικό, φυσικό καμβά του δορυφορικού δικτύου. Οι πρακτικές εφαρμογές αυτής της τεχνολογίας πραγματικά εντυπωσιάζουν τον παρατηρητή. Αν κάποιος επιθυμεί να οπτικοποιήσει τη διάσημη γέφυρα Golden Gate βυθισμένη στον ωκεανό, το λογισμικό προσαρμόζει αυτόματα τον φωτισμό, τη ρευστοδυναμική του νερού και τα περιβαλλοντικά στοιχεία για να παραδώσει ένα άρτιο, κινηματογραφικό αποτέλεσμα.

Εναλλακτικά, η αναπαράσταση ιστορικών τοποθεσιών στο Τέξας με την αισθητική των αρχών του προηγούμενου αιώνα, ολοκληρώνεται μέσα σε ελάχιστα δευτερόλεπτα, αντικαθιστώντας τα σύγχρονα, γυάλινα κτίρια με ιστορικά ακριβή μοντέλα εποχής.

Συνδρομητικά μοντέλα και η ευρύτερη πρόσβαση στο οικοσύστημα

Η πολυπόθητη πρόσβαση σε αυτή την προηγμένη τεχνολογία spatial computing ανοίγει πλέον για ένα σαφώς πιο ευρύ, αλλά αυστηρά επιλεγμένο κοινό επαγγελματιών και ενθουσιωδών χρηστών. Από σήμερα, το αναβαθμισμένο λογισμικό διατίθεται σταδιακά σε όλους τους ενεργούς συνδρομητές του premium πακέτου Google AI Ultra, το οποίο τιμολογείται στα 200 δολάρια, αποκλειστικά για χρήστες που πληρούν το ηλικιακό όριο της ενηλικίωσης σε παγκόσμιο επίπεδο.

Αυτή η προσεκτική στρατηγική τοποθέτηση στην αγορά επιτρέπει σε μεγάλες εταιρείες, ανεξάρτητα ερευνητικά κέντρα και επαγγελματίες developers να ξεκινήσουν άμεσα τις δικές τους τεχνικές δοκιμές, ενσωματώνοντας τις προηγμένες δυνατότητες προσομοίωσης στα δικά τους, εσωτερικά επιχειρηματικά σχέδια.

Παρά την εξαιρετικά εντυπωσιακή του απόδοση, το σύστημα παραμένει επίσημα ένα πειραματικό, ερευνητικό πρωτότυπο που λειτουργεί υπό την άμεση και συνεχή εποπτεία των εργαστηρίων ανάπτυξης της Google. Οι εξειδικευμένες ομάδες των μηχανικών machine learning συνεχίζουν να εκπαιδεύουν τα νευρωνικά δίκτυα στο παρασκήνιο, αναλύοντας τα μοτίβα χρήσης με πρωταρχικό σκοπό να εξαλείψουν τις αλγοριθμικές ατέλειες και να καταστήσουν την παραγωγή των τρισδιάστατων στοιχείων ακόμα πιο φωτορεαλιστική και ακριβή.

Η οργανική συγχώνευση της παραγωγικής νοημοσύνης με τα τεράστια, δομημένα σετ δεδομένων του συστήματος πλοήγησης αποτελεί χωρίς αμφιβολία τον προπομπό για τα ψηφιακά δίδυμα -digital twins- του άμεσου μέλλοντος. Σε αυτό το νέο τεχνολογικό οικοσύστημα που διαμορφώνεται ραγδαία μπροστά στα μάτια μας, ο αυστηρός διαχωρισμός μεταξύ του απτού, φυσικού κόσμου και της συνθετικής δημιουργίας παύει σταδιακά να υφίσταται, παραδίδοντας στην παγκόσμια ψηφιακή κοινότητα ένα επαναστατικό και πολυδιάστατο εργαλείο για την αρχιτεκτονική προσομοίωση, την ανάπτυξη βιντεοπαιχνιδιών επόμενης γενιάς και τη βαθιά, εμπειρική εκμάθηση των αυτόνομων μηχανών.

📍 ⏳ Το Χρονικό της Είδησης: GOOGLE