Η Google επενδύει στην Hume AI για να δώσει πιο ανθρώπινη φωνή στο Gemini

Στον πυρετώδη ανταγωνισμό της Τεχνητής Νοημοσύνης, το 2026 αποδεικνύεται η χρονιά που οι τεχνολογικοί κολοσσοί σταματούν να εστιάζουν μόνο στην επεξεργασία κειμένου και στρέφονται προς κάτι πιο ανθρώπινο: Τη φωνή και το συναίσθημα. Σύμφωνα με τις τελευταίες πληροφορίες, η Google προχώρησε σε μια αποφασιστική κίνηση ματ, απορροφώντας τη βασική ομάδα πίσω από τη Hume AI, μια startup που είχε καταφέρει να ξεχωρίσει για την ικανότητά της να δίνει “ενσυναίσθηση” στους αλγορίθμους.

Η κίνηση αυτή δεν είναι μια απλή εξαγορά. Είναι μια σαφής δήλωση ότι η Google θέλει το Gemini να μην είναι απλώς ένας έξυπνος βοηθός που διαβάζει το διαδίκτυο, αλλά ένας σύντροφος που μπορεί να καταλάβει αν είστε χαρούμενοι, αγχωμένοι ή ειρωνικοί, και να απαντήσει αναλόγως.

Η στρατηγική του “acqui-hire” και η αποφυγή των ρυθμιστικών αρχών

Το ρεπορτάζ αναφέρει ότι η συμφωνία ακολουθεί το μοντέλο που έχει γίνει δημοφιλές στη Silicon Valley τα τελευταία χρόνια, γνωστό ως “acqui-hire” (από τις λέξεις acquisition και hire). Αντί η Google να εξαγοράσει την εταιρεία Hume AI ως οντότητα –κάτι που θα προκαλούσε πιθανότατα τον εξονυχιστικό έλεγχο των αντιμονοπωλιακών αρχών (FTC, Ευρωπαϊκή Επιτροπή)– επέλεξε να προσλάβει τα κορυφαία ταλέντα της, συμπεριλαμβανομένων των ερευνητών και των μηχανικών που έχτισαν το μοντέλο.

Με αυτόν τον τρόπο, η Google αποκτά την τεχνογνωσία και το ανθρώπινο κεφάλαιο άμεσα, εντάσσοντας τους ειδικούς της Hume στο τμήμα Google DeepMind, ενώ πιθανότατα έχει συνάψει και κάποια συμφωνία αδειοδότησης (licensing) για την τεχνολογία τους. Είναι η ίδια τακτική που είδαμε να εφαρμόζει η Microsoft με την Inflection AI και η Amazon με την Adept, δείχνοντας ότι η μάχη για τα ταλέντα είναι πιο σκληρή από τη μάχη για τα μερίδια αγοράς.

Τι κάνει την Hume AI μοναδική;

Γιατί όμως η Google ενδιαφέρθηκε τόσο έντονα για τη συγκεκριμένη startup; Η Hume AI, υπό την ηγεσία του πρώην ερευνητή της Google Alan Cowen, είχε αναπτύξει το EVI (Empathic Voice Interface). Πρόκειται για ένα μοντέλο που δεν κάνει απλώς μετατροπή ομιλίας σε κείμενο (speech-to-text).

Το σύστημα της Hume αναλύει την προσωδία (prosody) της φωνής. Μετράει τον τόνο, τον ρυθμό, τις παύσεις, ακόμη και τα μικρά επιφωνήματα όπως ένας στεναγμός ή ένα γέλιο. Βάσει αυτών, μπορεί να ανιχνεύσει δεκάδες διαφορετικές συναισθηματικές καταστάσεις με τρομακτική ακρίβεια.

Αν ρωτήσετε τον καιρό με χαρούμενη φωνή, το AI απαντάει ενθουσιωδώς.

Αν ρωτήσετε το ίδιο πράγμα με θλιμμένη φωνή, η απάντηση θα είναι πιο ήπια και παρηγορητική. Αυτή η ικανότητα προσαρμογής του ύφους (tone matching) ήταν το “ιερό δισκοπότηρο” που έλειπε από τους ψηφιακούς βοηθούς της Google.

Η απάντηση στο Advanced Voice Mode της OpenAI

Είναι προφανές ότι η κίνηση αυτή είναι η άμεση απάντηση της Google στο Advanced Voice Mode του ChatGPT της OpenAI. Η OpenAI είχε εντυπωσιάσει το κοινό με τη φυσικότητα της φωνητικής αλληλεπίδρασης, κάνοντας το AI να ακούγεται σχεδόν ανθρώπινο (με τις γνωστές συγκρίσεις με την ταινία “Her”).

Το Gemini Live, η τρέχουσα φωνητική υπηρεσία της Google, αν και εξαιρετικά γρήγορη και έξυπνη, υστερούσε σε αυτό το κομμάτι της “προσωπικότητας”. Οι φωνές ήταν καθαρές αλλά μερικές φορές “επίπεδες”. Με την ενσωμάτωση της ομάδας της Hume, η Google στοχεύει να ξεπεράσει τον ανταγωνισμό, προσφέροντας όχι απλώς φυσικότητα, αλλά πραγματική συναισθηματική κατανόηση. Στόχος είναι το Gemini να μπορεί να διαχειριστεί μια δύσκολη συζήτηση, να κάνει χιούμορ την κατάλληλη στιγμή και να σταματήσει να μιλάει αν καταλάβει ότι σας διέκοψε, ακριβώς όπως ένας άνθρωπος.

Εφαρμογές στο οικοσύστημα της Google

Η τεχνολογία αυτή αναμένεται να βρει εφαρμογή σε όλο το φάσμα των προϊόντων της εταιρείας, αλλά κυρίως στο Android και τις smart home συσκευές.

Pixel & Android: Φανταστείτε το τηλέφωνό σας να καταλαβαίνει ότι είστε αγχωμένος από τον τρόπο που μιλάτε και να προσαρμόζει τις ειδοποιήσεις ή να προτείνει χαλαρωτική μουσική.

Customer Service: Η Google πουλάει υπηρεσίες AI σε επιχειρήσεις. Ένα AI που μπορεί να καταλάβει πότε ένας πελάτης είναι εκνευρισμένος στο τηλέφωνο και να αντιδράσει με ηρεμία και κατανόηση, είναι ένα προϊόν αξίας δισεκατομμυρίων.

Υγεία και Ευεξία: Η ανάλυση φωνής μπορεί να χρησιμοποιηθεί (με τη συγκατάθεση του χρήστη) για την ανίχνευση πρώιμων σημαδιών κατάθλιψης ή άλλων νευρολογικών παθήσεων, ένας τομέας όπου η Hume είχε ήδη κάνει έρευνα.

Οι ανησυχίες για την ιδιωτικότητα

Φυσικά, η απόκτηση μιας τεχνολογίας που “διαβάζει” συναισθήματα εγείρει σοβαρά ερωτήματα. Θέλουμε πραγματικά η Google να γνωρίζει πότε είμαστε ευάλωτοι συναισθηματικά; Η εταιρεία θα κληθεί να διαχειριστεί αυτά τα δεδομένα με άκρα μυστικότητα και ασφάλεια.

Η ενσωμάτωση της ομάδας της Hume AI πιθανότατα θα συνοδευτεί από νέες ρυθμίσεις απορρήτου, όπου οι χρήστες θα πρέπει να δώσουν ρητή συγκατάθεση για την “συναισθηματική ανάλυση” της φωνής τους, παρόμοια με τις ρυθμίσεις που είδαμε πρόσφατα για το Personal Intelligence.

Το τέλος της “ρομποτικής” φωνής

Η απορρόφηση της ομάδας της Hume AI από την Google σηματοδοτεί το τέλος της εποχής των “ρομποτικών” απαντήσεων. Περνάμε σε μια φάση όπου η διεπαφή με τη μηχανή γίνεται αόρατη και η επικοινωνία απόλυτα φυσική. Αν το στοίχημα πετύχει, την επόμενη φορά που θα πείτε “Hey Google”, η συσκευή δεν θα περιμένει απλώς μια εντολή, αλλά θα αφουγκράζεται τη διάθεσή σας, έτοιμη να γίνει ο πιο ενσυναίσθητος ακροατής που είχατε ποτέ.

Η Google επενδύει στην Hume AI για να δώσει πιο ανθρώπινη φωνή στο Gemini

Η στρατηγική του “acqui-hire” και η αποφυγή των ρυθμιστικών αρχών

Τι κάνει την Hume AI μοναδική;

Η απάντηση στο Advanced Voice Mode της OpenAI

Εφαρμογές στο οικοσύστημα της Google

Οι ανησυχίες για την ιδιωτικότητα

Το τέλος της “ρομποτικής” φωνής

Βασιλική Ατέση

You May Also Like

Google Home: Το Gemini φέρνει επαναστατικές αναβαθμίσεις στο Έξυπνο Σπίτι

AgentKit: Η νέα πλατφόρμα δημιουργίας agents της OpenAI

Το Sora έρχεται στο ChatGPT με νέες δυνατότητες αλλά και ανησυχίες

Τα AI bots κυριαρχούν ήδη το παγκόσμιο internet

Skild AI: Το ρομπότ που “επιβιώνει” και επισκευάζεται μόνο του

Ο AI περιηγητής Comet της Perplexity κυκλοφόρησε για iOS