Ανθρωποειδές ρομπότ έμαθε εκφράσεις προσώπου βλέποντας YouTube

Το Columbia University παρουσίασε ανθρωποειδές ρομπότ που έμαθε lip sync και εκφράσεις προσώπου βλέποντας YouTube, ανοίγοντας νέο δρόμο στην ανθρώπινη αλληλεπίδραση.

Ερευνητές του Columbia University παρουσίασαν μια νέα προσέγγιση που φέρνει τα ανθρωποειδή ρομπότ πιο κοντά σε μια φυσική ανθρώπινη συνομιλία. Η μελέτη, που δημοσιεύτηκε τον Ιανουάριο του 2026, δείχνει πώς ένα ρομπότ μπορεί να μάθει να συγχρονίζει τα χείλη του και να αποδίδει πιο πειστικές εκφράσεις προσώπου παρατηρώντας τον εαυτό του και βίντεο στο YouTube. Το αποτέλεσμα δεν περιορίζεται μόνο στην κίνηση του στόματος. Η ομάδα υποστηρίζει ότι το ρομπότ κατάφερε να μιμηθεί καλύτερα τον τρόπο με τον οποίο μιλούν οι άνθρωποι, προσεγγίζοντας μια πιο φυσική και λιγότερο «μηχανική» παρουσία.

Ένα πρόσωπο ρομπότ με 26 μηχανισμούς κίνησης
Στην καρδιά του πειράματος βρίσκεται ένα ανθρωποειδές ρομπότ με πλήρες πρόσωπο και 26 επιμέρους μηχανισμούς για τις κινήσεις του προσώπου. Αυτοί οι μηχανισμοί επιτρέπουν στο σύστημα να μετακινεί τα χείλη, τα μάτια και άλλα σημεία του προσώπου με μεγαλύτερη ακρίβεια, ώστε να αποδίδει πιο πειστικά την ομιλία.

Η ερευνητική ομάδα δεν περιορίστηκε σε έτοιμα σετ κινήσεων. Αντίθετα, έδωσε στο ρομπότ τη δυνατότητα να μάθει μέσα από παρατήρηση, πρώτα κοιτάζοντας τον εαυτό του σε καθρέφτη και στη συνέχεια παρακολουθώντας ανθρώπους να μιλούν σε βίντεο. Με αυτό τον τρόπο, το σύστημα άρχισε να αντιστοιχίζει ήχους και εκφράσεις με συγκεκριμένες κινήσεις των χειλιών και του προσώπου.

Humanoid robot's face with lips

Ο ρόλος του Vision-to-Action μοντέλου
Για να γίνει αυτό, οι ερευνητές χρησιμοποίησαν ένα μοντέλο Vision-to-Action, ή αλλιώς VLA. Το συγκεκριμένο μοντέλο επιτρέπει στο ρομπότ να μετατρέπει αυτό που «βλέπει» σε αντίστοιχη κίνηση, συνδέοντας οπτικά ερεθίσματα με μηχανικές εντολές.

Η προσέγγιση αυτή βοήθησε το ρομπότ να μιμηθεί τον τρόπο που οι άνθρωποι μιλούν, όχι μόνο σε έναν τύπο φωνής ή γλώσσας, αλλά σε διαφορετικά γλωσσικά και προφορικά μοτίβα. Στο υλικό που παρουσίασε το πανεπιστήμιο, το ρομπότ φαίνεται να αναπαράγει ομιλία σε διαφορετικές γλώσσες και προφορές, με ιδιαίτερα ακριβή συγχρονισμό χειλιών.

Παρόλα αυτά, η ομάδα παραδέχεται ότι υπάρχουν ακόμη τεχνικές δυσκολίες. Ήχοι όπως το “B”, αλλά και εκείνοι που απαιτούν πιο έντονο σούφρωμα των χειλιών, όπως το “W”, παραμένουν πιο απαιτητικοί για το σύστημα.

Γιατί το lip sync είναι κρίσιμο για τα ανθρωποειδή ρομπότ
Ο Hod Lipson, καθηγητής και διευθυντής του Creative Machines Lab του Columbia, εκτιμά ότι μεγάλο μέρος της προσοχής μας σε μια συνομιλία πέφτει στις κινήσεις των χειλιών. Αυτός είναι και ο λόγος που πολλά ανθρωποειδή ρομπότ, ακόμη και όταν κινούνται καλά ή εκτελούν σύνθετες εργασίες, εξακολουθούν να μοιάζουν «ξένα» όταν έρχεται η ώρα της άμεσης επικοινωνίας με άνθρωπο.

Η νέα αυτή κατεύθυνση επιχειρεί να αντιμετωπίσει ακριβώς αυτό το κενό. Η ομάδα υποστηρίζει ότι ο καλύτερος συγχρονισμός χειλιών και οι πιο φυσικές εκφράσεις μπορούν να περιορίσουν το γνωστό φαινόμενο του uncanny valley, όπου ένα ρομπότ μοιάζει σχεδόν ανθρώπινο αλλά όχι αρκετά ώστε να μην προκαλεί αμηχανία.

Advanced Human-Like Robot Working in Industrial Environment.

Η σύνδεση με conversational AI
Ο επικεφαλής της μελέτης, Yuhang Hu, σημειώνει ότι η τεχνολογία αποκτά ακόμη μεγαλύτερη σημασία όταν συνδυάζεται με conversational AI όπως το ChatGPT ή το Gemini. Σε αυτή την περίπτωση, το ρομπότ δεν αρκείται στο να δίνει απαντήσεις, αλλά μπορεί να τις συνοδεύει με πιο φυσική άρθρωση και εκφράσεις που ενισχύουν την αίσθηση επικοινωνίας.

Η λογική είναι απλή: όσο περισσότερους ανθρώπους παρακολουθεί το ρομπότ να συνομιλούν, τόσο καλύτερα μπορεί να μιμείται τις μικρές κινήσεις και τις εκφράσεις που οι άνθρωποι συνδέουν με συναίσθημα, πρόθεση και προσοχή. Αυτό μετατρέπει την αλληλεπίδραση από μια ψυχρή ανταλλαγή λόγου σε κάτι πιο κοντινό σε πραγματική συνομιλία.

Πού μπορεί να χρησιμοποιηθεί αυτή η τεχνολογία
Η εξέλιξη αυτή δεν αφορά μόνο εντυπωσιακές επιδείξεις τεχνολογίας. Η πιο φυσική κίνηση προσώπου θεωρείται σημαντική για εφαρμογές όπου η ανθρώπινη επαφή παίζει ουσιαστικό ρόλο, όπως η εκπαίδευση, η ψυχαγωγία, η ιατρική και η φροντίδα ηλικιωμένων.

Καθώς όλο και περισσότερες εταιρείες επενδύουν στα ανθρωποειδή ρομπότ, η έμφαση δεν θα βρίσκεται μόνο στο περπάτημα, στη μεταφορά αντικειμένων ή στην εκτέλεση καθηκόντων. Το πρόσωπο, το βλέμμα και ο συγχρονισμός του λόγου φαίνεται ότι θα αποτελέσουν το επόμενο μεγάλο πεδίο εξέλιξης για όποιον θέλει να φέρει τα ρομπότ πιο κοντά σε καθημερινό περιβάλλον χρήσης.

Η νέα μελέτη δείχνει ότι η επόμενη σημαντική πρόοδος στα ανθρωποειδή ρομπότ ίσως δεν αφορά την κίνηση του σώματος, αλλά την ποιότητα της ανθρώπινης αλληλεπίδρασης. Όσο πιο φυσικά μιλούν και εκφράζονται αυτά τα συστήματα, τόσο πιο πιθανό είναι να βρουν θέση σε χώρους όπου η εμπιστοσύνη και η άνεση του χρήστη είναι βασικά στοιχεία.

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Πληκτρολόγια Razer! Το Παλιό μου είναι Best Seller… και τo Νέο Θα μου φτιάξει το Setup μου…. Razer Joro και Ornata V3 X (Βίντεο)

Αν δεν το έχεις ήδη καταλάβει το 90% των πραγμάτων που βλέπεις στο κανάλι είναι προσωπικές επιλογές και σχεδόν ποτέ... κάτι δεν αξίζει και...

Ανέπαφες πληρωμές φέρνει η Huawei στα Smartwatches της

Η Huawei ανακοινώνει την επέκταση του Curve Pay σε όλη την Ευρώπη, καλύπτοντας πλέον περισσότερες από 30 αγορές, συμπεριλαμβανομένων όλων των κρατών-μελών της ΕΕ,...

Το FBI προειδοποιεί: αυτές οι εφαρμογές σε παρακολουθούν χωρίς να το ξέρεις

Το FBI εξέδωσε επίσημη ανακοίνωση δημόσιας ενημέρωσης (PSA) στις 31 Μαρτίου 2026, καλώντας τους χρήστες smartphone να εξετάσουν σοβαρά τους κινδύνους από εφαρμογές ξένης...

Windows 11: Μεγάλη αλλαγή στις Ρυθμίσεις έρχεται τον Απρίλιο

Η Microsoft ετοιμάζει αλλαγές στο περιβάλλον των Windows 11 που θα κυκλοφορήσουν με την ενημέρωση του Απριλίου 2026, εστιάζοντας στη βελτίωση της εμπειρίας χρήστη...

Πώς επιλέγεται πίνακας πυρανίχνευσης για επαγγελματικούς και απαιτητικούς χώρους

Όταν μιλάμε για πυροπροστασία, η σωστή επιλογή εξοπλισμού δεν είναι απλώς θέμα προδιαγραφών σε ένα τεχνικό φυλλάδιο. Είναι θέμα κατανόησης του ίδιου του χώρου....

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Πληκτρολόγια Razer! Το Παλιό μου είναι Best Seller… και τo Νέο Θα μου φτιάξει το Setup μου…. Razer Joro και Ornata V3 X (Βίντεο)

Αν δεν το έχεις ήδη καταλάβει το 90% των πραγμάτων που βλέπεις στο κανάλι είναι προσωπικές επιλογές και σχεδόν ποτέ... κάτι δεν αξίζει και...

H “Dyson του Φτωχού”!!! Click Bait ή ΑΛΗΘΕΙΑ;;; Ίσως η πιο Δυνατή ασύρματη σκούπα που μπορείς να πάρεις με 88€ ΚΟΜΠΛΕ! (Βίντεο)

Με 55KPA δύναμης αναρρόφησης έχει την δύναμη να σηκώσει βάρος 1,6 κιλών και λίγες (ειδικά σε αυτήν την κατηγορία τιμής) μπορούν να το κάνουν! Με...

Φορητό Ψυγείο τέρας… 55Lt που πιάνει -30° C για… “ΠΛΑΚΑ” Δικό σου ΧΘΕΣ… Στα 171€ ΚΟΜΠΛΕ!!! Foursun 55lt Refrigerator με BT και…. (βίντεο)

Ενημέρωση 04/04/2026 και ώρα 22:45 τα πρώτα κουπόνια (έκπτωσης 20€) τα εξαφανίσατε. Βάλτε κουπόνι CDOF05 στα 13€ έκπτωση!!! Και 35Lt στα 149€ και 45Lt στα...

Σαν τον Ξυλόφουρνο “ΔΕΝ ΕΧΕΙ”… Μίνι Ξυλόφουρνος για ΟΛΟΥΣ και για ΟΛΑ στα 167€ ΚΟΜΠΛΕ (Βίντεο)

Εδώ η γεύση η πρακτικότητα και το μεράκι επισκιάζει τα πάντα... αν έχεις φάει ξέρεις για τι ακριβώς μιλάω... αν όχι πίστεψε, δεν θα...

Ο “Διαστημικός” Astrolux K3, είναι Ιδιαίτερος και κάνει τα ΠΑΝΤΑ… Στα 44€ ΚΟΜΠΛΕ (βίντεο)

Ίσως είναι ο πιο ιδιαίτερος φακός που έχω φέρει στο κανάλι... Ο διαστημικός του σχεδιασμός και η ιδιαιτερότητα του δεν του στερούν τίποτα από λειτουργίες...