Το Gemini Omni αλλάζει τα πάντα στα βίντεο — δες τι μπορεί να κάνει

Η Google παρουσίασε το Gemini Omni — ένα νέο AI μοντέλο που συνδυάζει για πρώτη φορά τις ικανότητες συλλογισμού του Gemini με δημιουργία βίντεο. Το πρώτο μέλος της οικογένειας, το Gemini Omni Flash, είναι ήδη διαθέσιμο μέσω της εφαρμογής Gemini, του Google Flow και του YouTube Shorts.

Τι κάνει το Gemini Omni που δεν έκανε τίποτα άλλο πριν
Το Gemini Omni δέχεται ως είσοδο οποιδήποτε συνδυασμό εικόνας, ήχου, βίντεο και κειμένου, και παράγει βίντεο υψηλής ποιότητας που λαμβάνουν υπόψη νόμους φυσικής, ιστορικό πλαίσιο και αφηγηματική συνέχεια. Στην πράξη, αυτό σημαίνει ότι μπορεί κανείς να ανεβάσει ένα βίντεο που έχει τραβήξει ο ίδιος και να του δώσει εντολές με φυσική γλώσσα — «άλλαξε το φωτισμό», «πρόσθεσε έναν χαρακτήρα», «κάνε τα φύλλα bioluminescent» — και το μοντέλο εφαρμόζει κάθε αλλαγή διατηρώντας τη συνέχεια της σκηνής.

Το Gemini Omni επεξεργάζεται βίντεο μέσω συνομιλίας, όπου κάθε νέα οδηγία χτίζεται πάνω στην προηγούμενη. Αυτό διαφέρει από τα υπάρχοντα εργαλεία AI video, που συνήθως επανεκκινούν τη δημιουργία από μηδέν με κάθε αίτημα.

Φυσική, χαρακτήρες και πολυτροπική κατανόηση
Ένα από τα βασικά χαρακτηριστικά του Omni είναι η βελτιωμένη κατανόηση φυσικών νόμων — βαρύτητα, κινητική ενέργεια, ρευστοδυναμική — που επιτρέπει πιο ρεαλιστικές σκηνές. Παράλληλα, οι χαρακτήρες παραμένουν οπτικά συνεπείς ακόμα και αν αλλάξει το περιβάλλον ή το στιλ βίντεο.

Το μοντέλο μπορεί επίσης να χρησιμοποιεί ταυτόχρονα εικόνα χαρακτήρα, βίντεο αναφοράς κίνησης και ηχητικό αρχείο για να παράγει ένα ενιαίο αποτέλεσμα. Η υποστήριξη για περισσότερους τύπους ήχου ως είσοδο προγραμματίζεται σε επόμενο στάδιο.

Avatar, SynthID και ζητήματα διαφάνειας
Το Gemini Omni περιλαμβάνει λειτουργία Avatar που επιτρέπει στον χρήστη να δημιουργεί βίντεο με τη δική του φωνή και εικόνα. Η Google τονίζει ότι η επεξεργασία φωνής τρίτων ατόμων βρίσκεται ακόμα σε φάση αξιολόγησης. Όλα τα βίντεο που παράγονται από το Omni φέρουν αόρατο ψηφιακό υδατογράφημα SynthID, που μπορεί να επαληθευτεί μέσω της εφαρμογής Gemini, του Gemini στο Chrome και της Google Αναζήτησης.

Διαθεσιμότητα
Το Gemini Omni Flash είναι ήδη διαθέσιμο για συνδρομητές Google AI Plus, Pro και Ultra παγκοσμίως. Στο YouTube Shorts και το YouTube Create App θα είναι διαθέσιμο δωρεάν από αυτή την εβδομάδα. Πρόσβαση μέσω API για developers και εταιρικούς πελάτες αναμένεται τις επόμενες εβδομάδες.

Το Gemini Omni είναι η πρώτη φορά που ένα μεγάλο AI μοντέλο δεν απλώς «δημιουργεί» βίντεο, αλλά το «συνεχίζει» νοητά βάσει αυτού που ήδη συμβαίνει στη σκηνή. Αν αυτό λειτουργεί όπως υπόσχεται, η επεξεργασία βίντεο πάει να αλλάξει ριζικά — ακόμα και για τον κοινό χρήστη που θέλει απλώς να κάνει ένα βίντεο από κινητό λίγο πιο ενδιαφέρον. Το πόσο καλά αντέχει στην καθημερινή χρήση θα φανεί σύντομα, μιάς και η πρόσβαση ανοίγει για όλους μέσω YouTube Shorts.

ΠΗΓΗ

 

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Google και Samsung ανακοίνωσαν Smart Glasses με τεχνητή νοημοσύνη

Είναι γνωστό εδώ και καιρό πως η Samsung σχεδιάζει νέα Smart Glasses με τεχνητή νοημοσύνη, σε συνεργασία με την Google. Το κατασκευαστικό και σχεδιαστικό...

Το Apple Watch Ultra 4 έρχεται με νέο σχεδιασμό και ανανεωμένους αισθητήρες

Σύμφωνα με μια νέα φήμη που κυκλοφορεί τις τελευταίες ώρες, η Apple ετοιμάζεται επιτέλους για μία μεγάλη αλλαγή με την άφιξη του Apple Watch Ultra 4. Το τέταρτης γενιάς έξυπνο ρολόι,...

Το 30-30-30 reset του router: τι είναι και πότε να το κάνεις

Υπάρχουν δύο εντελώς διαφορετικές κινήσεις όταν ο router σου παραπαίει: η απλή επανεκκίνηση που διατηρεί τις ρυθμίσεις σου, και το 30-30-30 reset που σβήνει...

Η Κίνα δοκιμάζει εμφυτεύσιμο τσιπ BCI 128 καναλιών σε ανθρώπους

Η Κίνα ξεκίνησε τις πρώτες κλινικές δοκιμές ενός πλήρως εμφυτεύσιμου συστήματος brain-computer interface (BCI) με 128 κανάλια — μια πρωτιά για την κινεζική έρευνα...

Windows 11: Το νέο update του Μαΐου 2026 αποτυγχάνει να εγκατασταθεί και προκαλεί προβλήματα

Η Microsoft επιβεβαίωσε επίσημα ότι η πρόσφατη ενημέρωση ασφαλείας του Μαΐου 2026 για τα Windows 11 (KB5089549) παρουσιάζει σφάλματα εγκατάστασης σε ορισμένα συστήματα. Κάποιοι χρήστες έρχονται...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Το Πιο FULL & “ΨΑΓΜΕΝΟ” Επώνυμο με ΚΑΘΙΣΜΑ και 2πλο Κουπί SUP (Stand Up Paddle). Είναι “Μεγάλο” με 3,5m μήκος & 180+ Κιλά Load…...

Ένα πραγματικό όνειρο για πολλούς και πολλές από εμάς... Ένα FULL & "ΨΑΓΜΕΝΟ" Επώνυμο με ΚΑΘΙΣΜΑ και 2πλο Κουπί SUP που παρακαλούσαμε να βρούμε...

2 Φθηνά, επώνυμα και χρήσιμα “Για ‘Μένα”! Super Mini Κομπρεσεράκι Popdeer και Premium Jet Fan Foursun (Video)

Είναι χρήσιμα, πολύ ποιοτικά, ιδιαίτερα το καθένα με τον "δικό του" τρόπο κι έχουν έρθει για προσωπική χρήση. Είναι και τα 2 από Ευρώπη και...

Από Ελλάδα Ηλιακό Πάνελ 80Watt σε ΤΙΜΗ “Κίνας”! Ο Απόλυτος Φίλος του καλοκαιριού… Στα 89€ Κομπλέ Cheotech SC007 (Video)

Η τιμή για την ποιότητα του είναι Κίνας κι όχι Ελλάδας Ήρθε την πιο κατάλληλη στιγμή αν και στην χώρα μας θεωρώ πως ότι ηλιακό...

Πιο RETRO και πολυχρηστικό “ΠΑΘΑΙΝΕΙΣ”… Το Φοβερό 8Bitdo Retro18 Numpad… Στα 41€ ΚΟΜΠΛΕ (Βίντεο)

ΠΡΟΣΟΧΗ... Χαμηλότερη τιμή Ελλάδας στα 57€ και ψάξτο! Αυτό που το διαφοροποιεί σε σχέση με τον ανταγωνισμό του είναι ότι μπορεί να δουλέψει ΜΟΝΟ του...

Όμορφο “Άρμα Μάχης”… με Offline Maps “προίκα” και πολλές “περγαμηνές” στα 47€ ΚΟΜΠΛΕ… κι ΕΝΑ ΔΩΡΟ δικό σου Tank T6 (Βίντεο & Giveaway)

Έχουμε δει πάρα πολλά Smartwatch και θα δούμε ακόμη περισσότερα. Το καθένα έχει τα δικά του μικρά κομμάτια που θα μας κάνουν να το...