- Ограниченное «пространство действий» для агентов (автономных ИИ-систем внутри мира).
- Сложности с моделированием взаимодействий нескольких агентов одновременно.
- Проблемы с точной симуляцией реальных локаций, корректным отображением текста и поддержанием длительных сессий дольше нескольких минут.
Несмотря на вышеперечисленное, это огромный шаг вперёд по сравнению с сегодняшними неинтерактивными видео, многие из которых уже трудно отличить от реальности. Системы вроде Genie 3 превращают такие сцены в
интерактивный опыт. Даже мемы вроде «Уилл Смит ест спагетти» скоро станут не просто реалистичными, но и управляемыми.