Alibaba Cloud объявила о значительных инвестициях в новый тип искусственного интеллекта, который будет лучше воспроизводить реальный мир, используя подход, отличный от чат-ботов, таких как ChatGPT от OpenAI. Компания вложила 2 миллиарда юаней (290 миллионов долларов) в стартап ShengShu, который разрабатывает инструмент генерации видео Vidu.
Это решение стало ответом на ограничения крупных языковых моделей, которые в основном обучаются на текстах. ShengShu планирует создать 'общую модель мира', которая объединит цифровые и физические сферы, такие как автономное вождение и робототехника. Основатель ShengShu, Чжу Цзюнь, отметил, что такая модель, основанная на мультимодальных данных, лучше отражает, как работает физический мир.
Модель Vidu Q3 Pro, выпущенная в январе, уже входит в десятку лучших AI-моделей для генерации видео. Alibaba также активно инвестирует в другие стартапы, такие как Tripo AI и PixVerse, которые разрабатывают аналогичные технологии.
Эти инвестиции подчеркивают важность 'мировых моделей' для робототехники, поскольку они необходимы для более точного моделирования и предсказания поведения в реальном мире. Как отметил Кевин Келли, соучредитель Wired, для воспроизведения человеческого интеллекта AI необходимо развивать три ключевых аспекта: рассуждение, понимание физического мира и непрерывное обучение