Руководитель направления автономного вождения Li Auto Ланг Сяньпэн выпустил подробный ответ на заявление главы Unitree Robotics Ван Синсина. Напомним: в августе он назвал модель VLA «слишком простой» и выразил сомнения в её эффективности. После этого тема активно обсуждалась в отрасли.
Как работает VLA и что уже улучшилось
Li Auto запустила VLA в сентябре. Модель стала частью ассистента водителя и сразу дала заметный эффект. Она точнее выбирает маршрут, лучше регулирует скорость, мягче ускоряется и тормозит. Кроме того, система увереннее проходит перекрёстки со слепыми зонами и понятнее взаимодействует с водителем. А голосовое управление позволяет строить сложные маршруты одной фразой.
Обновление до версии 8.1 усилило эффект. За два месяца реальных поездок инженеры сделали вывод: VLA подходит для автономного вождения лучше других моделей. Более того, она полностью раскрывается только в составе единой системы воплощённого интеллекта.
Подписывайся на канал Розетка рулит (https://t.me/rozetkarulit) — самые свежие новости из мира электрических и гибридных автомобилей
Почему спор об архитектуре не решает проблему
Ланг отметил главное отличие своей позиции от позиции Unitree Robotics. По его словам, критика архитектуры не имеет смысла без реальных данных. Ключевой фактор — не сама модель, а её совместимость со всей системой. Здесь данные становятся решающими.
VLA — генеративная модель. Она работает как GPT, но создаёт не текст, а траектории и управляющие сигналы. Пользователи уже видят человекоподобное поведение: более естественные реакции и предсказуемые решения в сложных условиях.
Ограничения мировых моделей и роль симуляции
По словам Ланга, мировые модели лучше использовать как инструмент для проверки. Они требуют огромной вычислительной мощности и подходят для симуляций, генерации данных и обучения с подкреплением. Li Auto применяет такие симуляции в облаке, опираясь на вычислительные мощности, недоступные автомобильным чипам.
Именно поэтому разговоры о правильной архитектуре бесполезны. Без объёмных данных и без постоянного цикла их обновления модель остаётся теорией. У Li Auto этот цикл уже сформирован. Миллионы автомобилей ежедневно передают данные, и это создаёт уникальный массив реальных ситуаций.
Как реальные данные формируют поведение модели
Инженеры Li Auto выявили интересные паттерны. Например, около 40% водителей держатся одной стороны полосы и редко следят за скоростными ограничениями. Такие данные не удаляли, так как они отражают реальный стиль вождения. Поэтому если AD Max в некоторых ситуациях ведёт себя «по-человечески», это результат обучения на подобных паттернах.
Воплощённый интеллект как фундамент автономного вождения
Ланг подчеркнул: система автономного вождения — это не отдельный алгоритм. Она объединяет восприятие, модель, операционную систему, чип и физическую платформу. Все элементы должны работать вместе.
Он привёл пример: модуль VMM в шасси сам выбирает тип торможения — гидравлику или суппорты. Это помогает сохранить плавность и безопасность. Такой уровень интеграции возможен только при полной разработке всех компонентов внутри компании.
Будущее VLA и рост вычислительной мощности
По словам Ланга, в ближайшие годы появятся два типа воплощённых роботов: автомобильные и человекоподобные. VLA станет основой для автомобильных роботов Li Auto.
Сейчас вычислительная мощность компании — 13 EFLOPS: 3 EFLOPS идут на вывод, 10 EFLOPS — на обучение. Если в следующем году удастся достичь 1000 MPI (одно вмешательство каждые 1000 километров), VLA сможет выйти на уровень рассуждений, сравнимый с ChatGPT.












