Штаб-квартира Physical Intelligence в Сан-Франциско меньше всего похожа на сверкающий офис IT-гиганта. Это огромный бетонный бокс, где столы с печеньем и австралийской пастой Vegemite соседствуют с верстаками, усыпанными запчастями. Главные здесь — роботы. Десятки роботизированных рук с разной степенью успеха пытаются освоить рутину: одна неуклюже складывает брюки, другая — выворачивает рубашку, третья методично чистит цукини. «Представьте, что это ChatGPT, но для роботов», — объясняет Сергей Левин, профессор Беркли и сооснователь компании, указывая на этот механизированный балет. Эта простая аналогия — ключ к пониманию миссии Physical Intelligence. Так что это, ‘ChatGPT для роботов‘? Это самый обсуждаемый проект Кремниевой долины, который, будучи основанным ветераном Stripe Лэки Грумом и ведущими учеными в области ИИ, ставит перед собой цель создать универсальный «мозг» для любого робота, способный обучаться и выполнять любую физическую задачу.
- ‘Любая платформа, любая задача’: Философия универсального интеллекта
- Инвестор-визионер Лэки Грум и миллиард долларов без плана монетизации
- Битва философий: Physical Intelligence против Skild AI
- Пузырь или прорыв? Риски и сомнения вокруг Physical Intelligence
- Ставка на интеллект в эпоху аппаратного хаоса
‘Любая платформа, любая задача’: Философия универсального интеллекта
В основе амбициозной цели Physical Intelligence (PI) лежит философия, которая ставит программный интеллект выше аппаратного совершенства. Идея, которую часто описывают как «ChatGPT для роботов», заключается не в создании идеального механизма для каждой отдельной задачи, а в разработке универсального «мозга», способного управлять любым механизмом. Техническим фундаментом этого подхода служат Универсальные базовые модели для роботов — это крупномасштабные модели искусственного интеллекта, обученные на огромном и разнообразном наборе данных для выполнения широкого спектра робототехнических задач. Подобно LLM, они служат основой, которую можно адаптировать для конкретных приложений, не начиная обучение с нуля. Как объясняет сооснователь компании Сергей Левин, процесс их создания представляет собой непрерывный цикл: роботы на тестовых станциях непрерывно собирают данные о физических взаимодействиях, которые затем используются для дообучения моделей, после чего обновленный интеллект возвращается на «землю» для дальнейших испытаний.
Такой смелый подход требует не только вычислительных мощностей, но и глубочайшей научной экспертизы. Команда основателей PI представляет собой настоящий концентрат академического веса в области робототехники и ИИ. Соучредители Physical Intelligence Сергей Левин является доцентом UC Berkeley, а Челси Финн руководит лабораторией в Stanford, специализирующейся на обучении роботов [4]. К ним присоединился Кароль Хаусман, ведущий исследователь из Google DeepMind. Их совместная работа переносит передовые университетские исследования в плоскость реального продукта, способного кардинально изменить индустрию.
Центральный тезис PI заключается в том, что «хороший интеллект компенсирует недостатки оборудования». Компания сознательно делает ставку на то, что высококачественный ИИ может эффективно управлять простыми и дешевыми манипуляторами, стоимость которых не превышает нескольких тысяч долларов, а в перспективе может опуститься и ниже $1000. Вместо того чтобы инвестировать в дорогостоящее и узкоспециализированное «железо», PI вкладывает ресурсы в создание универсального программного обеспечения, которое способно извлечь максимум из доступного оборудования. Этот подход не только снижает порог входа в автоматизацию, но и открывает дорогу к гораздо более гибким решениям.
Ключевой технологией, позволяющей реализовать эту философию, является Кросс-телесное обучение в робототехнике (Cross-embodiment learning). Это методология обучения, при которой модель ИИ может переносить знания и навыки, полученные на одной аппаратной платформе («теле»), на другую, совершенно новую платформу. Это позволяет быстро внедрять автономию на любое новое робототехническое оборудование без необходимости повторного сбора данных. По словам сооснователя Куана Вуонга, такой подход радикально снижает «предельные издержки на внедрение автономии на новую роботизированную платформу, какой бы она ни была». Именно эта способность к переносу знаний и лежит в основе девиза «любая платформа, любая задача», превращая его из маркетингового слогана в работающую технологическую стратегию.
Инвестор-визионер Лэки Грум и миллиард долларов без плана монетизации
За Лэки Грумом (Lachy Groom) давно закрепился ярлык «чудо-мальчика» Кремниевой долины, и не без оснований. Продав свою первую компанию в 13 лет, он стал одним из ранних сотрудников в Stripe, а после ухода из финтех-гиганта превратился в одного из самых успешных ангельских инвесторов своего поколения. Лэки Грум, ветеран Stripe, был ранним ангельским инвестором таких компаний, как Figma, Notion, Ramp и Lattice [2]. Его послужной список позволял ему спокойно продолжать выписывать чеки, но Грум искал нечто большее. Почти пять лет он находился в активном поиске той самой идеи и команды, в которую можно было бы вложить не только деньги, но и всего себя.
Поиски привели его к работам ведущих исследователей в области робототехники: профессора Беркли Сергея Левина и профессора Стэнфорда Челси Финн. Когда до него дошли слухи, что они вместе с исследователем из Google DeepMind Каролем Хаусманом готовят новый проект, Грум действовал решительно. Встреча с ними стала поворотным моментом. «Это было одно из тех совещаний, после которых ты выходишь и понимаешь: вот оно», — вспоминает он. Эта убежденность оказалась настолько заразительной, что позволила Physical Intelligence совершить почти невозможное на венчурном рынке.
Отвечая на вопрос, сколько привлек Physical Intelligence, стоит отметить почти невозможные для венчурного рынка цифры. Компания привлекла более $1 миллиарда и была оценена в $5,6 миллиарда инвесторами, включая Khosla Ventures, Sequoia Capital и Thrive Capital [1]. Эти цифры поражают воображение, но еще больше удивляет условие, на котором были получены эти средства. Грум открыто заявляет инвесторам, что у него нет и не будет в обозримом будущем четкого графика коммерциализации. «Я не даю инвесторам ответов по поводу монетизации, — говорит он. — Странно, что люди с этим мирятся». Но они мирятся, делая ставку не на бизнес-план, а на видение основателя и масштаб решаемой задачи.
Куда же уходит этот гигантский капитал, если не на продажи и маркетинг? Ответ кроется в одном слове: вычисления. Основная статья расходов Physical Intelligence — это Вычислительные ресурсы (Compute). В контексте ИИ это совокупность аппаратного и программного обеспечения, включая мощные графические процессоры (GPU) и облачные сервисы, необходимых для обучения и запуска сложных моделей. Для компаний, разрабатывающих базовые модели, это обычно самая крупная статья расходов. Грум утверждает, что «нет предела тому, сколько денег мы действительно можем вложить в работу», потому что всегда можно задействовать больше вычислительных мощностей для решения проблемы создания универсального искусственного интеллекта для роботов.
Битва философий: Physical Intelligence против Skild AI
На рынке, где Physical Intelligence (PI) делает ставку на долгосрочные исследования, разворачивается настоящая битва: Physical Intelligence против Skild AI. Главным оппонентом и антитезой PI выступает стартап Skild AI из Питтсбурга. Эта компания не просто дышит в спину лидерам гонки, но и задает совершенно иной темп развития. Основанная в 2023 году, Skild AI уже привлекла $1,4 миллиарда при оценке в $14 миллиардов [3] и, в отличие от PI, может похвастаться реальным доходом в $30 миллионов, полученным всего за несколько месяцев прошлого года.
Конфликт между компаниями лежит не только в коммерческой плоскости, но и в самой философии разработки. Skild AI публично критикует подход конкурентов, утверждая, что большинство «фундаментальных моделей для робототехники» на самом деле являются замаскированными «визуально-языковыми моделями». Визуально-языковые модели (Vision-language models) — это тип мультимодальных моделей ИИ, которые способны обрабатывать и связывать информацию из двух источников: визуальных данных (изображений, видео) и текстовых данных (языка). В робототехнике они позволяют роботу понимать команды на естественном языке и интерпретировать то, что он видит. По мнению Skild AI, таким моделям не хватает «истинного физического здравого смысла», поскольку они слишком полагаются на предварительное обучение на интернет-данных, а не на симуляциях, основанных на физике, и данных с реальных роботов.
Здесь и проходит фундаментальный раскол. Стратегия Skild AI строится на вере в «маховик данных«, генерируемый реальными клиентами в сферах безопасности, логистики и производства. Каждый новый коммерческий случай использования обогащает их модель Skild Brain, делая ее умнее и практичнее. В свою очередь, стратегия PI заключается в приоритете чистых исследований. Они сознательно избегают краткосрочной коммерциализации, полагая, что это позволит им создать более совершенный и универсальный интеллект в долгосрочной перспективе. Однако такой отказ лишает PI того самого маховика данных, что создает риск разработки теоретически превосходной, но менее адаптированной к реальному миру модели. Вопрос о том, чей подход окажется «более правильным», остается открытым и, вероятно, не получит ответа в ближайшие несколько лет.
Пузырь или прорыв? Риски и сомнения вокруг Physical Intelligence
Многих интересует, почему Physical Intelligence оценили в $5,6 млрд при отсутствии коммерческого продукта и четкого плана монетизации. Эта заоблачная оценка неизбежно вызывает главный вопрос: не является ли это очередным спекулятивным пузырем? Успех во многом держится на репутации основателей и вере инвесторов в фундаментальные исследования, однако эта вера не безгранична. Отсутствие внятного графика коммерциализации создает серьезный экономический риск. Инвесторы могут попросту потерять терпение, если в ближайшие 18 — 24 месяца компания не продемонстрирует ощутимый прорыв, способный оправдать вложенные средства. Подобная ситуация, когда ажиотаж опережает реальную технологическую готовность, характерна для многих амбициозных проектов, и каждый такой ИИ стартап рискует повторить судьбу предшественников, как мы уже обсуждали в материале «Пузырь искусственного интеллекта: что это и когда он лопнет?» [1].
Технические риски не менее серьезны. Громкая концепция «ChatGPT для роботов» может оказаться преждевременной и излишне упрощенной. Физический мир, в отличие от текстового, не прощает ошибок. Здесь требуется высочайший уровень точности и «здравого смысла», который сложно развить в лабораторных условиях. Фундаментальная сложность работы с «железом» — его поломки, медленные поставки, вопросы безопасности — способна значительно замедлить прогресс PI. Более того, ставка на удешевление аппаратного обеспечения до уровня $1000 может стать критическим узким местом. Каким бы гениальным ни был «мозг» робота, его возможности будут жестко ограничены точностью и надежностью дешевых манипуляторов, что ставит под сомнение способность выполнять действительно сложные задачи.
Наконец, существуют рыночные и конкурентные угрозы. Пока Physical Intelligence оттачивает универсальный интеллект на чистке цукини, остается открытым вопрос: а существует ли реальный рыночный спрос на роботов для подобных бытовых задач? Непонимание размера целевого рынка — серьезный просчет, если компания не сможет быстро адаптировать свою технологию для промышленных нужд. Тем временем конкуренты, такие как Skild AI, не ждут идеального решения. Они делают ставку на быструю коммерциализацию в конкретных нишах, создавая более эффективный цикл обратной связи «данные-улучшение». Захватывая реальные рынки, они получают бесценные данные и опыт, что в долгосрочной перспективе может позволить им опередить PI в практическом применении, оставив амбициозный проект в роли догоняющего.
Ставка на интеллект в эпоху аппаратного хаоса
Physical Intelligence делает одну из самых чистых и смелых ставок в современном ИИ. Вместо погони за быстрой коммерциализацией, компания, с той «необычайной ясностью», о которой говорит Лаки Грум, ставит всё на фундаментальные исследования общего интеллекта. Она верит, что универсальный «мозг» в конечном итоге окажется ценнее, чем специализированные решения, привязанные к конкретному оборудованию. Будущее этой амбициозной стратегии может развиваться по нескольким ключевым сценариям.
В самом радужном из них, PI достигает прорыва в создании истинно общего робототехнического интеллекта, который легко адаптируется к любой платформе, становясь доминирующим поставщиком «мозгов» для всей мировой робототехники. Более сдержанный, нейтральный прогноз предполагает, что PI успешно создает мощную базовую модель, но сталкивается с трудностями в интеграции с разнообразным промышленным оборудованием, становясь нишевым поставщиком ИИ для высокоточных задач и сосуществуя с коммерчески ориентированными конкурентами. Наконец, существует и негативный исход: отсутствие реальных данных от клиентов приводит к тому, что модель PI не может справиться с непредсказуемостью реального мира, инвесторы требуют немедленной коммерциализации, и компания теряет лидерство в гонке универсального интеллекта.
Какой из путей станет реальностью, покажет лишь время. Однако сама ставка Physical Intelligence — это квинтэссенция духа Кремниевой долины, которая исторически поддерживала такие дерзкие проекты. Они не всегда выстреливают, но успех одного такого предприятия способен оправдать множество неудач. Робот, методично чистящий цукини в лаборатории, может оказаться как первым шагом к новой промышленной революции, так и просто очень дорогим научным экспериментом.
Часто задаваемые вопросы
Что такое Physical Intelligence и какова ее основная миссия?
Physical Intelligence (PI) — это стартап из Кремниевой долины, который стремится создать универсальный «мозг» для любого робота, способный обучаться и выполнять любую физическую задачу. Их миссия, часто описываемая как создание «ChatGPT для роботов», заключается в разработке программного интеллекта, который превосходит аппаратное совершенство. Компания делает ставку на то, что высококачественный ИИ сможет эффективно управлять простыми и дешевыми манипуляторами.
Какую ключевую технологию использует Physical Intelligence для универсализации роботов?
Ключевой технологией является Кросс-телесное обучение в робототехнике (Cross-embodiment learning). Эта методология позволяет модели ИИ переносить знания и навыки, полученные на одной аппаратной платформе, на совершенно новую платформу. Такой подход радикально снижает предельные издержки на внедрение автономии на любое новое роботизированное оборудование, реализуя девиз «любая платформа, любая задача».
Кто является основателями стартапа Physical Intelligence?
В команду основателей входят ведущие ученые и инвестор-визионер. Соучредителями являются Сергей Левин, доцент UC Berkeley, и Челси Финн, руководитель лаборатории в Stanford, а также Кароль Хаусман, ведущий исследователь из Google DeepMind. К ним присоединился Лэки Грум, ветеран Stripe и успешный ангельский инвестор, который также стал сооснователем компании.
Почему Physical Intelligence привлекла более $1 миллиарда, не имея плана монетизации?
Компания привлекла более $1 миллиарда при оценке в $5,6 миллиарда благодаря убежденности основателя Лэки Грума и вере инвесторов, таких как Khosla Ventures и Sequoia Capital, в фундаментальные исследования. Грум открыто заявляет, что у него нет четкого графика коммерциализации, но инвесторы делают ставку не на бизнес-план, а на видение основателя и масштаб решаемой задачи. Основная часть этого гигантского капитала уходит на вычислительные ресурсы.
В чем заключается основное различие между стратегиями Physical Intelligence и Skild AI?
Physical Intelligence делает ставку на долгосрочные чистые исследования и создание универсального интеллекта, сознательно избегая краткосрочной коммерциализации. В то время как Skild AI фокусируется на быстрой коммерциализации в конкретных нишах, используя «маховик данных», генерируемый реальными клиентами. Skild AI также критикует PI за чрезмерную опору на визуально-языковые модели, которым, по их мнению, не хватает «истинного физического здравого смысла».






