
Если и есть какая-то область, в которой уже говорят, что подъём ИИ делает людей ненужными — где рассвет суперинтеллекта будто бы уже наступил, — так это программирование. Поэтому результаты недавнего исследования по-настоящему поражают.
В исследовании, опубликованном в июле, аналитический центр Model Evaluation & Threat Research (METR) случайным образом распределил группу опытных разработчиков программного обеспечения на выполнение кодировочных задач с инструментами ИИ и без них. Это был самый строгий на сегодня тест того, как ИИ проявит себя в реальном мире. Поскольку программирование — один из навыков, который существующие модели во многом уже освоили, практически все участники ожидали огромного роста производительности благодаря ИИ. В предварительном опросе экспертов средний прогноз был таким: ИИ ускорит работу разработчиков почти на 40 процентов. После эксперимента сами участники оценили, что ИИ сделал их на 20 процентов быстрее.
Но когда команда METR посмотрела на фактические результаты работы сотрудников, оказалось, что при использовании ИИ разработчики выполняли задачи на 20 процентов медленнее, чем без него. Исследователи были ошеломлены. «Никто не ожидал такого исхода, — сказал мне Нейт Раш, один из авторов исследования. — Мы даже и не рассматривали замедление как возможный вариант».
Ни один отдельный эксперимент не следует считать окончательной истиной. Но исследование METR, по словам многих экспертов по ИИ, — лучшее из того, что у нас есть, и оно помогает осмыслить иначе парадоксальный момент для ИИ. С одной стороны, США переживают необычайный, подпитываемый ИИ экономический бум: фондовый рынок взлетает благодаря перегретым оценкам технологических гигантов, связанных с ИИ, а реальная экономика разгоняется за счёт сотен миллиардов долларов расходов на дата-центры и другую инфраструктуру ИИ. Подо всеми этими инвестициями лежит убеждение, что ИИ сделает работников радикально более продуктивными, что, в свою очередь, поднимет корпоративные прибыли до немыслимых уровней.
С другой стороны, накапливаются свидетельства того, что ИИ не оправдывает ожиданий в реальном мире.
Техногиганты, вкладывающие в ИИ больше всего денег, и близко не вернули свои инвестиции. Исследования показывают, что компании, пытающиеся внедрять ИИ, практически не увидели влияния на свою конечную прибыль. А экономисты, ищущие доказательства вытеснения работников ИИ, в основном остаются ни с чем.
Всё это не означает, что ИИ в конечном счёте не сможет оказаться столь же преобразующим, каким его представляют самые горячие сторонники. Но «в конечном счёте» может оказаться очень не скоро. Это поднимает возможность того, что мы сейчас переживаем пузырь ИИ, при котором восторг инвесторов слишком далеко опередил краткосрочные выгоды технологии для производительности. Если этот пузырь лопнет, он может затмить крах доткомов — и пострадают не только техногиганты и их покровители в Кремниевой долине.
Почти все согласны, что программирование — самый впечатляющий сценарий использования нынешних технологий ИИ. До своего последнего исследования METR была известна прежде всего мартовским анализом, показавшим, что самые продвинутые системы способны справляться с задачами программирования, на выполнение которых у типичного разработчика-человека уходит почти час. Так как же ИИ мог сделать разработчиков в её эксперименте менее продуктивными?
Ответ связан с «разрывом между возможностями и надёжностью». Хотя системы ИИ научились выполнять впечатляющий набор задач, им трудно делать это с той устойчивостью и точностью, которые требуются в реальных условиях. Например, результаты мартовского исследования METR основывались на «50-процентной доле успеха», то есть система ИИ могла надёжно выполнять задачу лишь в половине случаев — что по сути делает её бесполезной сама по себе. Этот разрыв усложняет использование ИИ в рабочем контексте. Даже самые продвинутые системы допускают небольшие ошибки или немного неверно понимают инструкции, из-за чего человеку приходится тщательно проверять их работу и вносить правки там, где это необходимо.
Именно это, по-видимому, и произошло в более новом исследовании.
Разработчики в итоге тратили много времени на проверку и переделку кода, который выдали системы ИИ, — зачастую больше, чем потребовалось бы, чтобы просто написать его самим. Один из участников позже описал процесс как «цифровой эквивалент подглядывания через плечо за самоуверенным младшим разработчиком».
С тех пор, как проводился эксперимент, инструменты ИИ для программирования стали надёжнее. И исследование было сосредоточено на экспертных разработчиках, тогда как наибольший рост производительности может прийти от усиления — или замены — возможностей менее опытных работников. Но исследование METR столь же легко может переоценивать выгоды для производительности, связанные с ИИ. Многие задачи умственного труда автоматизировать сложнее, чем кодинг, который выигрывает от огромных массивов обучающих данных и чётких критериев успеха. «Программирование — это то, что системы ИИ, как правило, делают чрезвычайно хорошо», — сказал мне Тим Фист, директор по политике в области новых технологий в Institute for Progress. — «Так что если окажется, что они даже не делают разработчиков более продуктивными, это может всерьёз изменить представление о том, как ИИ в целом может повлиять на экономический рост».
Разрыв между возможностями и надёжностью может объяснять, почему генеративный ИИ до сих пор не дал осязаемых результатов для компаний, которые его используют. Когда исследователи из MIT недавно отследили результаты 300 публично раскрытых инициатив в сфере ИИ, они обнаружили, что 95 процентов проектов не дали никакого прироста прибыли.
В мартовском отчёте McKinsey & Company говорилось, что 71 процент компаний сообщили об использовании генеративного ИИ, и более 80 процентов из них сообщили, что технология не оказала «осязаемого влияния» на доходы.
В свете этих тенденций консалтинговая фирма Gartner недавно заявила, что ИИ вошёл в фазу «впадины разочарования» в технологическом развитии.
Возможно, развитие ИИ переживает лишь временную заминку. По словам экономиста Стэнфордского университета Эрика Бриньолфссона (Erik Brynjolfsson), каждая новая технология проходит через «J-кривую производительности»: сначала бизнесу сложно её внедрять, из-за чего производительность падает. Однако со временем компании учатся интегрировать её, и производительность взлетает. Канонический пример — электричество, которое стало доступным в 1880-е годы, но не начало приносить компаниям значительный рост производительности, пока Генри Форд не переосмыслил фабричное производство в 1910-е. Некоторые эксперты полагают, что для ИИ этот процесс будет происходить намного быстрее. «С ИИ мы находимся на ранней, отрицательной части J-кривой, — сказал мне Бриньолфссон. — Но во второй половине 2020-х всё действительно взлетит». Генеральный директор Anthropic Дарио Амодеи предсказывал, что к 2027 году, или «ненамного позже», ИИ будет «лучше людей почти во всём».
Эти прогнозы предполагают, что ИИ и дальше будет улучшаться так же быстро, как в последние несколько лет. Но это не гарантировано. Новые модели омрачены задержками и отменами, а выпущенные в этом году в целом показали меньше крупных улучшений, чем прежние, несмотря на значительно более высокие затраты на разработку.
В мартовском опросе Ассоциация по развитию искусственного интеллекта (AAAI) спросила 475 исследователей ИИ, могут ли текущие подходы к разработке ИИ дать систему, сопоставимую или превосходящую человеческий интеллект; более трёх четвертей ответили, что это «маловероятно» или «крайне маловероятно».
Последняя модель OpenAI, GPT-5, была выпущена в начале прошлого месяца после почти трёх лет работы и миллиардов долларов расходов. (The Atlantic заключил корпоративное партнёрство с OpenAI в 2024 году.) Перед запуском генеральный директор Сэм Альтман заявил, что её использование будет равносильно тому, что у вас «под рукой легитимный эксперт уровня PhD по чему угодно». В некоторых областях, включая программирование, GPT-5 действительно стал большим шагом вперёд. Но по большинству строгих метрик эффективности ИИ GPT-5 оказался, в лучшем случае, умеренным улучшением по сравнению с предыдущими моделями.
Преобладающая точка зрения в отрасли состоит в том, что это лишь вопрос времени, когда компании найдут следующий способ резко ускорить прогресс ИИ. Так и может случиться, но до гарантии этому далеко.
Генеративный ИИ был бы не первой технологической модой, пережившей волну чрезмерного хайпа. Особенность нынешней ситуации в том, что ИИ, похоже, подпирает чуть ли не всю экономику США.
Более половины роста индекса S&P 500 с 2023 года пришлись всего на семь компаний: Alphabet, Amazon, Apple, Meta, Microsoft, Nvidia и Tesla. Эти фирмы, известные как «Великолепная семёрка», считаются особенно хорошо позиционированными для процветания благодаря революции ИИ.
Однако это процветание пока в основном проявляется лишь в их котировках. (Исключение — Nvidia, которая поставляет критически важные компоненты — передовые чипы, — которые покупают остальные из «Великолепной семёрки».) Как сообщает The Wall Street Journal, у Alphabet, Amazon, Meta и Microsoft свободный денежный поток за последние два года снизился на 30 процентов. По одной оценке, к концу этого года Meta, Amazon, Microsoft, Google и Tesla суммарно потратят 560 миллиардов долларов на капитальные расходы, связанные с ИИ, с начала 2024 года и получат всего 35 миллиардов долларов выручки, связанной с ИИ. OpenAI и Anthropic приносят много выручки и быстро растут, но они всё ещё далеко не прибыльны. Их оценки — примерно 300 миллиардов и 183 миллиарда долларов соответственно, и растут — во много раз превышают их текущие доходы. (OpenAI прогнозирует около 13 миллиардов долларов выручки в этом году; Anthropic — от 2 до 4 миллиардов.) Инвесторы активно ставят на то, что все эти расходы вскоре принесут рекордные прибыли. Но если эта уверенность рухнет, инвесторы могут начать массово продавать, из-за чего рынок переживёт крупную и болезненную коррекцию.
Во время интернет-революции 1990-х инвесторы направляли деньги практически в любую компанию с «.com» в названии, исходя из убеждения, что интернет вот-вот перевернёт бизнес. Однако к 2000 году стало ясно, что компании прожигают деньги, мало что показывая взамен, и инвесторы отреагировали, сбрасывая самые переоценённые технологические акции. С марта 2000-го по октябрь 2002-го S&P 500 упал почти на 50 процентов. В конечном счёте интернет действительно преобразил экономику и привёл к появлению одних из самых прибыльных компаний в истории человечества. Но это не помешало огромному числу инвесторов «остаться без штанов».
Крах доткомов был тяжёлым, но он не спровоцировал кризис. Крах пузыря ИИ может быть иным. Инвестиции, связанные с ИИ, уже превысили долю экономики, которой достиг телеком-сектор на пике пузыря доткомов. В первой половине этого года бизнес-расходы на ИИ внесли в рост ВВП больше, чем все потребительские траты вместе взятые. Многие эксперты считают, что одна из главных причин, по которой экономика США сумела выдержать тарифы и массовые депортации без рецессии, — это то, что все эти расходы на ИИ выступают, по словам одного экономиста, «масштабной программой стимулирования частного сектора». Крах ИИ может привести к повсеместному сокращению расходов, уменьшению занятости и замедлению роста, потенциально втянув экономику в рецессию. Экономист Ноа Смит утверждает, что это может даже привести к финансовому кризису, если нерегулируемые займы «private credit», финансирующие значительную часть расширения отрасли, одновременно окажутся невозвратными.
Если мы действительно находимся в пузыре ИИ, светлой стороной будет то, что страхи перед внезапным вытеснением рабочих мест ИИ преувеличены. В недавнем анализе экономисты Сара Экхардт и Натан Голдшлаг использовали пять разных измерений «подверженности ИИ», чтобы оценить, как новая технология может влиять на ряд показателей рынка труда, и практически не обнаружили влияния ни на один из них. Например, они отмечают, что уровень безработицы среди работников, наименее подверженных воздействию ИИ, таких как строители и фитнес-тренеры, вырос в три раза быстрее, чем среди работников, наиболее подверженных ему, таких как телемаркетологи и разработчики программного обеспечения. Большинство других исследований, хотя и не все, пришли к аналогичным выводам.
Но есть и более странный, промежуточный вариант. Даже если инструменты ИИ не повышают производительность, хайп вокруг них может подталкивать бизнес к дальнейшему расширению их использования. «Я снова и снова слышу от компаний одну и ту же историю, — сказал мне Дарон Асемоглу, экономист из MIT. — Менеджерам среднего и верхнего звена начальство говорит, что им нужно использовать ИИ для X процентов своей работы, чтобы удовлетворить совет директоров». Эти компании могут даже увольнять работников или замедлять найм, потому что уверены — как те разработчики из исследования METR, — что ИИ сделал их более продуктивными, даже если это не так. Результатом станет рост безработицы, который не компенсируется реальным повышением производительности.
Как бы невероятно ни звучал этот сценарий, его версия случилась в недавнем прошлом. В своей книге 2021 года «A World Without Email» («Мир без электронной почты») компьютерный учёный Кал Ньюпорт отмечает, что, начиная с 1980-х годов, такие инструменты, как компьютеры, электронная почта и онлайн-календарь, позволили работникам умственного труда самостоятельно вести переписку и назначать встречи.
В свою очередь многие компании решили уволить секретарей и машинисток. В парадоксальном результате сотрудники более высокой квалификации стали тратить столько времени на рассылку писем, составление протоколов встреч и планирование встреч, что стали намного менее продуктивны в своей основной работе, вынуждая компании нанимать больше таких сотрудников, чтобы выполнить тот же объём работы.
Позднее исследование 20 компаний из списка Fortune 500 показало, что те, у кого наблюдались компьютерно обусловленные «дисбалансы численности персонала», тратили на зарплату на 15 процентов больше, чем им было нужно. «Электронная почта была одной из тех технологий, которые заставляли нас чувствовать себя более продуктивными, но на самом деле давали противоположный эффект, — сказал мне Ньюпорт. — Я боюсь, что мы можем идти по тому же пути с ИИ».
С другой стороны, если альтернатива — это обвал фондового рынка, который спровоцирует рецессию или финансовый кризис, такой сценарий может оказаться не самым плохим.
