OpenAI выпустила модель GPT 4.1 с упором на программирование
15 апреля 2025, 15:59
OpenAI представила семейство ИИ-моделей GPT-4.1  — мультимодальные решения с контекстом до 1 млн токенов, улучшенными навыками кодинга и более выгодной ценой. Новые версии — GPT-4.1, mini и nano — ориентированы на разработчиков и доступны только через API. Они демонстрируют высокие результаты в тестах на программирование и могут стать шагом к созданию "автономного инженера-программиста", способного разрабатывать софт под ключ. Несмотря на то, что GPT-4.1 превосходит GPT-4o по ряду параметров, в ChatGPT она пока недоступна — в пользовательском интерфейсе продолжает работать универсальная и постепенно обновляемая версия GPT-4o.

GPT-4.1, GPT-4.1 mini и GPT-4.1 nano хорошо справляются с программированием и выполнением инструкций. Эти мультимодальные модели обладают контекстным окном в 1 млн токенов, что позволяет им обрабатывать около 750 000 слов за один запрос (больше, чем объём "Войны и мира"). Это примерно в четыре раза превышает возможности GPT-4o. Версии mini и nano работают быстрее и эффективнее, хотя и с небольшим снижением точности. При этом GPT-4.1 nano позиционируется как самая быстрая и экономичная модель из всех созданных OpenAI."Если ИИ — это мозг робота, то RPA — его руки". Что умеют программные роботы

OpenAI стремится выпускать ИИ-модели, способные разрабатывать программное обеспечение. Как заявила финансовый директор OpenAI Сара Фрайар, цель компании — разработать "автономного инженера-программиста". Будущие модели смогут самостоятельно создавать приложения "под ключ" — от написания кода до тестирования, контроля качества и подготовки документации. GPT-4.1 — шаг в этом направлении. Модель улучшили на основе отзывов разработчиков, сделав акцент на кодировании интерфейсов, точности правок, соблюдении форматов и структуры ответов, а также стабильном использовании инструментов.

GPT-4.1 продемонстрировал результат 52-54,6% в тесте SWE-bench Verified, что значительно выше показателя GPT-4o в 33%. При этом OpenAI уступает Google и Anthropic: Gemini 2.5 Pro набрал 63,8%, а Claude 3.7 Sonnet — 62,3% в том же тесте. В другом исследовании GPT-4.1 проверили с помощью Video-MME — методики, оценивающей способность модели "понимать" видеоконтент. По заявлениям компании, GPT-4.1 достиг рекордной точности в 72% в категории "длинные видео без субтитров".

OpenAI признает, что надежность GPT-4.1 снижается по мере роста объема обрабатываемых токенов. В ходе внутреннего теста OpenAI-MRCR точность модели упала с примерно 84% при 8000 токенах до 50% при обработке 1 млн токенов. Кроме того, GPT-4.1 работает более "буквально" по сравнению с GPT-4o, что иногда требует более четких и детализированных запросов для получения оптимальных результатов.

Необычным шагом стало то, что GPT-4.1 доступна исключительно через API для разработчиков, а не в интерфейсе ChatGPT, где большинство пользователей взаимодействуют с технологиями OpenAI. Параллельно компания объявила о постепенном отказе от GPT-4.5 Preview в API — временного решения, запущенного в феврале и получившего неоднозначные оценки. Хотя GPT-4.1 значительно превосходит GPT-4.5 Preview в тестах на программирование, последняя демонстрирует лучшие результаты в академических знаниях, следовании инструкциям и задачах, связанных с обработкой изображений. Возникает вопрос: зачем заменять, казалось бы, более универсальную модель. OpenAI объясняет это экономической целесообразностью: GPT-4.1 обеспечивает сопоставимую производительность при значительно меньших затратах и задержках, тогда как GPT-4.5 остается ресурсоемким и дорогим решением.

GPT-4.1 стоит $2 за миллион входных и $8 за миллион выходных токенов, что на 26% выгоднее, чем GPT-4o для обычных запросов. GPT-4.1 mini: $0,40 (ввод), $1,60 (вывод) за миллион токенов. GPT-4.1 nano: всего $0,10 (ввод) и $0,40 (вывод) за миллион токенов. Для сравнения, GPT-4.5 был очень дорогим: $75 (ввод) и $150 (вывод) за миллион токенов через API.

Почему тогда OpenAI не внедряет в ChatGPT более совершенную GPT-4.1, если она превосходит GPT-4o? Компания объясняет это поэтапным внедрением улучшений — многие функции исследовательских моделей постепенно интегрируются в основную версию GPT-4o с перспективой дальнейших обновлений. Таким образом, в экосистеме OpenAI сложилась двойная структура: разработчики через API получают доступ к специализированным моделям (4.1, 4.1 mini, 4.1 nano и другим) с фиксированными характеристиками для точного соответствия задачам и бюджету, тогда как рядовые пользователи ChatGPT работают с постоянно эволюционирующей "универсальной" версией GPT-4o, которая незаметно обновляется по усмотрению компании.
hightech.plus
© ФГУП «ГосНИИПП», 1989-2025