5 мая OpenAI выкатил GPT-5.5 Instant и сразу сделал его дефолтной моделью ChatGPT для всех пользователей, включая free-tier. Старая модель GPT-5.3 Instant остаётся доступной для платных подписчиков ещё три месяца через настройки модели.
Главная цифра, которую OpenAI ставят на витрину: на 52.5% меньше галлюцинированных утверждений по сравнению с GPT-5.3 Instant на high-stakes промптах в медицине, праве и финансах. Это значимый показатель, если он подтвердится на ваших данных.
История модели до GPT-5.5
GPT-5.3 Instant был дефолтом ChatGPT с прошлого года. Достаточно быстрый, неплохо справлялся с обычными запросами, но регулярно ловился на трёх вещах: выдумывал источники в юридических вопросах, путал числа в финансах, и заметно "льстил" пользователю в разговорах про здоровье. На крупных платформах вроде Perplexity или Glean эти ошибки уже стоили денег и доверия.
OpenAI несколько раз обещали "снизить hallucinations rate", но конкретных цифр не давали. В 5.5 цифра наконец появилась.
Что выкатили в GPT-5.5 Instant
-52.5% галлюцинаций - что за число
Это OpenAI's internal evaluation на high-stakes промптах. Не публичный бенчмарк, не peer-review. Их тест, их данные, их метрика. Поэтому приземляться на этой цифре в продакшене мы бы не стали, но как сигнал направления - приемлемо.
−52.5%галлюцинации (high-stakes) −30.2%слов в ответе −29.2%строк в ответеРелевантно ли для русского B2B? Скорее да: если вы используете ChatGPT для черновиков юридических заключений, ответов поддержки клиентам или анализа отчётов - снижение количества фиктивных фактов имеет прямое экономическое значение. Каждая галлюцинация - это возврат человеку на проверку, время, риск.
| Параметр | GPT-5.3 Instant | GPT-5.5 Instant |
|---|---|---|
| Дефолт ChatGPT | до 5 мая 2026 | с 5 мая 2026 |
| Галлюцинации (high-stakes) | 100% (baseline) | 47.5% |
| Слов в ответе | 100% (baseline) | −30.2% |
| Строк в ответе | 100% (baseline) | −29.2% |
| API-идентификатор | explicit ID | chat-latest |
| Realtime API | GPT-Realtime-1 | Realtime-2 / Translate / Whisper |
| Доступ из РФ | только через прокси | только через прокси |
-30% слов и -29% строк
В пресс-релизе явно указано: GPT-5.5 Instant использует на 30.2% меньше слов и на 29.2% меньше строк. Модель приучена к лаконичности.
Это спорное преимущество. Для ChatGPT в браузере короче - лучше. Для агентов, которые парсят выход модели и принимают решения по структуре ответа - это потенциальный риск. Если ваш парсер ожидает определённой структуры в вердикте, и модель резко "оптимизировала" формулировку, ваш регекс может перестать срабатывать.
Тестируйте на своих парсерах, особенно если вы используете JSON mode или structured output.
Меньше эмодзи
Отдельным пунктом OpenAI декларирует: модель будет использовать меньше "gratuitous emojis". Это реакция на жалобы пользователей, что предыдущие версии бросались эмодзи в ответах на серьёзные технические вопросы.
Маленькое, но приятное изменение. Особенно для интеграций в B2B-чаты, где эмодзи в ответах LLM выглядят неуместно.
Realtime voice models
Параллельно с релизом OpenAI выпустили три новых realtime-модели в API:
- GPT-Realtime-2 - для smart live voice reasoning
- GPT-Realtime-Translate - для real-time multilingual speech
- GPT-Realtime-Whisper - для streaming transcription
Это отдельная история и заслуживает своего разбора. Сейчас просто отметим: voice-стек у OpenAI обновился целиком, и это ускоряет применения вроде voice-ассистентов в support-системах.
Memory и Gmail-интеграция
Plus и Pro получают расширенную персонализацию: модель учитывает предыдущие чаты, файлы и подключённый Gmail. Постепенно докатится до Free, Go, Business и Enterprise.
Для российских пользователей это менее релевантно: подключение Gmail через ChatGPT в РФ работает с оговорками, и для корпоративных интеграций большинство всё равно работает через API, а не через интерфейс ChatGPT.
Применение в B2B-проектах
Чат-боты поддержки клиентов на ChatGPT API. Если ты используешь API-режим Instant для квалификации, классификации обращений или генерации первого ответа поддержки - это прямой кандидат на тест. Снижение галлюцинаций на high-stakes темах закрывает один из главных рисков LLM-поддержки. Мы делаем такие Telegram-боты в связке с GPT-API, и для каждого нового клиента сейчас идёт смена дефолта на 5.5.
Юридические и финансовые черновики. Если у клиента работает связка "юрист пишет промпт → LLM делает черновик → юрист правит" - это базовый сценарий, где -52% галлюцинаций даёт реальную экономию. По данным TechCrunch, OpenAI на этих темах фокусировался специально.
Voice-ассистенты в звонках. Если у тебя в проекте есть голосовая часть - Realtime-2 заслуживает отдельного A/B относительно прошлой версии, особенно на русском языке. Это попадает в наш пакет AI-автоматизации - сделать demo-стенд можно за пару дней.
Подводные камни миграции
"Снижение галлюцинаций" не равно "точность". Модель может реже выдумывать факты, но при этом чаще говорить "не знаю" в ситуациях, где она бы дала правильный ответ. Это полезно для юр-сферы, но плохо для UX чат-бота, который должен отвечать на 80% вопросов без эскалации. Меряйте полную метрику задачи, а не только rate of hallucinations.
Лаконичность ломает существующие парсеры. Прежде чем переключать дефолт на 5.5 в продакшене с агентами, прогоните на регрессе. Особенно если у вас есть строки вида "если в ответе есть X - делай Y".
Free-tier тоже получил. Это значит, что у ваших пользователей результат от ChatGPT станет другим без вашего ведома. Если ваш продукт строится на том, что клиент тестирует промпт в ChatGPT и приносит вам - поведение изменилось, ждите разговоров "у меня в чате работало по-другому".
Старая модель доступна 3 месяца. Если вам критична совместимость - успейте провести аудит. После трёх месяцев GPT-5.3 Instant отключат.
Что ждать от OpenAI дальше
OpenAI явно держит курс на агрессивный темп: квартальные минор-релизы с измеримыми улучшениями. Ждать ли GPT-5.6 в августе - скорее да. К ноябрю обещали GPT-6, но эта дата гуляет - отслеживать удобно через model release notes в OpenAI Help Center, там все апдейты одной лентой.
Из практичного: если ты строишь агента, в котором ChatGPT - компонент, заложи в архитектуру сценарий "бэкенд OpenAI обновил модель без нашего ведома, поведение поменялось". Это уже норма, а не исключение. Версионирование промптов, регрессионные тесты, A/B на критичных flow - теперь не "хорошо иметь", а базовая гигиена. Мы это закладываем по умолчанию в каждый проект (наш процесс описывает зачем).
Если у тебя есть LLM-проект и хочется второго мнения по архитектуре - пиши в контакты, глянем. В @digitalimpulschannel дублируем такие разборы с короткой выжимкой и ссылкой на полный текст.
Частые вопросы о GPT-5.5 Instant
01Чем GPT-5.5 Instant отличается от GPT-5.3 Instant?
По данным OpenAI, GPT-5.5 Instant даёт на 52.5% меньше галлюцинаций на high-stakes темах (медицина, право, финансы), на 30.2% меньше слов и 29.2% меньше строк в ответе. Отдельно - модель использует меньше эмодзи. Цена и API-эндпоинт те же.02Как переключиться на GPT-5.5 Instant в API?
В API он доступен под идентификатором chat-latest и автоматически становится моделью по умолчанию. Старая модель GPT-5.3 Instant остаётся доступной через явное указание идентификатора и будет отключена через 90 дней после релиза.03Стоит ли срочно мигрировать продакшен на GPT-5.5?
Не срочно. Сначала прогоните регрессию на своих данных: новая модель более лаконична, что может ломать парсеры, ожидающие определённой длины или структуры ответа. После регрессии можно переключаться. Старая GPT-5.3 будет жить ещё 3 месяца.04Работает ли GPT-5.5 в России?
API OpenAI из РФ напрямую не работает, требуется зарубежный VPN или прокси-сервис. Большинство интеграторов используют шлюзы (например, OpenRouter) или собственные прокси с зарубежных серверов. Юридические нюансы интеграции обсуждаются по проекту индивидуально.