
OpenAI представила ИИ-модели o3 и o3-mini
Эти модели обладают «способностью рассуждать», позволяя разбивать сложные задачи на этапы и объяснять ход своих решений.
В рамках акции Shipmas компания OpenAI анонсировала большие языковые модели нового поколения — o3 и o3-mini, которые являются преемниками o1 и o1-mini. По заявлению разработчиков, обе ИИ-модели обладают способностью к рассуждению, что позволяет им разбивать сложные задачи на этапы и объяснять ход своих решений. Модель o3-mini была разработана для кодирования и обеспечения более высокой производительности. Она предлагает три настройки вычислений: низкие, средние и высокие.
Улучшенные возможности и производительность
OpenAI отмечает, что обучение нейросетей o3 и o3-mini еще не завершено, и их возможности могут превзойти заявленные. Тем не менее, компания уже принимает заявки от исследовательского сообщества на тестирование этих моделей перед их публичным запуском.
Достижения в тестах
В сравнении с предыдущими версиями модели, o3 показала:
· 22,8% улучшение в тестах по кодированию SWE-Bench Verified;
· 96,7% успешное прохождение экзамена AIME 2024, где пропущен только один вопрос;
· 87,7% результат в тесте GPQA Diamond, охватывающем научные задачи экспертного уровня.
Особенно впечатляющим является то, что в сложнейших математических и логических тестах, где другие ИИ показывают результаты не выше 2%, o3 смогла решить 25,2% задач. Это значительный прогресс для искусственного интеллекта.
Результаты в ARC-AGI
Тест ARC-AGI, созданный для сравнения интеллекта ИИ с человеческим, продемонстрировал превосходство модели o3 над o1 более чем в три раза. Она набрала 88%, что подтверждает её высокий уровень понимания и анализа.
Ключевые особенности моделей
Высокие показатели тестов стали возможны благодаря следующим особенностям моделей o3 и o3-mini:
1. Способность к рассуждению. Модели могут разбивать задачи на этапы и объяснять свои решения.
2. Эффективная проверка ответов. Это позволяет минимизировать ошибки и избежать «галлюцинаций».
3. Три уровня вычислительной мощности (в модели o3-mini), что делает её универсальным инструментом для различных задач.
Однако стоит отметить, что процесс проверки фактов перед выдачей ответа может занимать от нескольких секунд до нескольких минут, в зависимости от сложности запроса. Кроме того, задержки связаны с необходимостью проверки запросов на соответствие политике безопасности OpenAI.
Когда ожидать запуск?
Первая версия модели OpenAI o3 планируется к выпуску в конце января 2025 года. О дате выхода o3-mini пока не сообщается.
Эти новые модели OpenAI о3 и o3-mini обещают стать мощным инструментом для решения сложных задач и повышения эффективности в различных областях. Следите за обновлениями, чтобы не пропустить их официальный релиз.