OpenAI представила ИИ-модели o3 и o3-mini

Эти модели обладают «способностью рассуждать», позволяя разбивать сложные задачи на этапы и объяснять ход своих решений.

В рамках акции Shipmas компания OpenAI анонсировала большие языковые модели нового поколения — o3 и o3-mini, которые являются преемниками o1 и o1-mini. По заявлению разработчиков, обе ИИ-модели обладают способностью к рассуждению, что позволяет им разбивать сложные задачи на этапы и объяснять ход своих решений. Модель o3-mini была разработана для кодирования и обеспечения более высокой производительности. Она предлагает три настройки вычислений: низкие, средние и высокие.

Улучшенные возможности и производительность

OpenAI отмечает, что обучение нейросетей o3 и o3-mini еще не завершено, и их возможности могут превзойти заявленные. Тем не менее, компания уже принимает заявки от исследовательского сообщества на тестирование этих моделей перед их публичным запуском.

Достижения в тестах

В сравнении с предыдущими версиями модели, o3 показала:

· 22,8% улучшение в тестах по кодированию SWE-Bench Verified;

· 96,7% успешное прохождение экзамена AIME 2024, где пропущен только один вопрос;

· 87,7% результат в тесте GPQA Diamond, охватывающем научные задачи экспертного уровня.

Особенно впечатляющим является то, что в сложнейших математических и логических тестах, где другие ИИ показывают результаты не выше 2%, o3 смогла решить 25,2% задач. Это значительный прогресс для искусственного интеллекта.

Результаты в ARC-AGI

Тест ARC-AGI, созданный для сравнения интеллекта ИИ с человеческим, продемонстрировал превосходство модели o3 над o1 более чем в три раза. Она набрала 88%, что подтверждает её высокий уровень понимания и анализа.

Ключевые особенности моделей

Высокие показатели тестов стали возможны благодаря следующим особенностям моделей o3 и o3-mini:

1. Способность к рассуждению. Модели могут разбивать задачи на этапы и объяснять свои решения.

2. Эффективная проверка ответов. Это позволяет минимизировать ошибки и избежать «галлюцинаций».

3. Три уровня вычислительной мощности (в модели o3-mini), что делает её универсальным инструментом для различных задач.

Однако стоит отметить, что процесс проверки фактов перед выдачей ответа может занимать от нескольких секунд до нескольких минут, в зависимости от сложности запроса. Кроме того, задержки связаны с необходимостью проверки запросов на соответствие политике безопасности OpenAI.

Когда ожидать запуск?

Первая версия модели OpenAI o3 планируется к выпуску в конце января 2025 года. О дате выхода o3-mini пока не сообщается.

Эти новые модели OpenAI о3 и o3-mini обещают стать мощным инструментом для решения сложных задач и повышения эффективности в различных областях. Следите за обновлениями, чтобы не пропустить их официальный релиз.

AI Новости

OpenAI представила ИИ-модели o3 и o3-mini

Похожие новости