В статье сравним современные LLM-модели для логического рассуждения (reasoning) - DeepSeek R1 (open-source от DeepSeek), OpenAI O1 (базовая reasoning-модель), OpenAI O1 Pro Mode (улучшенная версия с повышенной мощностью) и OpenAI O3-mini (новая облегчённая модель), Anthropic Claude Sonnet 3.7
Модели анализируются по качеству и точности выводов, скорости работы, стоимости использования, архитектурным особенностям, доступности, областям применения и сильным сторонам.
Отчёт включает сравнительную таблицу и рекомендации по выбору оптимальной модели для разных пользователей.
Модели анализируются по качеству и точности выводов, скорости работы, стоимости использования, архитектурным особенностям, доступности, областям применения и сильным сторонам.
Отчёт включает сравнительную таблицу и рекомендации по выбору оптимальной модели для разных пользователей.
Качество и точность рассуждений
DeepSeek R1
Модель DeepSeek R1 зарекомендовала себя как первая открытая модель, способная конкурировать по качеству рассуждений с закрытыми решениями от OpenAI. По результатам ряда бенчмарков её показатели сопоставимы с OpenAI O1 – например, разница в успешности решения математических задач между R1 и O1 минимальна (97,3% против 96,4%, соответственно)
Это означает, что R1 демонстрирует высокий уровень логического вывода и часто даёт правильные ответы на сложные вопросы. Пользователи отмечают, что по многим тестам R1 близок к O1.
Однако в отдельных узких задачах O1 всё же может иметь преимущество. В целом DeepSeek R1 обеспечивает очень высокое качество рассуждений для своей категории, особенно учитывая, что это открытая модель.


OpenAI O1
Модель OpenAI O1 стала своего рода эталоном качества в задачах рассуждения. Она изначально разрабатывалась для сложных многошаговых рассуждений и демонстрирует высочайшую точность на разнообразных задачах. O1 обычно строит хорошо структурированные, последовательные логические цепочки в ответах, формулируя выводы строго и обоснованно. В оценках сложных логических задач OpenAI O1, как правило, лидирует: например, в одном сравнительном анализе O1 ответила правильно на 18 из 27 вопросов, тогда как DeepSeek R1 — на 11. То есть O1 примерно на 26% превзошла R1 в том тесте, хотя в других бенчмарках разница менее заметна. Благодаря обширным обучающим данным и тонкой настройке под цепочку размышлени, OpenAI O1 обладает надёжностью и точностью в выводах на уровне передовых моделей.

OpenAI O1 Pro Mode
Режим O1 Pro доступен экслюзивно в чат гпт от OpenAI при оплате подписки за 200$ в месяц. Представляет собой улучшенную версию модели O1, рассчитанную на максимально сложные задачи. Архитектурно это тот же базовый модельный каркас, но с использованием дополнительных вычислительных ресурсов и алгоритмов для углубленного “обдумывания” вопросов. Практически это выражается в ещё более точных и продуманных ответах на самые трудные проблемы

Финальный ответ модели:

OpenAI O3-mini
Модель O3-mini – новейшая в семействе reasoning-моделей OpenAI – ориентирована на то, чтобы обеспечить высокое качество вывода при значительно меньших размерах модели. Несмотря на приставку “mini”, по ряду показателей она близка к O1. В частности, в задачах математики и программирования O3-mini (в высоком режиме) достигает практически уровня O1.
В математических тестах O3-mini (high) показывает результаты на одном уровне с O1 и лишь немного опережает DeepSeek R1. Тем не менее, O3-mini может немного уступать O1/O1-Pro на крайне сложных или нестандартных задачах, поскольку модель меньше по масштабу. В целом же точность и логическая последовательность O3-mini впечатляют для её класса – она уверенно решает логические головоломки, математические примеры и задачи на понимание кода, иногда даже удивляя экспертов тем, что достигает правильных ответов на вопросы вне прямых знаний из обучающих данных.

Промежуточные выводы
DeepSeek R1 чуть слабее закрытых флагманов в отдельных случаях, но в целом держится на одном уровне с ними и поразителен тем, что будучи открытой моделью, показывает выдающийся уровень рассуждений.
При этом субъективное мнение редакции в том, что основываясь только на вопросах о расходе топлива автомобиля при скорости 180 км/ч ответы моделей o3-mini, DeepSeek, и o1 без Pro Mode наиболее близки к реальным замерам.
Скорость работы
Скорость генерации ответов у DeepSeek R1 во многом зависит от используемого оборудования, поскольку модель открытая и может запускаться локально. Однако благодаря относительно оптимизированной архитектуре и умеренному размеру, R1 способна отвечать довольно быстро. В некоторых тестах она даже превзошла крупные модели OpenAI: так, при решении определённых задач R1 выдала ответ примерно за 0,5 секунды, тогда как OpenAI O1 потребовалось ~2 секунды.
То есть DeepSeek R1 примерно в 4 раза быстрее на этом примере. Конечно, скорость на практике будет зависеть от конкретной реализации и ресурсов (GPU/TPU). В целом же DeepSeek R1 отличается высокой эффективностью, что показывает мощь оптимизации – небольшая модель, обученная специальным образом, может работать очень шустро. Это делает R1 привлекательным выбором для приложений, где задержка критична, при условии что у вас есть возможность её развернуть самостоятельно.
Базовая модель O1 довольно крупная и выполняет много вычислений для цепочки рассуждений, поэтому её скорость генерации нельзя назвать молниеносной. В интерактивном режиме (например, через ChatGPT) ответы O1 приходят с заметной задержкой по сравнению с более “лёгкими” моделями. В приведённом выше примере O1 потратила около 2 секунд, в то время как облегчённый R1 справился быстрее. Тем не менее, скорость O1 остаётся приемлемой для большинства офлайн-задач – обычно ответ генерируется за несколько секунд даже на сложный запрос, что вполне достаточно в сценариях анализа текста, написания кода и т.д. Следует учитывать, что O1 всегда стремится “подумать” достаточно глубоко, поэтому она жертвует временем ради качества. Таким образом, по быстродействию O1 уступает более оптимизированной O3-mini и компактному R1, но выигрывает в глубине ответа.
Одним из основных преимуществ O3-mini является высокая скорость работы. Модель специально разработана с упором на эффективность: она меньше по размеру, и её архитектура оптимизирована для быстрого вывода. В среде ChatGPT O3-mini пришёл на смену более тяжёлой O1-mini именно благодаря существенно меньшим задержкам. Пользователи отмечают, что O3-mini отвечает практически в реальном времени на многие запросы.
Области применения и сильные стороны
Благодаря своей фокусировке на логическом выводе, DeepSeek R1 отлично подходит для задач, требующих тщательного анализа, построения рассуждений и выводов. Она особенно сильна в решении логических головоломок, сложных загадок, задач типа «что будет, если...», где нужно несколько шагов размышления. Также R1 демонстрирует высокие результаты в математических рассуждениях и программировании, практически на уровне закрытой модели O1.
Это делает её полезной для автоматизации STEM-задач: проверки математических доказательств, поиска ошибок в коде, объяснения алгоритмов. Ещё одна сильная сторона DeepSeek R1 – возможность полной кастомизации. Так как модель открытая, её можно дообучить под специфические нужды или интегрировать в собственные приложения. Например, R1 может стать “мозгом” автономного агента, принимающего решения в реальном времени (благодаря RL-навыкам).
Уже предпринимаются попытки на основе R1 создавать локальных ассистентов, которые могут работать без подключения к интернету, что ценится в вопросах приватности. Таким образом, DeepSeek R1 оптимальна для исследователей и разработчиков, которым нужен сильный логический ИИ под полным контролем. В сценариях обучения или хобби-проектов R1 тоже привлекателен, так как бесплатен. Резюмируя, сильные стороны R1: логика, математика, код, контроль и автономность. Она несколько уступает коммерческим моделям в общих знаниях и генерации красивого связного текста (например, для творческих задач), но в строго интеллектуальных упражнениях проявляет себя блестяще
Чат гпт O1 – это универсальный флагман, поэтому область её применения крайне широка. Её сильнейшая сторона – сложные многоэтапные рассуждения с развернутым обоснованием. Там, где требуется не только дать ответ, но и объяснить ход решения (например, решить математическую задачу “в столбик”, расписав все шаги), O1 справляется прекрасно. Она формулирует решения ясно и формально, что ценно для образовательных целей или для проверяемости ответа.
OpenAI O1 показывает отличные результаты в задачах математики, логики, программирования, сопоставимые с лучшими моделями на рынке
Кроме того, благодаря огромной базе знаний (унаследованной от предшественников типа GPT-4), O1 хорошо ориентируется и в других областях: право, естественные науки, языкознание. Поэтому её можно применять для аналитических отчётов, резюмирования технических статей с пониманием сути, помощи в решении инженерных задач. O1 также эффективна в генерации кода и отладке – она способна не только написать фрагмент программы, но и объяснить, почему так нужно. Сильная сторона O1 – стабильность и надёжность: будучи продуктом OpenAI, она проходит строгие фильтры качества и безопасности, снижая риск бредогенерации. Таким образом, OpenAI O1 оптимальна для профессионального использования, когда требуется сочетание высокого уровня интеллекта и широкой эрудиции.
Примеры: консультативные системы для врачей (помогает в диагностике, анализе симптомов), помощники для юристов (строит правовые аргументы), научные ассистенты (рассуждает над гипотезами). В творческих задачах O1 тоже преуспевает, хотя изначально заточена на логику – её можно применять для сложного сюжетостроения, где нужна непротиворечивость деталей. В целом, сильные стороны O1: высшее качество и широта применения – эта модель хороша практически во всём, где нужно понимание и рассуждение.
Примеры: консультативные системы для врачей (помогает в диагностике, анализе симптомов), помощники для юристов (строит правовые аргументы), научные ассистенты (рассуждает над гипотезами). В творческих задачах O1 тоже преуспевает, хотя изначально заточена на логику – её можно применять для сложного сюжетостроения, где нужна непротиворечивость деталей. В целом, сильные стороны O1: высшее качество и широта применения – эта модель хороша практически во всём, где нужно понимание и рассуждение.
OpenAI O3-mini: Модель O3-mini несколько более специализирована по своей природе. Её выдающаяся черта – превосходство в задачах STEM (наука, технология, инженерия, математика) и кодинга.
O3-mini отлично справляется с генерацией и объяснением кода, поэтому её часто используют как помощника программиста. Например, она может быстро найти логическую ошибку в функции или предложить оптимизацию алгоритма. Также O3-mini славится умением решать математические задачки и головоломки, разбивая их на шаги и понятно объясняя ход решения – в этом проявляется её цепочка мыслей. Благодаря тому, что модель бесплатна и быстра, её идеальная область применения – образование и самообучение. Студенты могут задавать ей сложные вопросы по математике, физике, получать поэтапные подсказки и решения, фактически как от репетитора. Некоторые пользователи отмечают, что O3-mini в роли наставника терпеливо ведет их через задачу, что ценно при обучении новым концепциям. Кроме того, O3-mini хорошо подходит для повседневных задач, требующих логики, например: планирование расписания (решая ограничения как задачку), принятие решений с перечислением плюсов/минусов, анализ небольших наборов данных и т.д.
Сравнительная таблица моделей
Лидеры по каждому критерию
Качество рассуждений. OpenAI O1 – обеспечивает наивысшую точность и глубину вывода среди всех моделей. Если критичны безупречные рассуждения, O1-Pro будет лучшим выбором. (На втором месте – O1 как наиболее близкий аналог по качеству.)
Скорость работы. OpenAI O3-mini – явный лидер по скорости ответа благодаря своей оптимизированной архитектуре. Она выдаёт результаты почти мгновенно, обгоняя более тяжёлые модели. DeepSeek R1 также очень быстр при локальном запуске, но O3-mini проще получить с минимальной задержкой.
Архитектура (уникальные черты). OpenAI O3-mini выделяется регулируемым уровнем рассуждения и эффективностью, а DeepSeek R1 – инновационным использованием RL для рассуждений. O1-Pro примечателен дополнительными вычислительными шагами. Но в целом “лучшей” архитектуры как таковой нет – каждая оптимизирована под свои цели (O3-mini и R1 – под эффективность, O1 – под универсальность, O1-Pro – под предельную точность).
Доступность. OpenAI O3-mini / DeepSeek R1. По совокупности скорость-цена-качество эти модели предоставляют наилучший опыт пользователю.
Доступ к моделям для рассуждений из России
Официальный доступ к сервисам OpenAI из РФ затруднён из-за геоблокировок. Существуют ограничения при попытке воспользоваться передовыми языковыми моделями, такими как OpenAI o1, OpenAI o3-mini и продвинутыми режимами ChatGPT /Pro Mode
В то же время альтернативы, например модель DeepSeek R1 доступны, например, по ссылке на официальный веб-сайт.
Российским пользователям при его создании приходится преодолевать несколько барьеров:
- Поддерживаемая страна аккаунта. При регистрации OpenAI запрашивает страну проживания/номера телефона, и Россия не входит в число допустимых вариантов.
- Фактически, российский номер телефона не подходит для верификации. Ранее OpenAI требовала обязательного подтверждения телефона при создании учётной записи ChatGPT. В конце 2023 года политику немного изменили – для базового веб-доступа к ChatGPT номер может не требоваться, однако для доступа к API телефонная верификация осталась обязательной
- Следовательно, чтобы зарегистрироваться, находясь в РФ, придётся использовать номер другого государства. Обычно пользователи решают это либо через друзей/родственников за рубежом, либо покупая виртуальные номера. Существуют онлайн-сервисы, предоставляющие временные SMS-номера разных стран для регистрации. Важно выбирать номер из страны, поддерживаемой OpenAI (например, Казахстан, Турция, ЕС и др.I). После получения кода подтверждения аккаунт привязывается к этому иностранному номеру.
- Подписка ChatGPT Plus ($20/мес) или Pro ($200/мес): Даже после создания аккаунта возникают сложности с платной подпиской.
Официально оформить ChatGPT Plus из России невозможно, потому что:
Региональные ограничения – на странице подписки нужно подтвердить страну и адрес оплаты. Россия в выпадающем списке стран отсутствует (как неподдерживаемая страна).
Оплата – OpenAI принимает платежи международными картами (Visa, Mastercard) и через Stripe. Из-за санкций большинство российских банковских карт за рубежом не работают. Также недоступны PayPal и другие популярные методы для резидентов РФ. Таким образом, для оплаты нужна банковская карта, выпущенная за пределами РФ. Некоторые россияне, имеющие счета/карты в зарубежных банках, могут использовать их. Альтернативный путь – виртуальные банковские карты иностранных финтех-сервисов. Однако не все из них работают: платёжный шлюз может отклонять транзакцию, если заподозрит несоответствие страны аккаунта и страны выпуска карты.
Адрес и IP – при покупке может учитываться IP-адрес (он должен совпадать со страной оплаты) и фактический биллинг-адрес держателя карты. Поэтому практически всегда приходится совершать покупку из-под VPN, выбрав ту же страну, что и банк карты, а также указывать соответствующий адрес. Например, если используется виртуальная карта из Казахстана, следует подключиться через казахстанский VPN-сервер и указать казахстанский адрес проживания.
Региональные ограничения – на странице подписки нужно подтвердить страну и адрес оплаты. Россия в выпадающем списке стран отсутствует (как неподдерживаемая страна).
Оплата – OpenAI принимает платежи международными картами (Visa, Mastercard) и через Stripe. Из-за санкций большинство российских банковских карт за рубежом не работают. Также недоступны PayPal и другие популярные методы для резидентов РФ. Таким образом, для оплаты нужна банковская карта, выпущенная за пределами РФ. Некоторые россияне, имеющие счета/карты в зарубежных банках, могут использовать их. Альтернативный путь – виртуальные банковские карты иностранных финтех-сервисов. Однако не все из них работают: платёжный шлюз может отклонять транзакцию, если заподозрит несоответствие страны аккаунта и страны выпуска карты.
Адрес и IP – при покупке может учитываться IP-адрес (он должен совпадать со страной оплаты) и фактический биллинг-адрес держателя карты. Поэтому практически всегда приходится совершать покупку из-под VPN, выбрав ту же страну, что и банк карты, а также указывать соответствующий адрес. Например, если используется виртуальная карта из Казахстана, следует подключиться через казахстанский VPN-сервер и указать казахстанский адрес проживания.
Доступ к чат гпт от AI Academy
AI Academy предоставляет доступ ко всем рассуждательным моделям: DeepSeek R1, чат гпт o1, o3-mini в рамках одной единной подписки и при этом работает без VPN, а платить можно картами выпущенными в России.