Что лучше: DeepSeek или ChatGPT? Сравнение ИИ-моделей DeepSeek-R1 и OpenAI o1

Сравним DeepSeek-R1 и OpenAI o1: работа с кодом, скорость и качество генерации текста, цена, доступность.

Этой зимой DeepSeek представила DeepSeek-R1 — новую модель, способную вести рассуждения прямо в процессе генерации. Это важный шаг вперед, который подтверждает стремление компании конкурировать с OpenAI и их o1, предлагая мощную и открытую альтернативу.

Что лучше: DeepSeek или ChatGPT? Сравнение ИИ-моделей DeepSeek-R1 и OpenAI o1

В этом обзоре мы детально сравним DeepSeek-R1 и OpenAI o1, разберем их ключевые отличия.

Что такое DeepSeek-R1 и OpenAI o1

DeepSeek — это ИИ-чат-бот от китайских разработчиков, который уже успел получить прозвище «убийца ChatGPT». И это неудивительно: платформа предлагает мощные возможности на уровне конкурентов, но при этом остается бесплатной и позиционируется как открытая платформа под open-source лицензией MIT.

В основе DeepSeek лежит архитектура Mixture-of-Experts (MoE), которая позволяет эффективно распределять вычислительные ресурсы между различными экспертами в модели, обеспечивая высокую производительность при решении сложных задач и работе с разнообразными запросами.

20 января 2025 года DeepSeek представила свою последнюю модель DeepSeek-R1, заявив в своей отчетности, что она сопоставима по функционалу и производительности с технологиями OpenAI, но при этом значительно дешевле в производстве. Это позволило компании быстро привлечь внимание как разработчиков, так и крупных технологических игроков. Такие заявления заметно потрепали западный рынок: акции американских IT-компаний начали падать, а рыночная стоимость NVIDIA и вовсе сократилась на миллиарды долларов (-17,8% за один день). Успех китайского стартапа поставил под сомнение лидерство США в сфере искусственного интеллекта, которое ранее считалось бесспорным.

Читайте более подробный обзор на DeepSeek-R1 в нашей статье.

ChatGPT — это ИИ-чат-бот, разработанный компанией OpenAI, который был впервые представлен в ноябре 2022 года и сразу стал настоящим прорывом в сфере ИИ.

В основе ChatGPT лежит архитектура Generative Pre-trained Transformer (GPT), которая использует механизмы трансформеров для обработки и генерации текста. Эта модель обучается на огромных объемах данных, что позволяет ей эффективно работать с естественным языком и решать разнообразные задачи.

В сентябре 2024 года вышла o1 — первая модель, которая представила формат, при котором ИИ не только генерирует ответы, но и показывает пользователю ход своих рассуждений в процессе генерации.

ChatGPT — это проприетарное решение. Для доступа, например, к o1, требуется платная подписка от $20. Более ранние версии же доступны бесплатно.

Сравнение производительности в тестах

DeepSeek-R1 и OpenAI-o1 демонстрируют схожие результаты в тестах на производительность. OpenAI-o1 немного лучше справляется с задачами обработки естественного языка, но DeepSeek-R1 выигрывает в математических задачах. Разница в производительности незначительна, поэтому обе модели подходят для решения сложных задач.

Что лучше: DeepSeek или ChatGPT? Сравнение ИИ-моделей DeepSeek-R1 и OpenAI o1
Сравнение моделей DeepSeek и OpenAI в тестах. Фото: Github, DeepSeek benchmark.

Показатели и тесты, на которых основывается оценка производительности моделей:

Общий уровень рассуждений GPQA Diamond

Бенчмарк GPQA Diamond ставит перед ИИ сложные многозадачные проблемы, требующие глубокого понимания и контекстуального восприятия. Он оценивает способность модели решать комплексные задачи, охватывающие различные области знаний.

  • DeepSeek-R1: 71,5%
  • OpenAI o1: 75,7%

Математические способности MATH-500

Бенчмарк MATH-500 представляет сложные математические задачи, требующие логического мышления и глубокого математического анализа. Этот тест имитирует уровень решения проблем, типичных для опытных математиков, и является хорошим показателем математических способностей ИИ.

  • DeepSeek-R1: 97,3%
  • OpenAI o1: 96,4%

Программирование Codeforces

Codeforces — это платформа для оценки программирования, где ИИ решает задачи, требующие написания эффективного и точного кода в условиях, приближенных к реальной разработке программного обеспечения.

  • DeepSeek-R1: 96,3%
  • OpenAI o1: 96,6%

Программирование и работа с кодом

ChatGPT — мощный инструмент для разработчиков, поддерживающий множество языков программирования. Он помогает писать код, объяснять алгоритмы и находить ошибки. В 2025 году была добавлена модель OpenAI o1 режим глубокого рассуждения, позволяющий пошагово решать сложные задачи. Однако бесплатная версия ограничена по функционалу, что требует перехода на платные подписки для полного доступа.

DeepSeek изначально был ориентирован на IT-специалистов и программистов, предоставляя открытый исходный код и бесплатный доступ. Большая часть сравнений в сети указывает на то, что в тестах на Python, Swift и Go DeepSeek-R1 чаще всего превосходит o1 по читаемости и описанию. Но в решении сложных задачах R1 местами уступает, что немного удивительно, учитывая некоторое преимущество в работе с математематическими задачами (MATH-500) и сравнительно небольшую разницей в показателях программирования (Codeforces) (+0,3% в пользу o1).

Скорость и качество генерации текста

OpenAI o1 демонстрирует более высокий уровень стилистической разнообразности и глубины текста, особенно в творческих задачах, таких как написание эссе или диалогов. Он лучше справляется с многозадачными рассуждениями и предоставляет более логичные и последовательные ответы, что делает его более подходящим для задач, где важен стиль и контекст.

Хотя DeepSeek-R1 также демонстрирует хорошее качество текстов, в творческих и сложных задачах его тексты могут быть проще и менее изящными. Это подтверждается и результатами на бенчмарке GPQA Diamond, где DeepSeek-R1 получил 71,5%, а OpenAI o1 — 75,7% (+4,2% в пользу o1).

Галлюцинации у обеих моделей случаются достаточно редко, но все зависит от сложности запроса. Вопросы с грамматикой и пунктуацией обычно не вызывают проблем в обеих моделях, они демонстрируют высокий уровень точности в этих аспектах.

Что касается фактчекинга, то качество его работы примерно одинаковое, хотя есть небольшая разница в датах отсечки (cut-off date). Дата отсечки указывает, до какого момента нейросеть была обучена на актуальных данных. У DeepSeek-R1 данные обновлены примерно до октября 2023 года, а у OpenAI o1 — до лета 2023 года. Всё, что происходит после этой даты, остаётся за пределами её знаний, если только не предоставляется пользователем в рамках текущего диалога.

Скорость генерации — ещё один ключевой фактор, который стоит учитывать. Благодаря архитектуре MoE (Mixture of Experts), DeepSeek-R1 демонстрирует более высокую скорость обработки запросов. Это особенно заметно при массовой генерации текстов или работе в условиях ограниченных ресурсов. OpenAI o1, в свою очередь, требует больше времени для анализа и обработки данных, однако его результаты часто оправдывают ожидания в задачах, где на первый план выходят глубина и качество текста.

Цена

DeepSeek предлагает полностью бесплатный доступ к чат-боту с R1 через веб-браузер и мобильные приложения для iOS и Android. Открытый исходный код позволяет адаптировать модель под различные нужды, что делает DeepSeek привлекательным для стартапов и образовательных проектов.

ChatGPT тоже имеет бесплатную базовую версию с ограничениями по количеству запросов. Однако для доступа к o1 требуется подписка стоимостью от $20 до $200 в месяц. Тут всё очевидно.

Что лучше: DeepSeek или ChatGPT? Сравнение ИИ-моделей DeepSeek-R1 и OpenAI o1

А что с API? В таблице ниже представлены тарифы на ввод и вывод токенов, включая скидочные периоды. Для расчётов использован курс: 1 токен = 100 символов.

Параметрdeepseek-chat (Стандарт)deepseek-chat (Скидка)deepseek-reasoner (Стандарт)deepseek-reasoner (Скидка)
Лучшее время (UTC)16:30–00:3016:30–00:3016:30–00:3016:30–00:30
Лучшее время (Москва, UTC+3)19:30–03:3019:30–03:3019:30–03:3019:30–03:30
1M токенов ввода (руб)73.5143,5
1M токенов вывода (руб)1105521955
1M символов ввода (руб)1,5550,7783,1110,778
1M символов вывода (руб)24,44412,22248,66712,222
Страниц A4 на выходе (1M токенов)2500250025002500

Практический пример: если воспользоваться DeepSeek в часы скидок, то генерация 2500 страниц формата A4 (что эквивалентно примерно двум трилогиям «Властелина колец») обойдётся в 50 рублей. Однако точное количество токенов, используемых при вводе и выводе, заранее предсказать невозможно.

Стоимость же токенов API OpenAI-o1 в разы дороже.

  • Стоимость кэшированного ввода: $7.50 за 1 миллион токенов
    Кэшированный ввод — это текст, который модель уже обрабатывала, что позволяет эффективно обрабатывать повторяющийся контент и снижать затраты. Это особенно полезно для приложений, которые часто обрабатывают схожий контент или хранят историю разговоров.

  • Стоимость ввода: $15.00 за 1 миллион токенов
    Стоимость ввода охватывает обработку нового, уникального текста, который отправляется в модель для анализа или генерации ответа. Это включает пользовательские запросы, документы для анализа или любой новый контент, который требует внимания модели.

  • Стоимость вывода: $60.00 за 1 миллион токенов
    Стоимость вывода касается текста, сгенерированного моделью в ответ на запросы. Это может быть как простые ответы, так и сложные анализы, генерация кода или творческий контент.

Генерация изображений

Ни DeepSeek, ни ChatGPT не поддерживают генерацию изображений.

Поддержка языков

Обе модели — OpenAI o1 и DeepSeek-R1 — поддерживают русский и английский языки с отличной точностью. Однако o1 превосходит R1 благодаря поддержке 50+ языков, что позволяет достигать высокой точности даже для редких языков.

В то время как DeepSeek-R1 поддерживает 20+ языков, включая китайский, который обрабатывается значительно лучше, его возможности на менее распространённых языках могут быть ограничены. Это делает OpenAI куда более универсальным инструментом для глобального использования, предлагающим стабильность и точность на широком спектре языков.

Доступность

В России OpenAI недоступен для пользователей напрямую из-за ограничений, связанных с санкциями и политикой компании. Это создаёт сложности для местных пользователей, которые вынуждены искать альтернативные решения для доступа к платформе, что может снижать её эффективность и удобство использования.

DeepSeek, напротив, в России работает без серьёзных ограничений, что делает его более доступным и удобным решением для пользователей. Интересно, что в Италии ситуация обратная: DeepSeek заблокирован властями, в то время как OpenAI остаётся доступным. Это подчеркивает, что доступность технологий сильно зависит от региональной политики и законодательства.

Цензура

Цензура DeepSeek вызывает множество вопросов. DeepSeek использует строгую цензуру, блокируя или изменяя ответы на политически чувствительные темы для политики КНР, такие как события на площади Тяньаньмэнь и Культурная революция. Ответы часто уклоняются или ссылаются на технические проблемы. Аудиторы отметили, что в ответ на три из десяти ложных нарративов DeepSeek сообщал позицию китайских властей, хотя сама новость не имела отношения к Китаю, а запрос не требовал их мнения.

В отличие от этого, OpenAI применяет более мягкую цензуру, ограничиваясь исключением дезинформации, насилия и ненависти. Она не блокирует целые категории тем, оставляя большую свободу в обсуждении спорных вопросов и политически чувствительных тем.

Тем не менее, и в DeepSeek, и в OpenAI механизм цензурирования реализован достаточно криво. Каждую из платформ легко запутать и добиться исключения цензуры, «заговорив» их, что ставит под сомнение надежность и последовательность их работы.

Что же лучше: DeepSeek или ChatGPT?

Определённого лидера среди моделей DeepSeek-R1 и OpenAI-o1 нет — их производительность сопоставима, но каждая из них имеет свои сильные стороны.

DeepSeek-R1 демонстрирует лучшие результаты в решении математических задач и генерации кода, причём делает это в разы быстрее. Однако в случае особо сложных вычислений OpenAI-o1 местами показывает более точные результаты.

OpenAI-o1, в свою очередь, отличается в лучшую сторону в обработке естественного языка, особенно при работе с творческими запросами и сложными многозадачными текстами, требующими глубокого контекстного анализа.

Если рассматривать цену и доступность, то DeepSeek-R1 предлагает аналогичную производительность, но за значительно меньшие деньги. Это делает его привлекательным выбором для пользователей и компаний, которые ищут оптимальное соотношение мощности и стоимости. Кроме того, DeepSeek-R1, в отличие от OpenAI, доступен в России без ограничений, что тоже является важным преимуществом.

Оцените статью
( Пока оценок нет )
Поделиться с друзьями
IaaS SaaS PaaS
Добавить комментарий