Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

О DeepSeek, которую уже называют «убийцей ChatGPT», сегодня слышал каждый. Откуда взялось столько шума?

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

Впервые китайские разработчики громко заявили о себе в декабре 2024 года, выпустив модель DeepSeek-V3. Первые тесты показали, что V3 способна конкурировать с ведущими проприетарными решениями и значительно лучше справляется с логическими и математическими задачами. По данным DeepSeek, их модели демонстрируют уровень производительности, сравнимый с GPT-4o и Claude-3.5-Sonnet, но при этом предлагают пользователям куда более выгодное соотношение цены и качества.

Недавно DeepSeek представила свои новые модели — R1 и R1-Zero (см. подробный обзор). Они основаны на V3, однако способны не только генерировать текст, но и решать сложные задачи, выстраивая логическую цепочку рассуждений.

В этой статье мы разберемся подробнее, что представляет из себя DeepSeek. Как установить, запустить, как и для чего использовать — далее.

Что такое DeepSeek

DeepSeek — это ИИ-чат-бот с открытым исходным кодом (MIT) от одноименной компании разработчиков. DeepSeek была основана в июле 2023 года Лянем Вэньфэном в Ханчжоу, Китай. Компания является дочерним проектом китайского хедж-фонда High-Flyer, который финансирует её. Лян Вэньфэн, соучредитель High-Flyer, одновременно занимает пост генерального директора обеих компаний.

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

Сообщается, что он накопил запас чипов Nvidia A100, которые с недавнего времени запрещены для экспорта в Китай. Эксперты считают, что эта коллекция, оценочная численность которой составляет около 50 000 чипов, сыграла ключевую роль в запуске DeepSeek. Он сочетал чипы высокого класса с более дешевыми и низкокачественными моделями, которые все еще были доступны для импорта в Китай.

В интервью с The China Academy, данном в июле 2024 года, Лян выразил удивление по поводу реакции на предыдущую версию своей модели ИИ.

«Мы не ожидали, что цена станет такой чувствительной темой», — сказал он. «Мы просто шли своим путем, рассчитывали затраты и устанавливаем цены соответствующим образом».

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
Основатель DeepSeek Лян Вэньфэн. Фото: CCTV

DeepSeek впервые привлекла к себе внимание 26 декабря 2024 года — после релиза модели DeepSeek-V3. Модель сразу подняла мировой шум — DeepSeek в считанные дни была признана пользователями «китайской копией ChatGPT», «убийцей ChatGPT». Также посыпались и недовольные комментарии — вопросы к безопасности, бесконечные ошибки и ограничения в доступе, интерфейс и функционал «слизан» с ChatGPT.

Ключевое преимущество моделей DeepSeek — архитектура «mixture of experts» (MoE). Она позволяет обрабатывать запросы быстрее и дешевле, чем привычные нам модели. DeepSeek выбирает нужные экспертные блоки для решения конкретных задач, что ускоряет работу и снижает затраты на вычисления. Также DeepSeek доступен без ограничений в России.

В последние месяцы всё больше внимания привлекают «reasoning-модели», которые не просто генерируют текст, а решают сложные задачи, выстраивая логическую цепочку рассуждений (chain-of-thought). Такой подход впервые продемонстрировала модель OpenAI o1, подробности о которой до сих пор остаются неизвестными. В ответ команда DeepSeek представила свои MoE-модели — DeepSeek-R1 и R1-Zero, которые привлекли внимание благодаря своей способности эффективно рассуждать и решать задачи, требующие логического мышления и самопроверки.

С технической точки зрения DeepSeek-R1 построена на базе фундаментальной модели DeepSeek-V3. Затем модель доработали, используя комбинацию контролируемой тонкой настройки (SFT) на высококачественных данных, размеченных людьми, и обучения с подкреплением (RL).

Как релиз DeepSeek-R1 повлиял на рынок

Релиз DeepSeek-R1 состоялся 20 января 2025 года. Уже спустя неделю акции ведущих технологических компаний, на примере NVIDIA, рухнули на 17,8% за один день. Причиной стал не сам факт релиза новой модели, а данные из отчета DeepSeek, которые раскрыли, что при использовании лишь 2048 чипов NVIDIA, создание DeepSeek обошлось компании всего в $5,6 миллионов (ChatGPT-4o от OpenAI — $100 миллионов).

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
Влияние отчета DeepSeek на IT-рынок. Зафиксировано падение стоимости акций на 7%-28%.

Последствия этого заявления оказались серьзными. Потребность в энергоемкой инфраструктуре оказалась не такой срочной, как предполагалось ранее, что вызвало значительные изменения в отраслях, связанных с производством энергии, особенно в ядерной энергетике.

С учетом того, что ИИ больше не требует такого количества графических процессоров и не нуждается в огромных объемах электроэнергии, компании вроде Vistra и Constellation, которые рассчитывали на рост спроса на энергию из-за ИИ, теперь вынуждены пересматривать свои стратегии.

Как установить (развернуть) DeepSeek

Существует несколько способов установить DeepSeek:

  1. расширение для браузера,
  2. мобильное приложение,
  3. интеграция через API,
  4. развернуть на своем ПК.

В отличии от ChatGPT, DeepSeek — решение с открытым исходным кодом, его можно скачать прямо с GitHub и развернуть на своём компьютере, даже без подключения к Интернету. Это более продвинутый способ, вернемся к нему позже.

Расширение для браузера DeepSeek AI

Переходить на официальный сайт DeepSeek каждый раз может быть неудобно. Решение — установить расширение для браузера Chrome — DeepSeek AI по этой ссылке.

Расширение для браузера — это неофициальное расширение, использующее API DeepSeek. Оно улучшает процесс веб-серфинга, позволяя оперативно получать ответы от ИИ прямо при выделении текста.

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
Интерфейс браузерного расширения DeepSeek AI минималистичен и удобен — во многом напоминает ChatGPT.

Интересно, что если основной сайт DeepSeek не работает или зависает (а это случается очень часто), расширение продолжит функционировать, обеспечивая бесперебойную работу.

Расширение устанавливается всего за пару кликов:

  1. Cкачайте расширение DeepSeek AI по ссылке.Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
  2. Активируйте расширение следующим образом:Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

Мобильное приложение DeepSeek (App Store, GooglePlay)

Очень простой и популярный способ — скачать приложение на ваш мобильный телефон. Настолько популярный, что в начале февраля 2025 года приложение DeepSeek возглавило чарты загрузок Apple и Google, обогнав даже ChatGPT.

Скачать DeepSeek на iOS можно по этой ссылке в AppStore.

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

DeepSeek для Android доступен по этой ссылке в GooglePlay.

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

С Android иногда возникают проблемы. Если не получается скачать приложение в Google Play, вот еще один рабочий способ:

  1. Перейдите по ссылке или QR-коду c официального сайта.Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
  2. Выберите «Alternative Download Methods»:Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
  3. Скачайте APK DeepSeek по кнопке «Download APK File»:Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
  4. Установите скачанный APK-файл DeepSeek. Если устройство заблокирует установку, ссылаясь на неизвестный источник, следует вручную разрешить установку приложений из неизвестных источников.Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

DeepSeek API

Если вам нужен доступ к DeepSeek в собственных проектах, самый удобный вариант — подключение через API. Это позволит интегрировать нейросеть в ботов, сайты, приложения и другие сервисы.

Цены API DeepSeek заметно ниже, чем у Open AI:

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

Подробно о настройке API и соответствующей документации читайте здесь: https://api-docs.deepseek.com/api/deepseek-api.

Как развернуть DeepSeek на ПК

Наконец, мы переходим к локальному развертыванию. Давайте рассмотрим, что она может предложить:

Полная конфиденциальность — все запросы обрабатываются локально, без отправки данных в Интернет.

Стабильная работа — веб-версии и приложения DeepSeek часто перегружены и могут зависать, а локальная копия работает без сбоев.

Доступ без Интернета — можно пользоваться чат-ботом в любой точке мира без доступа к Интернету.

Бесплатно навсегда — если DeepSeek введёт платную подписку, установленная модель продолжит работать бесплатно.

На примере DeepSeek-R1-Distill разберём, как проще всего установить и развернуть эту модель локально на ПК. Если у вас есть базовые знания в области ИИ и программного обеспечения, этот гайд поможет вам установить модель двумя способами: с помощью LM Studio (простого и удобного инструмента) или Ollama (более продвинутого подхода с использованием командной строки).

DeepSeek-R1-Distill — это упрощённая версии полноразмерной модели DeepSeek-R1. Подробнее о ней рассказали в статье.

С помощью LM Studio

LM Studio — это графический инструмент, который позволяет загружать и запускать модели ИИ без необходимости писать код. Он самый простой, с него и начнем.

  1. Скачайте LM Studio с официального сайта:Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
    Установите инструмент и его запустите.
  2. Откройте раздел «Discover»:Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
  3. Найдите DeepSeek-R1. Выберите подходящую версию и скачайте ее. Llama 8B подойдет для выполнения задач, требующих большого объема вычислений, сложных сценариев использования. Qwen 7B будет отличаться немного более легким и быстрым функционалом, требуя меньших ресурсов.Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
  4. После загрузки перейдите на вкладку «Local Models» и нажмите «Run».
  5. Готово! Модель размещена. Теперь можно общаться с DeepSeek даже без подключения к интернету.

С помощью Ollama

Ollama — это инструмент командной строки, который позволяет загружать и запускать модели ИИ с большей гибкостью в настройке.

  1. Скачайте Ollama с официального сайта и установите его.Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
  2. Чтобы проверить, что установка прошла успешно, запустите инструмент и откройте терминал, выполните следующую команду: ollama -v.Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
    Если все хорошо, то вы должны увидеть номер версии Ollama.
  3. Вернемся на сайт. В меню поиска найдите «deepseek-r1», укажите в левом поле значение для числа параметров (8b, например):Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использоватьКитайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
    Чтобы скачать DeepSeek-R1 с соответствующими параметрами, выполните эту команду в терминале: ollama run deepseek-r1:8b. Команда загрузит версию 8 миллиардами параметров. Для слабых машин рекомендуется размещать модель с 1,5 миллиардами параметров: ollama run deepseek-r1:1.5b.
  4. Как только загрузка завершится, модель начнёт работать, и вы сможете взаимодействовать с ней прямо в окне терминала:Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать

Системные требования DeepSeek-R1

Размер модели, количество её параметров и методы квантования напрямую влияют на требования к VRAM. Ниже представлен детальный разбор потребности DeepSeek-R1 и его облегчённых версий в видеопамяти, а также рекомендации по выбору GPU.

Для полноразмерной модели

Для полноразмерной версии модели, которая требует мощных вычислительных ресурсов, оптимальным вариантом являются системы с несколькими GPU, обладающими значительным объёмом видеопамяти, например, NVIDIA A100 80GB x16. Это обеспечит максимальную производительность при решении сложных задач.

МодельПараметры (B)Потребление VRAM (GB)Рекомендуемая видеокарта
DeepSeek-R1-Zero671B~1 543 ГБМульти-GPU (например, NVIDIA A100 80GB x16)
DeepSeek-R1671B~1 543 ГБМульти-GPU (например, NVIDIA A100 80GB x16)
DeepSeek-R1-Distill-Qwen-1.5B1.5B~3.9 ГБNVIDIA RTX 3060 12GB или выше
DeepSeek-R1-Distill-Qwen-7B7B~18 ГБNVIDIA RTX 4090 24GB или выше
DeepSeek-R1-Distill-Llama-8B8B~21 ГБNVIDIA RTX 4090 24GB или выше
DeepSeek-R1-Distill-Qwen-14B14B~36 ГБМульти-GPU (например, NVIDIA RTX 4090 x2)
DeepSeek-R1-Distill-Qwen-32B32B~82 ГБМульти-GPU (например, NVIDIA RTX 4090 x4)
DeepSeek-R1-Distill-Llama-70B70B~181 ГБМульти-GPU (например, NVIDIA A100 80GB x3)

Для квантированной модели

Квантированные модели требуют значительно меньше вычислительных ресурсов по сравнению с высокоточной версией, что делает их идеальными для работы в условиях ограниченных вычислительных мощностей.

МодельПараметры (B)Потребление VRAM (GB) (4-bit)Рекомендуемая видеокарта
DeepSeek-R1-Zero671B~436 ГБМульти-GPU (например, NVIDIA A100 80GB x6)
DeepSeek-R1671B~436 ГБМульти-GPU (например, NVIDIA A100 80GB x6)
DeepSeek-R1-Distill-Qwen-1.5B1.5B~1 ГБNVIDIA RTX 3050 8GB или выше
DeepSeek-R1-Distill-Qwen-7B7B~4.5 ГБNVIDIA RTX 3060 12GB или выше
DeepSeek-R1-Distill-Llama-8B8B~5 ГБNVIDIA RTX 3060 12GB или выше
DeepSeek-R1-Distill-Qwen-14B14B~9 ГБNVIDIA RTX 4080 16GB или выше
DeepSeek-R1-Distill-Qwen-32B32B~21 ГБNVIDIA RTX 4090 24GB или выше
DeepSeek-R1-Distill-Llama-70B70B~46 ГБМульти-GPU (например, NVIDIA RTX 4090 24GB x2)

Квантование — это метод оптимизации нейросетей, позволяющий уменьшить размер и сложность моделей, снижая требования к вычислительным ресурсам. Оно достигается путём сокращения разрядности чисел (например, с 16 бит до 4 бит), что уменьшает объём памяти и ускоряет вычисления, не оказывая значительного влияния на производительность модели.

Китайская нейросеть DeepSeek: что это такое, как развернуть, установить и использовать
Сравнение квантированных и высокоточных представлений различных типов данных. Иллюстрация показывает, как квантизация снижает объём данных и потребность в вычислительных ресурсах при обработке разных типов информации. Источник: TensorOps

Для чего нужен DeepSeek

DeepSeek, как мы выяснили, — продвинутый ИИ с контекстным окном в 128 тыс. токенов (как у GPT-4o), способный анализировать до 300 страниц текста или данных. Он генерирует контент, ищет информацию в сети, расшифровывает диаграммы, объясняет изображения и пишет код на языках C++, Go, Java, JavaScript, Python, Rust, интегрируясь с редакторами. Поддерживает режим DeepThink для сложных рассуждений, как GPT-o1.

Чат-бот может создавать тексты любых жанров — от технической документации до креатива, автоматизирует задачи в программировании, находит баги и оптимизирует алгоритмы. Например, превратит сырой код в чистый, отформатированный, или объяснит, как исправить ошибку.

DeepSeek не анализирует материалы по ссылкам — только загруженные файлы или вставленные фрагменты. Например, чтобы обработать PDF-отчет, его нужно загрузить напрямую, а не отправить URL.

DeepSeek — это универсальный инструмент, который может использовать широкий круг пользователей:

  • Разработчики: для написания, оптимизации и проверки кода.
  • Маркетологи: для создания слоганов, разработки сценариев и анализа данных.
  • Студенты: для решения задач, объяснения формул и подготовки конспектов.
  • Бизнес: для автоматизации отчетности, сортировки данных, ведения деловой переписки и анализа документации.
  • Копирайтеры и контент-менеджеры: для генерации текстов, создания идей и улучшения качества контента.
  • Учителя и преподаватели: для подготовки учебных материалов, создания тестов и объяснения сложных понятий.
  • Аналитики данных: для обработки и анализа больших объемов информации, создания отчетов и визуализаций.

Как пользоваться DeepSeek

DeepSeek — мощный инструмент, но чтобы использовать его на полную, стоит учитывать несколько нюансов. Иногда нейросеть дает слишком общие ответы, иногда — ссылается на устаревшие данные. Как же добиться максимально точных и полезных результатов?

Проверяйте факты: DeepSeek умеет анализировать большие объемы информации, но всегда лучше сверяться с первоисточниками. Даты, статистика, цитаты — если они важны, найдите подтверждение на официальных сайтах или в свежих исследованиях. Это поможет избежать ошибок.

Используйте DeepThink для сложных задач: Этот режим полезен, когда речь идет о коде, математике или громоздких текстах. Он заставляет модель думать глубже, выстраивать логические цепочки и объяснять все пошагово. Если вам нужен не просто ответ, а детальный разбор, активируйте DeepThink.

Разбивайте сложные запросы: Если запрос объемный, лучше задать несколько уточняющих вопросов. Это особенно полезно, если вы ищете структурированную информацию или пошаговые инструкции. Так DeepSeek даст более осмысленный и четкий ответ.

Корректируйте направление диалога: Нейросеть иногда может отклоняться от темы. В таких случаях стоит переформулировать запрос или задать его более конкретно. Например, вместо «Как работает квантование?» лучше спросить «Как квантование уменьшает размер модели?».

Загружайте файлы по одному: DeepSeek умеет работать с документами, но если отправить сразу несколько тяжелых файлов, анализ может занять больше времени. Оптимально — загружать их по очереди.

Промпты для DeepSeek

Для эффективной работы с DeepSeek-R1 важно правильно формулировать запросы. Этот инструмент требует точности, чтобы избежать общих и неясных ответов. В этом разделе собраны самые необходимые промпты, которые помогут вам максимально использовать возможности DeepSeek.

Используя эти промпты, вы сможете адаптировать запросы под свои нужды, просто заменив «[…]» поля на конкретные данные. Это позволит вам получать точные и актуальные ответы, сэкономив время и усилия в решении задач.

Идеи для контента

  • Придумай [количество] идей для [платформы/типа контента] на [тема]. Укажи ключевые темы и добавь советы, как зацепить аудиторию.
  • Напиши [блог-пост/эссе] на [тема], докажи [точку зрения]. Представь, что пишешь для [характеристики ЦА]. Добавь [количество] примеров из [области].
  • Составь контент-план для [платформы] на [тема] на [период]. Сбалансируй образовательный, развлекательный и рекламный контент.
  • Придумай 3 идеи интерактивных постов (опросы, вопросы-ответы) для [платформы] по [тема], чтобы вовлечь [характеристика аудитории].
  • Напиши текст рекламной кампании, мотивирующий [аудиторию] поделиться [типом контента] на [продукт/тема]. Добавь стимулы и хештеги.

Редактирование

  • Перепиши этот текст проще и короче: [вставь текст].
  • Сделай текст понятнее и адаптируй под SEO. Не больше [количество слов], обязательно включи: [ключевые слова]. Акцент на [ключевой момент].
  • Перепиши текст в [формальном/неформальном] стиле для [аудитории], сохранив суть: [основные идеи]. Текст: [вставь].
  • Придумай 2 варианта [email/слогана] для A/B-теста. Вариант А: [юмористический], Вариант B: [серьезный]. Текст: [вставь].

Креативное письмо

  • Напиши [жанр] рассказ, где [персонаж] должен [цель]. Добавь неожиданный поворот с [объект/событие].
  • Придумай начало истории в [жанре], где [персонаж] сталкивается с [проблемой] и вынужден [действие].
  • Опиши предысторию, мотивацию и слабые стороны героя в [жанре]. Добавь его секрет, связанный с [темой].
  • Создай вымышленный [город/планету] для истории в [жанре]. Опиши законы, конфликты, культуру.

Сценарии для видео

  • Напиши сценарий для [типа] видео о [продукте]. Структура: зацепка (X сек), проблема (Y сек), решение (Z сек).
  • Напиши сценарий отзыва клиента о [продукте]. Покажи, как [функция] решила его [проблему]. Текст должен звучать естественно.
  • Напиши сценарий для [X]-минутного обучающего видео по [теме]. Добавь текстовые подсказки, голосовые инструкции и разбор возможных ошибок.

Работа с отчетами

  • Подведи итоги [данных/эксперимента] в отчете. Выдели ключевые метрики и дай рекомендации.
  • Напиши технический отчет на тему [тема] для [аудитории]. Включи резюме, методологию, результаты ([данные/метрики]) и рекомендации. Держи формальный стиль, добавь графики.
  • Сократи технический отчет до одностраничной сводки для [заинтересованных сторон]. Выдели [метрика 1] и [метрика 2]. Отчет: [вставь]

Программирование

  • Напиши программу на [язык программирования], которая решает задачу [описание задачи]. Объясни шаги выполнения кода и возможные ошибки, которые могут возникнуть при его использовании.

  • Сравни две технологии для разработки [тип приложения]: [Технология A] и [Технология B]. Сделай таблицу плюсов и минусов, порекомендуй лучшую для [конкретного случая использования].

  • Напиши пошаговое руководство по настройке [инструмент/технология] для [задачи]. Укажи возможные ошибки и как их избежать при настройке и запуске.

Сравнения

  • Сравни [Технология A] и [Технология B] для [сценарий использования]. Сделай таблицу плюсов и минусов, порекомендуй лучший вариант для [конкретного случая].
  • Разбери плюсы и минусы [Вариант A] и [Вариант B] для [цель/контекст], сфокусируйся на [критерии].
  • Сравни затраты и выгоды [Проект A] и [Проект B] за [срок]. Учти нематериальные факторы: [репутация/устойчивость].

Помощь с учебой

  • Реши эту задачу по [предмету]: [описание задачи]. Объясни каждый шаг.
  • Найди ошибки в этом решении по [предмету]: [ответ]. Исправь и объясни, почему так лучше.
  • Придумай [количество] тренировочных задач по [теме], отсортировав по сложности. Добавь ответы и разбор типичных ошибок.
  • Предложи 3 техники запоминания [темы] (например, мнемоники, интеллект-карты). Подбери под [аудиторию/стиль обучения].

Маркетинговые стратегии

  • Разработай маркетинговую кампанию для [платформы], чтобы продвинуть [продукт] среди [аудитории]. Добавь [количество] вариантов зацепок и CTA.
  • Составь 30-дневный контент-план для [платформы] с учетом интересов [аудитории]. Включи посты на тему [тема].
  • Пересмотри позиционирование бренда в [нише], чтобы конкурировать с [конкурентом]. Сделай упор на [уникальное предложение] и правильное сообщение для [аудитории].
  • Разработай стратегию выхода [продукта] на [новый рынок/страну]. Учти локализацию, партнёрства и законы.

Заключение

Китайская DeepSeek ворвалась в мир ИИ и мгновенно стала центром внимания. Одни восхищаются её скоростью, доступностью и открытым кодом, другие задаются вопросами о безопасности и этике. Но одно ясно — нейросеть взорвала рынок и уже закрепилась в числе сильнейших конкурентов OpenAI. Интерес к ней не ослабевает, а дискуссии только набирают обороты.

Стоит отметить, что DeepSeek, в отличии от OpenAI, решение бесплатное. Чат-бот работает в браузере, на смартфоне, через API и даже локально, что делает DeepSeek универсальным инструментом для разработчиков и пользователей.

ИИ-гонка набирает обороты, и DeepSeek уже закрепилась среди лидеров. Пока вокруг неё идут споры, нейросеть продолжает развиваться и конкурировать с крупнейшими игроками рынка.

Оцените статью
( Пока оценок нет )
Поделиться с друзьями
IaaS SaaS PaaS
Добавить комментарий