DeepSeek
Описание
DeepSeek — китайская нейросеть, которая в конце 2024 года совершила прорыв, предложив производительность уровня GPT-4o при стоимости в десятки раз ниже. Модель DeepSeek-V3 и логическая модель R1 построены на архитектуре Mixture-of-Experts (MoE), что позволяет активировать только нужные части нейросети для каждого запроса, обеспечивая колоссальную скорость и экономию ресурсов. Сервис крайне популярен у разработчиков благодаря открытому коду многих моделей и поддержке 128K контекста. DeepSeek Coder — мощная открытая модель для кодинга, которая в тестах на знание Python, C++ и Java зачастую обходит GPT-4. Обладает огромным контекстным окном (128 000 токенов) и понимает более 300 языков программирования.
Возможности
- Высокая производительность
- Низкая стоимость
- 128K контекст
- Open Source модели
- DeepSeek Coder для программирования