DeepSeek намалява цените на API, определя нови ниски цени за големи модели

DeepSeek обяви мащабно намаляване на цените на API, тласкайки големите разходи за модели до нови глобални ниски нива и допълнително разширявайки достъпа до AI.

На 26 април DeepSeek разкри, че ценообразуването на входния кеш за попадение в цялата му гама API е намалено до една десета от първоначалната цена на стартиране. Водещият модел V4-Pro също така предлага ограничена във времето отстъпка от 75%, намалявайки цената на кешираните входни данни до само 0,025 RMB на милион токени (приблизително 0,0035 USD) – ново ниско ниво в индустрията.

Според официалната ценова страница на DeepSeek, намаленията се отнасят за всички модели от серия V4, като най-значителните намаления са насочени към сценарии за попадение на входния кеш. Например ценообразуването на DeepSeek-V4-Flash е спаднало от 0,2 RMB на 0,02 RMB за милион токени (приблизително 0,0028 USD).

За корпоративни потребители DeepSeek-V4-Pro предлага още по-големи отстъпки. Ценообразуването на кешираните входни данни е паднало от 1 RMB на 0,1 RMB за милион токени (приблизително 0,014 USD) и с ограничена във времето отстъпка от 75% (валидна до 5 май 2026 г.), ефективната цена е само 0,025 RMB (приблизително 0,0035 USD). Разходите за некеширани входни данни са намалени от 12 RMB на 3 RMB (приблизително 0,41 USD), докато изходните цени са спаднали от 24 RMB на 6 RMB (приблизително 0,83 USD).

DeepSeek също отбеляза, че имената на моделите DeepSeek-Chat и DeepSeek-Reasoner ще бъдат отхвърлени, като и двете ще бъдат съпоставени към режимите без разсъждение и разсъжденията на DeepSeek-V4-Flash за съвместимост.

Пробив в разходите, воден от технологични надстройки

Намаленията на цените следват пускането на DeepSeek-V4 на 24 април, което въведе както Pro, така и Flash версиите като модели с отворен код. И двата поддържат ултра-дълги контексти до 1 милион токена.

Саморазработената архитектура на разреденото внимание на DeepSeek значително намалява разходите за изводи. Изискването за изчисляване на токен на модела Pro е само 27% от V3.2, докато използването на KV кеша пада до 10%, позволявайки фундаментална оптимизация на разходите.

Моделът V4-Pro разполага с 49 милиарда активирани параметри, обучени на 33 трилиона токена, което го позиционира като флагман с висока производителност. Междувременно V4-Flash, с 13 милиарда параметри и 32 трилиона токени данни за обучение, е оптимизиран за скорост и ефективност на разходите.

Силна производителност в бенчмаркове

В сравнение с предшественика си, V4-Pro показва забележими подобрения във възможностите на агента. В сравнителните тестове на Agentic Coding той се нарежда сред най-добрите модели с отворен код и се представя силно в други оценки, свързани с агенти.

Вътрешно служителите на DeepSeek вече използват V4 за задачи по кодиране, като отзивите предполагат по-добро изживяване от Claude Sonnet 4.5 и качество на изхода, доближаващо се до Claude Opus 4.6 (режим без разсъждение), въпреки че все още изостава от своя режим на разсъждение.

В сравнителните показатели за общо знание V4-Pro превъзхожда други модели с отворен код и изостава само от най-добрите патентовани модели като Gemini-Pro-3.1. По математика, STEM и състезателни задачи за програмиране, той съответства или надминава водещите патентовани модели.

V4-Flash, макар и малко по-слаб в обхвата на знанието, осигурява сравнима производителност на разсъждения със значително по-ниска цена и по-бързо време за реакция.

Синергия на инфраструктурата и тласък на вътрешните компютри

DeepSeek-V4 също така въвежда нов механизъм за внимание, който компресира размерите на токена, комбиниран с DeepSeek Sparse Attention (DSA), позволявайки водеща в индустрията производителност в дълъг контекст, като същевременно намалява изискванията за изчисления и памет.

Трябва да се отбележи, че серията V4 се поддържа изцяло от супервъзловите системи на Huawei Ascend, сигнализирайки за по-силно преминаване към вътрешна изчислителна инфраструктура.

Според DeepSeek неговият подход на финозърнест експертен паралелизъм (EP) осигурява 1,5 × до 1,73 × подобрения на скоростта при общи задачи за извод в сравнение със силни неслети базови линии и до 1,96 × в чувствителни към латентност сценарии, като внедряване на подсилващо обучение и високоскоростни агентски услуги.

Тъй като масовото производство на супервъзли Ascend се очаква по-късно тази година, DeepSeek посочи, че цените на V4-Pro може да намалеят допълнително.

Въздействие на индустрията и капиталов интерес

Goldman Sachs отбеляза в неотдавнашен доклад, че значението на DeepSeek-V4 се крие в разрешаването на по-сложни приложения на AI агенти на по-ниска цена, отключвайки нови възможности за широкомащабно внедряване.

Докладът също така подчертава, че интеграцията с инфраструктурата на Ascend допълнително ще повиши конкурентоспособността на разходите, особено след като китайската AI индустрия ускорява преминаването си към домашни чипове на фона на затягането на глобалното предлагане на полупроводници.

Междувременно докладите показват, че Tencent и Alibaba водят преговори за инвестиране в DeepSeek на стойност над 20 милиарда щатски долара. Съобщава се, че сравнимите AI фирми Zhipu AI и MiniMax се оценяват съответно на около 53 милиарда USD и 31 милиарда USD, което подчертава засилващата се конкуренция за първокласни възможности на AI.

Huatai Securities добави, че докато пазарът може да се съсредоточи върху намаляване на разходите, по-важната промяна е подобрената използваемост в приложения с дълъг контекст – като сложни агенти, анализ на множество документи и задачи с дълъг хоризонт – което може значително да увеличи търсенето на изводи и честотата на достъп до данни.

Източник: Jiemian News

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта