Digital Age: DeepSeek - евтин, мощен, китайски ИИ за всички. Какво може да се обърка?
През 2017 г. Китай наблюдава със страхопочитание — и шок — как програмата за изкуствен интелект AlphaGo, подкрепяна от Google, победи китайски майстор в сложната настолна игра Go. Решителната загуба от чуждестранна компютърна програма, която по подобен начин победи южнокорейски играч, беше нещо като вододелен момент за Китай.
През същата година китайските власти изложиха смел план да поведат света в епохата на изкуствения интелект до 2030 г., обещавайки милиарди на компании и изследователи, фокусирани върху технологията. От този първоначален стимул се появи DeepSeek, до голяма степен неизвестната китайска стартираща компания, която преобърна технологичния пейзаж, като създаде мощен ИИ модел с много по-малко пари, отколкото експертите смятаха за възможно.
Или поне така твърди "легендата"
DeepSeek е частна компания, без видима държавна подкрепа, но успехът ѝ въплъщава амбициите на висшия лидер на Китай Си Дзинпин, който многократно подчертава, че страната му ще заеме "командните висоти“ при технологиите. Си иска китайската икономика да се захранва не от стари двигатели на растеж като недвижими имоти и евтин износ, а от най-модерните технологии като ИИ, суперкомпютри и зелена енергия.
За Си и Китайската комунистическа партия този имидж помага да се наруши аурата на превъзходството, което Съединените щати държат в ИИ като критично поле на ожесточеното съперничество между суперсили. Китай се представя като добронамерен глобален партньор на развиващите се страни, желаещ да сподели своето ноу-хау, като самият Си каза, че ИИ не трябва да бъде „игра на богатите страни и богатите“.
Сега DeepSeek показа, че може да е възможно Китай да създаде ИИ по-евтино и по-достъпно за всички. Въпросът обаче е дали това наистина е така и как управляващата комунистическа партия управлява възхода на технология, която един ден може да бъде толкова разрушителна, че да застраши нейните интереси - и хватката ѝ върху властта.
Милиони, милиарди - това са само подробности
Най-напред да погледнем цифрите и изчисленията зад тях.
DeepSeek превзе света и новинарските заглавия за седмица, генерирайки много дискусии около своя ИИ модел, който изглежда толкова способен, колкото ChatGPT на OpenAI, но за част от разходите. Първоначалното твърдение беше, че DeepSeek V3 носи разходи за обучение от около 6 милиона долара.
Оказва се обаче, че нещата са малко по-различни и нов доклад на SemiAnalysis оспори този разказ относно цената, за която независимата изследователска компания установи, че всъщност е много по-висока. Общите капиталови разходи на DeepSeek за сървъри са умопомрачителните 1,3 милиарда долара.
Докладът отбелязва, че оценката от 6 милиона долара отчита разходите за предварително обучение и набавянето на графични ускорители (GPU), но пренебрегва значителните инвестиции, направени в научноизследователска и развойна дейност, инфраструктура и други основни разходи, които компанията трябва да поеме. От изчислените 1,3 милиарда долара капиталови разходи, голяма част от тях са насочени към експлоатация и поддръжка на скъпите GPU клъстери, които формират гръбнака на изчислителната мощ на DeepSeek. Съобщава се, че компанията има достъп до около 50 000 графични процесора Hopper – което не е същото като да има 50 000 H100, пояснява докладът. Инвентарът на GPU включва H800, H100 и H20, специфични за страната, които са направени от Nvidia в светлината на ограниченията на износа за САЩ.
На друго място докладът също така подчертава организационната структура на DeepSeek и за разлика от някои от по-големите ИИ лаборатории, DeepSeek управлява своите центрове за данни и използва рационализиран модел, за да помогне за ефективността и гъвкавостта. Тази структура обаче не означава непременно, че нейните операции са драстично по-евтини.
Така идеята, че ИИ моделите на DeepSeek струват само малка част от разработката на ChatGPT, е силно преувеличена. Въпреки че компанията е направила значителни крачки в ефективността, нейните общи разходи за инфраструктура, инвестиции в GPU и разходи за научноизследователска и развойна дейност я поставят много по-близо до големите западни лаборатории за изкуствен интелект, отколкото предполагаха първоначалните доклади.
Тъй като Nvidia продължава да доминира на пазара на ИИ хардуер, зависимостта на DeepSeek от ограничени китайски GPU варианти като H800 и H20 може да се превърне в ограничаващ фактор за нейния растеж. Междувременно нейните спестяващи разходи иновации едва ли ще останат ексклузивни за дълго, тъй като глобалните ИИ лидери бързо адаптират нови пробиви в ефективността за своите нужди.
Бърз възход
Китайското регулиране на ИИ претърпя различна интензивност през годините в зависимост от това къде страната оценява своите силни и слаби страни. Когато китайското правителство се притесни, че е изостанало от Съединените щати през 2022 г. след пускането на ChatGPT от OpenAI, то възприе по-безпристрастен подход, който в крайна сметка позволи на начинания като DeepSeek и други да процъфтяват.
Сега, когато махалото се завъртя в другата посока, това доверие в индустрията може да се окаже нож с две остриета. Това е така, защото основните стремежи на партията са към контрол и сега, когато тя си възвърна доверието в китайския ИИ капацитет, на официален Пекин може да му е трудно да устои на желанието да възприеме по-директен подход към тези компании. Сякаш за да подчертае тази възможност, основателят на DeepSeek Лян Венфен беше поканен на дискусия с премиера Ли Куан на 20 януари - същия ден, в който компанията пусна своя най-нов и най-мощен ИИ модел, известен като R1. Поканата беше още по-забележителна, като се има предвид, че DeepSeek не беше смятана за един от водещите китайски ИИ компании. Това отличие е запазено за високопоставени фирми като базираната в Пекин стартираща компания Zhipu AI, която е получила значителни държавни инвестиции. Всъщност, DeepSeek вече изпита желанието на партията да се намеси в делата ѝ. Компанията първоначално обучаваше своите ИИ модели за правене на залози на китайския фондов пазар, но когато регулаторите въведоха ограничения за подобно поведение, през 2023 г. тя се насочи към създаването на усъвършенстван ИИ, за да се съобрази с индустриалната политика на Китай.
А сега накъде?
Дори неотдавнашните обвинения от OpenAI, че DeepSeek неправилно е събирала данни, за да изгради моделите си, не възпират феновете на компанията в Китай, които обвиняват американския конкурент в разпространение на необосновани слухове. Според тях, технологичните санкции на САЩ срещу Китай оставиха Пекин без друг избор, освен да разработва собствени продукти.
ИИ заема специално място във визията на Си Дзинпин за възхода на Китай, с потенциала си да помогне на страната да преодолее много от най-големите си предизвикателства като намаляващата работна сила. Китай използва лицево разпознаване и алгоритми, за да увеличи способността си да наблюдава своето население и да потушава несъгласието. Технологията също е фактор във военната модернизация на Китай с автономни оръжейни системи и дори стратегия на бойното поле.
Развитието на DeepSeek може също така да подобри геополитическите цели на Китай. DeepSeek използва модел с отворен код, което означава, че всеки може да надникне в него и да използва неговата технология, за разлика от водещите американски компании, които използват по-скъп патентован софтуер. Колко голям играч ще стане Китай на глобалната ИИ сцена в крайна сметка може да зависи от това как правителството реши да балансира регулациите със свободата, от която компаниите и изследователите се нуждаят, за да извършват авангардна работа, която им позволява да се конкурират със Съединените щати. В крайна сметка, ИИ в Китай може да напредне само дотолкова, доколкото правителството реши, че може да смекчи тези рискове, които са вътрешно присъщи на тази нова технология.
|
|
Коментари
Няма въведени кометари.