Американските фирми за изкуствен интелект хвалят DeepSeek, но търсят и пробойни в неговото представяне

Американските фирми за изкуствен интелект хвалят DeepSeek, но търсят и пробойни в неговото представяне

Разработчици от водещи американски фирми за изкуствен интелект възхваляват моделите за изкуствен интелект DeepSeek, които бързо придобиха популярност, като същевременно се опитват да разкрият пробойни в идеята, че тяхната технология за множество милиарди долари е била победена от евтината алтернатива на китайски стартъп, пише Ройтерс.

Китайският стартъп DeepSeek в понеделник предизвика мащабна разпродажба на технологични акции, след като неговият безплатен ИИ асистент изпревари ChatGPT на OpenAI на върха в класацията на магазина за приложения App Store в САЩ. От DeepSeek казват, че моделът им е обучен с графични процесори H800 на Nvidia, които са с по-ниски възможности от върховите продукти на компанията, и че това им е струвал под 6 млн. долара.

Изпълнителният директор на OpenAI Сам Алтман написа в социалната мрежа X, че R1 – един от няколкото модела, пуснати от DeepSeek през последните седмици, „е впечатляващ модел, особено като се има предвид това, което предлага за съответната цена“. Nvidia каза в изявление, че постижението на DeepSeek доказва необходимостта от повече чипове.

Производителят на софтуер Snowflake реши в понеделник да добави модели DeepSeek към своя пазар за модели на ИИ, след като получи вълна от запитвания от клиенти.

Докато някои служители наричат ​​моделите на DeepSeek „невероятни“, продавачът на софтуер в САЩ трябваше да оцени потенциалните рискове от хостването на ИИ технология, разработена в Китай, преди в крайна сметка да реши да я предложи на клиентите, каза Кристиан Клейнерман, изпълнителен вицепрезидент на продукта на Snowflake.

Междувременно американските разработчици на ИИ бързат да анализират модела V3 на DeepSeek. През декември DeepSeek публикува изследователска статия, придружаваща модела, но документа липсват отговори на много въпроси, включително за общите разходи за разработка.

Китай изоставаше с 18 месеца зад най-съвременните ИИ модели,  разработени в САЩ, но вече това изоставане е само шест месеца, казва един разработчик.

Успехите на DeepSeek не произтичат само от бюджет от 6 милиона долара – малка сума в сравнение с 250 милиарда долара, които анализатори изчисляват, че големите облачни компании в САЩ ще похарчат тази година за ИИ инфраструктура. Изследователската статия отбелязва, че тази цена се отнася конкретно за използването на чипове при последното му обучение, а не за цялата цена на разработката.

Обучението е върхът на айсберга по отношение на общите разходи, казват ръководители на две водещи лаборатории пред Ройтерс. Разходите за определяне на това как да се проектира това обучение може да струва много повече пари.

Изследователската статия посочва, че обучението на модела V3 е проведено с помощта на 2048 от чиповете H800 на Nvidia, които са проектирани да отговарят на експортния контрол на САЩ, пуснат през 2022 г. – правила, които според експертите едва ли ще забавят напредъка на Китай в сферата на изкуствения интелект.

Източници от две лаборатории за изкуствен интелект казват, че очакват в по-ранните етапи на разработка да използвани на много по-голямо количество чипове. Според един от тях подобна инвестиция може да струва над 1 милиард долара.

Някои американски лидери в сферата на изкуственият похвалиха решението на DeepSeek да пусне своите модели с отворен код, което означава, че други компании или лица са свободни да ги използват или променят.

„DeepSeek R1 е един от най-удивителните и впечатляващи пробиви, които някога съм виждал – и като отворен код, дълбок подарък за света“, каза рисковият капиталист Марк Андреесен в публикация на X в неделя.

Признанието, получено от моделите на DeepSeek, подчертава жизнеспособността на ИИ технологията с отворен код като алтернатива на скъпата и строго контролирана технология като ChatGPT на OpenAI, посочиха наблюдатели от индустрията.

Коментари

НАЙ-НОВО

|

НАЙ-ЧЕТЕНИ

|

НАЙ-КОМЕНТИРАНИ