По-евтиният AI е по-добър: Растящите сметки променят начина, по който бизнесите избират модели
Мощните и скъпи модели с изкуствен интелект в Силициевата долина са необходимост за бизнеса, който иска да се подготви за бъдещето. Но сега все по-голям брой изпълнителни директори на технологични компании твърдят, че по-евтините варианти биха били от решаващо значение за по-широкото им приемане, пише Ройтерс.
Висши ръководители като Сатя Надела от Microsoft, Никеш Арора от Palo Alto Networks и Брайън Армстронг от Coinbase Global заявиха, че по-малките и по-евтини модели могат да се справят с голям дял от корпоративните нужди.
Това мнение е резултат от преоценка в компаниите, които доскоро насърчаваха интензивното използване на инструменти с изкуствен интелект, често третирайки нарастващото потребление като показател за производителност, наречено „токенмаксизиране“. Сега тези сметки започват да хапят.
Цените на токените - единиците, използвани за измерване на използването на изкуствен интелект - падат, но цената на изпълнението на задача се покачва, тъй като фирмите за изкуствен интелект преминават от фиксирани абонаменти към ценообразуване, базирано на употреба. Това оставя компаниите с непредсказуеми и често по-високи сметки, тъй като употребата им за задача става по-трудна за оценка.
Например, Uber изгори целия си бюджет за изкуствен интелект за 2026 г. само за четири месеца, след като служителите се втурнаха да внедрят инструменти за кодиране с изкуствен интелект, принуждавайки ръководството да ограничи използването, според доклади.
„Промяната на лицензионния модел изненада много хора“, каза Харолд Бюн, главен изпълнителен директор на BlueRock, стартираща компания, която помага на компаниите да управляват безопасно системи с изкуствен интелект. „Веднага след това получихме редица съобщения от клиенти, че наблюдаваме скок от 20% до 30% по отношение на надбюджетирането.“
Бизнесът се притеснява от огромните сметки
Тъй като компаниите използват изкуствен интелект все повече, разходите им нарастват над първоначалните оценки, тъй като задачите сега включват повече стъпки, повече данни и по-дълги входни данни.
Gartner изчислява, че разходите за кодиране с изкуствен интелект ще надхвърлят средната заплата на разработчика до 2028 г., докато проучване на изследователската фирма установи, че три четвърти от ръководителите предвиждат увеличение на технологичните бюджети тази година, като почти половината от тях прогнозират двуцифрени скокове.
Това накара бизнесът да възприеме по-евтини модели и да се обърне към инструменти за маршрутизиране като OpenRouter, пазар за изкуствен интелект, тъй като се стремят да възлагат задачи на най-рентабилната система, като същевременно запазват премиум модели за сложна работа като кодиране.
Делът на токените с отворен код, обработвани на OpenRouter, скочи до 65% през юни от 34% през януари, според бележка на Citi.
Това би трябвало да е от полза за производителите на модели с отворен код, като китайската DeepSeek, които са получили широко разпространение сред стартиращите компании, но са се затруднили да пробият в големия бизнес поради опасения за сигурността.
„Ако искате да спечелите предприятия, трябва да сте нащрек за цените на токените“, написа Арора от Palo Alto Network в X миналата седмица, призовавайки лабораториите за изкуствен интелект да таксуват клиентите си днес по по-ниските цени, които се очаква токените да имат след няколко години.
Изглежда, че OpenAI се адаптира към промяната. Съобщава се, че производителят на ChatGPT обмисля значителни намаления на цените, включително на използването на токени, в очакване на подобни ходове от конкурента Anthropic.
Всяко преминаване към по-евтини модели обаче би могло да навреди на растежа на приходите им, особено докато се подготвят за потенциални първични публични предлагания (IPO).
„Ще има динамика на ценова война, когато става въпрос за OpenAI и Anthropic, тъй като и двете компании се борят за дати на първично публично предлагане“, каза Кристофър Браун, финансов съветник по управление на частното богатство в Synovus Securities, която притежава акции в няколко големи технологични компании.
Технологичните акции се разпродадоха през по-голямата част от миналата седмица, тъй като инвеститорите преоцениха оценките на AI, тъй като съмненията относно възвръщаемостта на огромните разходи бяха утежнени от слабото представяне на SpaceX след IPO и съобщенията, че OpenAI може да забави листването си.
Модели с отворен код и китайски модели привличат вниманието
Скокът в цените тласка повече бизнеси към модели с отворен код, включително по-евтини китайски алтернативи. Четирите най-популярни модела в OpenRouter са китайски, като DeepSeek заема първото място.
Китайските модели намаляват разликата във възможностите с водещите американски модели, като същевременно таксуват едва 18 цента на милион токена, в сравнение със средно 4 долара за водещите модели, показва бележката на Citi.
„Те (моделите с отворен код) изоставаха с повече от година (от водещите модели с изкуствен интелект). Сега вероятно оценките са, че изостават с около четири месеца. Така че разликата ще продължи да се намалява“, каза Бюн от BlueRock.
Въпреки това някои анализатори казват, че опасенията относно сигурността на китайските модели вероятно ще възпрепятстват приемането им от предприятията, особено в чувствителни индустрии като киберсигурността.
Вместо това те очакват бизнесите да следват наръчника за облачни изчисления, разпределяйки се между множество доставчици в търсене на най-доброто съответствие и цена.
Моделите с отворен код показват, че са „90% толкова добри на 10% от цената“, каза Вал Берковичи, главен директор по изкуствен интелект в WEKA, която помага на компаниите да управляват модели с изкуствен интелект по-бързо и по-евтино. „Не е нужно да харчим премиум токените за всяко ниво на усилия.“
Ключови думи
НОВ КОМЕНТАР
ОЩЕ ОТ КАТЕГОРИЯТА
|
|
Коментари
Няма въведени кометари.