Tech БРОЙ /// Мениджър 09/24

Списание МЕНИДЖЪР Ви предлага 4 безплатни статии от броя — 2 / 4

Още сме далеч от суперинтелигентен GEN AI

Човекът остава първи пилот в навигацията на проблема, казва Антон Александров, докторант в INSAIT

Автор:

Таня Кръстева

Още сме далеч от суперинтелигентен GEN AI

Още сме далеч от суперинтелигентен GEN AI

Човекът остава първи пилот в навигацията на проблема, казва Антон Александров, докторант в INSAIT

Още сме далеч от суперинтелигентен GEN AI
quotes

Какви са според вас потенциалните ползи от Gen AI за бизнеса и кога ще бъдем готови да се възползваме от тях? Само година по-рано очаквахме развитието на генеративния изкуствен интелект да революционизира начина, по който се прави бизнес, и начина, по който се работи за месеци. Продължават статиите за това кои професии ще изчезнат и как много хора ще станат буквално „непотребни“. Заговори се обаче и за голямо надценяване на Gen AI.

Ползите от генеративния изкуствен интелект за бизнеса вече са видими - чатботове, асистенти за писане на код, бързо създаване и обработка на изображения и други. Като с всяка нова нашумяла технология, подобно на уеб технологиите в началото на века, е важно да се определи стойността за всеки бизнес индивидуално, а не да се прави само защото е модерно. AI като цяло има още много място за развитие, но аз лично не очаквам толкова бързо изместване на работните позиции. За момента повечето Gen AI са ефективни помощници на служителите, улесняват някои аспекти от работата им и увеличават производителността им, което е големият плюс за бизнеса.  

Каква е ролята на България в този процес?

За първи път страната ни се позиционира сред десетте водещи в Европа в областта на изкуствения интелект благодарение на INSAIT. Ролята на България допреди INSAIT в развитието на изкуствения интелект е била минимална, тъй като както тук, така и в другите страни от Източна Европа и Балканите няма толкова силни изследователски центрове каквито са топ университетите и лабораториите на технологичните гиганти като „Гугъл“ или силните западни университети. Изследванията и разработките в тази сфера изискват много силна подготовка, но също така и солиден финансов ресурс, за да се привлекат такива хора и за да се осигури нужните хардуер и среда. Това се случва например в моя Алма матер ETH Zurich, който е сериозно финансиран от държавата, привлича най-добрите студенти и учени от цял свят и на когото технологичните гиганти разчитат за подбор на кадри и изследвания на световно ниво. Сега INSAIT следва модела на такива институти, създавайки прецедент България и региона да привличат и развиват, вместо да изнасят топ таланти.  

Как може българският бизнес да се възползва от това позициониране?

Ако България и регионът започнат да привличат хора и инвестиции, бизнесите ще имат по-добър достъп до изследователската дейност и хората, които са най-важният фактор. При наличието и на добри условия в страната ще могат да се създават и повече дълбокотехнологични стартъпи и компании, които да произвеждат продукти и услуги както за локалния, така и за глобалния пазар. Това естествено ще развие българската технологична екосистема и икономиката на държавата като цяло.  

Какви потенциални ползи виждате конкретно от LLM? Какво е вашето виждане – как LLM ще се развива в бъдеще?  

Ползите, които вече са налице, са много, но често не са толкова очевидни, тъй като комерсиалните модели са рекламирани като всемогъщи асистенти. Аз лично често ползвам големи езикови модели за разнообразни прости задачи с цел спестяване на време – преформатиране на текст и таблици, писане на примерен код, идеи за описания, анализ на дълги текстове, преводи и т.н. Такъв тип задачи са най-подходящи за LLMs поради няколко причини. На първо място човекът винаги остава първи пилот в навигацията на проблема, тоест евентуалните грешки могат да бъдат поправени. Второ, задачи от подобно естество, например „обобщи следния текст“ не изискват комплексно разсъждение или абстрактно мислене, а проста обработка на голям набор от текст по познат за модела образец. В близкото бъдеще някои от несъвършенствата на езиковите модели ще бъдат изгладени.

По-интересно е обаче бъдещето на мултимодалните модели, които включват обработката и генерирането не само на естествен език, но и на звук и изображения. Вече виждаме как такива модели се справят добре с визуално-аналитични задачи, което доскоро не беше постигано на такова ниво с класически методи. Въпреки че обучението на големите езикови модели е сложна инженерна и изследователска работа, концепцията е относително проста.

Моделите са невронни мрежи, които предсказват следващата най-вероятна дума или морфема според дадения контекст. Те се „самообучават“ на огромно количество текст, написан от хора, като предсказват думите една по една. По този начин може примерно да зададете на един обучен модел да продължи текста „Навън времето е чудесно и небето е…“. Тъй като това е статистически модел, ще бъдат предложени няколко възможни продължения с различна вероятност – синьо, ясно, чисто и т.н. Ако винаги избираме най-вероятната според модела дума, можем да продължим да генерираме текст дума по дума. С допълнителна фина настройка с помощта на готови въпроси и отговори можем да до обучим моделите да изпълняват инструкции, вместо да генерират текст „по памет“.  

Според вас тази индустрия по кой път ще поеме – монополизация от страна на големите технологични компании или демократизиране чрез отворения код, който да позволи разработването и използването на Gen AI от неограничен кръг играчи, и съответно какви ще са последиците?

Не мога да предскажа точно как ще се развие отношението към тези технологии, но в последно време виждаме сериозен напредък на отворените модели спрямо затворените като тези на OpenAI. На 23 юли Meta обяви и представи новата си серия от големи езикови модели Llama 3.1, които показват подобна или по-добра производителност като GPT-4 и Claude моделите на Anthropic. Още по-важно е, че от Meta публикуваха и много подробен доклад на методите зад създаването на моделите, като по-рано през годината обявиха своята отдаденост на демократизацията на AI и представиха своята теза, че това всъщност е много по-полезно за компаниите, които развиват AI на такова ниво.

Аз съм оптимист за бъдещето, тъй като все повече играчи от различно естество участват в надпреварата, което е в основата на демократизацията на технологиите. Още повече – вече знаем, че производителността и потребността на тези модели не е толкова лесно измерима, тоест не е същото като една компания да произвежда най-добрите електрически крушки, понеже харчат по-малко енергия и произвеждат повече светлина. Тук става въпрос за най-разнообразни приложения и предимства на различните разработки, което отваря много възможности пред създателите на модели да запълват определени пазарни ниши.  

До какви неравенства могат да доведат различията в знанията и достъпът до изкуствен интелект в различните общества?

Все още няма общо съгласие по темата за влиянието и ефекта на изкуствения интелект върху обществото, но едно е ясно, ако говорим за промяна от размера на Индустриалната революция, то „предимството на първия“ е налице. Компаниите и правителствата, които инвестират в тази насока, ще имат възможността да бъдат индустриални лидери вместо последователи, което от икономическа гледна точка очевидно е важно. Относно достъпа аз съм на мнение, че той ще става все по-лесен с развитието на технологията. Дори сега всеки, който притежава устройство, свързано към интернет, може да се възползва от множество приложения, които използват някакъв вид изкуствен интелект, и то безплатно. В близкото бъдеще вероятно също толкова лесно хората ще могат да го персонализират и пускат на персоналните си компютри, без да зависят от трети лица.  

Напоследък все повече започват да се повдигат два важни въпроса, свързани с разработването и използването на AI – изграждането на необходимата инфраструктура, както и въглеродният отпечатък, който развитието му ще остави. Как виждате решението на тези предизвикателства?  

Големите езикови модели от размера на GPT-4 изискват огромно количество хардуерни ресурси, за да бъдат създадени. Технологичните гиганти разполагат и използват стотици хиляди видео карти, на стойност стотици хиляди долари на парче като всяка една харчи до около 700 вата при максимално натоварване. Една от причините за големия успех на езиковите модели е фактът, че типът невронни мрежи, които използват, позволяват по-голяма производителност в по-голям мащаб. Тоест в общи линии досега наблюдаваме, че колкото повече данни наливаме в колкото се може по-големи модели, толкова повече повишаваме способностите им. Сега тенденциите са за развитите на по-малки модели, понеже от теоретична гледна точка най-вероятно не сме достигнали оптималното съотношение размер-производителност.  

През май Open AI разпусна екипа си, който се занимава с рисковете от развитието на AI. Къде виждате вие рискове и как може да им се противостои?

Важно уточнение тук е, че OpenAI разпусна екипа, занимаващ се с дългосрочните екзистенциални опасности от AI, което означава рискът от това суперинтелигентен генерален изкуствен интелект да бъде „изпуснат“ или да излезе извън контрол. На всеки, който се занимава отблизо с разработката на AI, това би звучало като научна фантастика. Практически още сме далече от такива сценарии, а най-малко теоретично не ни е ясно какво точно би представлявал един такъв генерален свръхинтелект. От друга страна, сигурният и надежден изкуствен интелект е реална, изследвана тема, която обхваща обяснимостта и математическата доказуемост на AI моделите, както и проблеми като защитата на личните данни. Всъщност Open AI развива такива екипи.

В приложението на технологии като автономните автомобили е важно да е добре обособено поведението им и да могат да се дадат гаранции за надеждността им, което обаче се оказва доста сложна задача. Друг голям риск се крие, както вече споменахме, в липсата на демократичност в използването и достъпа на AI модели, което може да създаде още по-голяма пропаст между хората от различни демографски групи.

Какви ще бъдат дългосрочните последици за човечеството от развитието на изкуствения интелект?

Голямото предимство в използването на изкуствения интелект е бързата обработка на информация и откриване на решения на конкретни сложни задачи. Елементарен пример за такъв контекст е играта на шах, в която компютър с изкуствен интелект през 1997 г. бие тогавашния номер едно Гари Каспаров. Оттогава вече няма кой да бие най-модерните софтуери за шах, но това не означава, че хората са спрели да играят шах. Напротив, популярността на играта в последните години се е покачила драстично, а днешните топ гросмайстори използват такива софтуери, за да изучават играта още по-добре от когато и да е било. За мен това е най-добрият пример как ще се развие употребата на AI в бъдеще – софтуери, специализирани в конкретни задачи, ще могат да отключат потенциала на човешките възможности в най-различни сфери на науката, изкуствата и въобще продуктивната работа. Най-вероятно следващите големи научни открития ще се дължат на комбинация между човешката креативност и производителната мощ на AI.  

Какво бихте посъветвали хората, които всеки ден четат за развитието на изкуствения интелект, но все още не могат да се ориентират какво трябва да предприемат, че да останат адекватни на работната, а и на обществената среда?

Бих посъветвал хората да останат отворени към новите развития в технологиите и по-конкретно в изкуствения интелект и да потърсят къде може да им е в помощ, да им спести време или да повиши прецизността на работата им. Вече обсъдихме някои основни ползи и принципи на работата с AI, като се надявам, че всеки ще може да открие ползите за себе си. В крайна сметка все още не сме достигнали дотам, че всеки непременно трябва да оползотворява изкуствен интелект ежедневно, за да остане адекватен в работата или живота като цяло. Най-голяма полза е за хората, които се занимават с голямо количество сложни данни, така че бих препоръчал на тях да търсят леснодостъпен софтуер, който може да улесни тяхната „поточна линия“ на работа.  

Антон Александров е докторант в INSAIT към Софийския университет с научни ръководители проф. Це Джанг (Together AI) и д-р Кристина Тутанова (Google DeepMind). Интересите му включват приложно машинно обучение, обработка на естествен език, Fair ML и др. Той има водеща роля в разработването на BgGPT. Антон е завършил магистратура по компютърни науки, специалност „Машинно обучение“, във водещия технологичен институт в Европа ETH – Цюрих. Преди това завършва с отличие бакалавърска степен по компютърни науки в Университета в Уоруик, Великобритания, и Софийската математическа гимназия (СМГ).