Специални издания СПЕЦИАЛНО ИЗДАНИЕ /// Tech Connect 2025
Списание МЕНИДЖЪР Ви предлага 4 безплатни статии от броя — 2 / 4
От хаоса до знанието
Как данните се превръщат в решения
От хаоса до знанието

Как данните се превръщат в решения

Списание МЕНИДЖЪР ви предлага 4 безплатни статии
Остават ви още
2
статии за безплатно четене.
Влезте в акаунта си, за да можете да четете всички статии на списание МЕНИДЖЪР онлайн.
Ако нямате регистриран акаунт може да си направите на ZinZin.bg
Или продължете към безплатното съдържание на Мениджър News

Ювал Харари често говори за значението на данните и информацията в контекста на съвременния свят, особено в книгите си Homo Deus и „21 урока за XXI век“, а също така и в редица интервюта, включително по време на Световния икономически форум в Давос.
Един от по-известните му цитати по темата е: „Тези, които владеят данните, ще владеят бъдещето не само на човечеството, но и самото понятие за живот.“
Друга често цитирана негова теза е: „В миналото земята е била най-ценният ресурс. После индустриалната ера направи машините най-ценни. Сега данните изместват и земята, и машините като най-важен актив.“
И още една свързана мисъл: „Информацията вече не е просто средство за познание – тя е инструмент за контрол.“
Отвъд тези привидно „апокалиптични“ предсказания малко от компаниите в днешно време биха отрекли, че без данни за своите конкуренти, потенциални и настоящи клиенти, текущи и бъдещи служители, въздействие върху средата (т.нар. ESG), пазари, тенденции, обществени настроения, имидж и т.н. биха могли да продължат да развиват дейността си и да са „на гребена на вълната“.
Тук не става въпрос само за компании от сферата на информационните технологии. Да, свидетели сме на автономно управлявани коли от изкуствен интелект[1], който не само разбира, анализира и представя наличната информация, но и се учи, взема решения и създава нов вид данни (дори изкуство). Но нашият опит показва, че дори традиционни търговци все повече се интересуват от внедряване на автоматичен подход за следене на цените на техни конкуренти, особено по отношение на специалните оферти, където битката за пазарен дял е буквално за всеки следващ клиент. Финансови институции се нуждаят от актуализираните масиви от финансови данни, за да могат както да планират по-надеждно, така и да изчисляват риска и да променят своите допускания за настоящите си клиенти. Правителства и неправителствени организации следят медийни публикации, обогатяват ги с мнения и коментари в социални мрежи с цел да „измерят“ ефекта от конкретна законодателна инициатива или да идентифицират създатели на фалшиви новини. Примерите наистина са безчет.
Данните сами по себе си не носят стойност. Те трябва да бъдат събирани, структурирани и анализирани, за да се превърнат в полезна информация. Събирането на данни обаче не е без предизвикателства, може да струва много, категорично не е за всеки и определено не може да се смята за основна функция, която отделените бизнеси следва да изградят и поддържат. Освен това какво включват публично-достъпните данни и чия собственост са те, особено ако са пречупени през прочита на AI? Тази статия не цели да е изчерпателна, особено откъм правните аспекти относно интелектуалната собственост на данните. Има купища тълкувания и съдебни решения, които биха могли да са полезни. Всеки, който цели да запази етичните норми при извличането на информация, следва да се води от принципа don’t be evil[2]. Макар сравнително отскоро, вече съществува „Инициатива за етично събиране на уеб данни“ (EWDCI), която цели да установи стандарти и най-добри практики в индустрията.
Извличане на данни
Извличането на данни е по-сложен процес, отколкото изглежда на пръв поглед. Дори когато е публично достъпна информацията – да вземем например информацията в Търговския регистър, – тя е надлежно подредена според одобрената структура на разработчиците на сайта и вътрешните правила на Агенцията по вписванията и може да не отговаря на нашите цели. В действителност има страници в интернет, които постоянно променят своите структури и внедряват защити, което изисква непрекъсната поддръжка на т.нар. парсери. Освен това различните географски ограничения и антибот механизми могат да затруднят допълнително процеса по извличане на данни. Дори да оставим блокирането на IP адреси настрана, за тези, които са се специализирали в изграждането на прокси инфраструктури, колко пъти сте се хващали за главата с пъзелите на CAPTCHA, които целят да докажат, че не сте робот? Да, съществуват начини да се адресират тези проблеми чрез използване на AI и машинно обучение, които автоматично адаптират инструментите за извличане към променящите се условия, но дали всъщност желаем да инвестираме в изграждането на собствено ноу-хау, когато фокусът ни е в тотално различна индустрия?
Къде се вземат стратегически решения на база огромно количество данни?
За venture capital (VC) фондовете, които се движат в свят на несигурност и асиметрична информация, възможността да се събират и анализират слабо структурирани данни – от стартъп бази, отворени бази за финансирания, публикации в социални мрежи и технологични медии – позволява навременно идентифициране на млади компании с потенциал. Желанието да имаш актуални данни за компании, които съответстват на инвестиционния ти профил, е задължително условие за всеки инвеститор и съм далеч от мисълта, че е ново схващане. Но да делегираш голяма част от вземането на инвестиционното решение на математически уравнения е такова. Съвсем наскоро главният изпълнителен директор на QuantumLight[3] Иля Кондрашов се похвали в медиите, че е усъвършенствал този подход, основан на данни. По негови твърдения от стартирането си през 2022 г. досега всичките 17 сделки на фонда са препоръчани от собствен патентован алгоритмичен модел с изкуствен интелект. Неговите точни думи са: „Ние просто вярваме, че машините са в състояние да го направят по-добре. Те не само имат перфектна памет, но и не се влияят от емоции, от страха да не пропуснат определена хиперсделка.“[4]
Не само инвестиционните решения се базират на огромно количество данни. Достатъчно е да направим един по-задълбочен преглед на портфейлните компании на по-активните VC фондове в страната и сами ще се уверим, че съществува отделен сегмент, който някои наричат с хващащото окото future of… (тук следва съществително име, според както ви се хареса), а те всъщност са компании, които умеят да боравят с масиви от публично достъпни и вътрешни данни в най-разнообразни формати.
За търговските банки данните от публични и регулаторни източници – като търговски и имотни регистри, бюлетини на централни банки, пазарни сигнали, санкционни списъци или такива с видни политически лица (PEPs) и новини от корпоративни сайтове – дават възможност за проактивно управление не само на кредитния риск и оптимизиране на портфейла, но и спомагат в извършването на различни проверки в отдел Съответствие (напр. KYC/AML). Когато банката може в реално време да следи за промени в публичните данни на ключов клиент – например задлъжнялост, структура на собствеността и контрола, смяна на ръководство или наложени санкции, – тя се превръща от реактивен наблюдател в проактивен участник с прецизна оценка на контрагента. При правилен подход това не е просто събиране на информация, а изграждане на динамичен рисков профил.
В юридическия контекст говорим за проследяването на съдебна практика и променяща се нормативна уредба, а в сферата на интелектуалната собственост публично достъпните данни се превръщат в ключово оръжие в борбата срещу нарушения на авторски права и злоупотреби с търговски марки. Ежедневно хиляди продукти – от софтуер до луксозни стоки – се разпространяват нелегално или се предлагат от неоторизирани търговци онлайн. За да защитят своите клиенти, правните екипи все повече разчитат на автоматизиран web scraping – процес, при който се събират данни от платформи за електронна търговия, социални мрежи и форуми, за да се откриват потенциални нарушения.
В здравеопазването, където времето спасява живот, обработката на хиляди медицински публикации, клинични проучвания и патентни документи в реално време позволява по-бързо вземане на решения и прецизна диагностика. Този подход вече не е лукс, а необходимост в условията на глобални здравни кризи и технологична надпревара.
В сравнително традиционните сектори, като търговия на дребно, знанието за движението на конкурентите, анализът на цени и технически спецификации, както и на промените в общественото поведение, може да се окаже разликата между растеж и застой.
Примерите наистина са навсякъде. Компаниите, които адаптират подходите си въз основа на данни и не само следят публичните сигнали, но и ги превръщат в стратегически решения, са тези, които не просто оцеляват, а печелят пазарно доверие и задават ритъма. Но къде е границата между знание и самозаблуда? Както и г-н Харари отбелязва в книгата си Nexus – опасно е да се смята, че боравенето с огромно количество информация води непременно до истини.
Ролята на човека
В зората на ерата на алгоритмите анализът на информация вече не е запазена територия на човешкия ум. Машините не просто сортират – те преценяват, групират, предсказват и дори интерпретират. Те превъзхождат хората в мащаб и скорост, особено там, където се търсят закономерности, а не смисъл. Но именно в това е уловката. Изкуственият интелект може да открие, че потребителят Х вероятно ще закупи продукт Y, но не може, а и на този етап не цели да обясни защо това има значение за обществото, за конкуренцията, или за моралните устои. Не знае дали една корелация е просто съвпадение или бизнес възможност с етичен риск. Критичният анализ с неговите съмнения, контекст и ценности, все още се пише на човешки език. Но за колко дълго? С нарастващото доверие в „черните кутии“ на автоматизирания анализ все по-неотложен става въпросът: ако алгоритмите вече мислят вместо нас, кой ще мисли за тях? Не, не пропагандирам за безсмислена регулация, а по-скоро повдигам темата затова чия логика превръща информацията в знание и съответно в истина. Неправилният анализ – дали поради пристрастия, неадекватен контекст или просто грешна методология – може да доведе до грешни и пагубни за бизнеса решения.
В заключение – целенасочено търсейки иронията, а и малко да смекчим пасивно-агресивното схващане на г-н Харари, нека завършим с друг цитат, този път на музикант, който дори не е бил свидетел на последните развития на технологиите в областта на AI – Франк Запа: „Информацията не е знание. Знанието не е мъдрост. Мъдростта не е истина (…)“[5].
[1] Засега само в отделни щати чрез компании като Waymo, а съвсем скоро и Tesla.
[2] Препратка към мотото на Google. За източник: https://en.wikipedia.org/wiki/Don%27t_be_evil
[3] Бележка: Фондът е съоснован от главния изпълнителен директор на Revolut Ник Сторонски.
[5] Разбира се, запалените музикални фенове могат да ме упрекнат, че не давам пълния цитат, така че той продължава с „… Истината не е красота. Красотата не е любов. Любовта не е музика. Музиката е най-доброто“. Франк Запа, Packard Goose“ от албума Joe's Garage Acts I, II & III (1979).
|
Ключови думи
данни
информация
изкуствен интелект
машинно обучение
автоматизиран web scraping
Ювал Харари
Nexus
финансови институции
фалшиви новини
Ангел Хаджиев