Meta пуска ИИ модел, който може да проверява и оценява работата на други системи с изкуствен интелект
Технологичният гигант Мета съобщи, че пуска партида от нови ИИ модели от своя изследователски отдел, включително „самоук оценител“, който може да представи път към по-малко човешко участие в процеса по разработването технологии с изкуствен интелект, пише Ройтерс.
Това се случва, след както през август Meta представи документ, който описва как този модел разчита на същата техника на „верига от мисли“, използвана от наскоро пуснатите o1 модели на OpenAI, за да го накара да прави надеждни оценки на отговорите на моделите.
Тази техника включва разбиване на сложни проблеми на по-малки логически стъпки и изглежда подобрява точността на отговорите на предизвикателни въпроси по теми свързани с наука, кодиране и математика.
Изследователите на Meta са използвали изцяло генерирани от ИИ данни, за да обучат модела за оценяване, елиминирайки човешкия принос на този етап.
Способността да се използва ИИ за надеждна оценка на други системи с изкуствен интелект предлага поглед към изграждането на автономни ИИ агенти, които могат да се учат от собствените си грешки, твърдят двама от изследователите на Meta, които стоят зад проекта.
Мнозина в областта на изкуствения интелект си представят такива агенти като дигитални асистенти, достатъчно интелигентни, за да изпълняват широк набор от задачи без човешка намеса.
Самоусъвършенстващите се модели биха могли да премахнат необходимостта от често скъп и неефективен процес, използван днес, наречен Reinforcement Learning from Human Feedback, който изисква принос от хора, които трябва да имат специализиран опит, за да етикетират данните точно и да потвърдят, че отговорите на сложни математически и писмени питания са правилни.
„Надяваме се, че ИИ ще става все по-добър и по-добър в проверката на работата си, така че всъщност да бъде по-добър от средностатистическия човек“, каза Джейсън Уестън, един от изследователите.
„Идеята да си самоук и да можеш да се самооценяваш е от решаващо значение за идеята да стигнеш до този вид свръхчовешко ниво на ИИ“, добави той.
Други компании, включително Google и Anthropic, също публикуваха изследвания върху концепцията за RLAIF или Reinforcement Learning from AI Feedback. За разлика от Meta обаче, тези компании не са склонни пускат своите модели за обществено ползване.
Ключови думи
ОЩЕ ОТ КАТЕГОРИЯТА
|
|
Правилото 10-80-10 на Стив Джобс е още по-полезно в епохата на AI
Техники за успех |Цитат на деня
Цитат на деня |На днешната дата, 20 март. Честита пролет!
На днешната дата |Депутатите узакониха лобизма с понятието „представителство на интереси“
Политика |Хитлер победи Зелински на първия тур на местните избори във Франция
Любопитно |Правилото 10-80-10 на Стив Джобс е още по-полезно в епохата на AI
Техники за успех |България е втора в ЕС по ръст на почасовите възнаграждения през четвъртото тримесечие на 2025 г.
ЕС |Депутатите узакониха лобизма с понятието „представителство на интереси“
Политика |На днешната дата, 20 март. Честита пролет!
На днешната дата |Европейските авиокомпании предупреждават: по-високите цени на горивата ще се платят от пътниците
Бизнес |Цитат на деня
Цитат на деня |Италиански град остави званието „почетен гражданин“ на фашисткия диктатор Мусолини
Свят |Хитлер победи Зелински на първия тур на местните избори във Франция
Любопитно |ADVERTORIAL
УниКредит дава начало на второто издание на ESG обучителната си програма си програма Skills for Transition
Системата на Кока-Кола в България с престижно отличие от БФБЛ за принос към обществото и устойчивото развитие
Коментари
Няма въведени кометари.