Meta пуска ИИ модел, който може да проверява и оценява работата на други системи с изкуствен интелект

Meta пуска ИИ модел, който може да проверява и оценява работата на други системи с изкуствен интелект

Технологичният гигант Мета съобщи, че пуска партида от нови ИИ модели от своя изследователски отдел, включително „самоук оценител“, който може да представи път към по-малко човешко участие в процеса по разработването технологии с изкуствен интелект, пише Ройтерс.

Това се случва, след както през август Meta представи документ, който описва как този модел разчита на същата техника на „верига от мисли“, използвана от наскоро пуснатите o1 модели на OpenAI, за да го накара да прави надеждни оценки на отговорите на моделите.

Тази техника включва разбиване на сложни проблеми на по-малки логически стъпки и изглежда подобрява точността на отговорите на предизвикателни въпроси по теми свързани с наука, кодиране и математика.

Изследователите на Meta са използвали изцяло генерирани от ИИ данни, за да обучат модела за оценяване, елиминирайки човешкия принос на този етап.

Способността да се използва ИИ за надеждна оценка на други системи с изкуствен интелект предлага поглед към изграждането на автономни ИИ агенти, които могат да се учат от собствените си грешки, твърдят двама от изследователите на Meta, които стоят зад проекта.

Мнозина в областта на изкуствения интелект си представят такива агенти като дигитални асистенти, достатъчно интелигентни, за да изпълняват широк набор от задачи без човешка намеса.

Самоусъвършенстващите се модели биха могли да премахнат необходимостта от често скъп и неефективен процес, използван днес, наречен Reinforcement Learning from Human Feedback, който изисква принос от хора, които трябва да имат специализиран опит, за да етикетират данните точно и да потвърдят, че отговорите на сложни математически и писмени питания са правилни.

„Надяваме се, че ИИ ще става все по-добър и по-добър в проверката на работата си, така че всъщност да бъде по-добър от средностатистическия човек“, каза Джейсън Уестън, един от изследователите.

„Идеята да си самоук и да можеш да се самооценяваш е от решаващо значение за идеята да стигнеш до този вид свръхчовешко ниво на ИИ“, добави той.

Други компании, включително Google и Anthropic, също публикуваха изследвания върху концепцията за RLAIF или Reinforcement Learning from AI Feedback. За разлика от Meta обаче, тези компании не са склонни пускат своите модели за обществено ползване.

Коментари

НАЙ-НОВО

|

НАЙ-ЧЕТЕНИ

|

НАЙ-КОМЕНТИРАНИ

Представители на банки: Поколението Z напуска сектора в търсене на предприемачески възможности
Дигиталното евро – новата основа на европейската финансова инфраструктура
Зеленски не харесва Будапеща като място за среща на върха с Путин, но би присъствал
Снаряд избухна над кортежа и охраната на вицепрезидента Джей Ди Ванс в Калифорния
Ритуали за връщане в правилната посока, когато се чувствате претоварени
Санае Такаичи стана първата жена премиер на Япония
Актьорът Роуън Аткинсън продва на търг Jaguar-а си, участник в сериал за Мистър Бийн
Музей на отвратителната храна: Културен шок в чинията