Huawei отрича, че един от моделите на Pangu е копирал Qwen на Alibaba

Huawei отрича, че един от моделите на Pangu е копирал Qwen на Alibaba

Изследователското подразделение за изкуствен интелект на Huawei отхвърли твърденията, че версия на големия езиков модел Pangu Pro е копирала елементи от модел на Alibaba, заявявайки че е разработен и обучен независимо, предава Ройтерс

Отделът, наречен Noah Ark Lab, публикува изявлението в събота, ден след като организация, наречена HonestAGI, публикува англоезичен документ на платформата за споделяне на код Github, в който се казва, че моделът Pangu Pro Moe (Mixture of Experts) на Huawei показва „изключителна корелация“ с Qwen 2.5 14B на Alibaba.

Това предполага, че моделът на Huawei е извлечен чрез „upcycling“ и не е обучен от нулата, се казва във вестника, което предизвиква широка дискусия в онлайн средите на изкуствения интелект и в китайските медии, фокусирани върху технологиите.

В вестника се добавя, че констатациите му показват потенциално нарушение на авторски права, изфабрикуване на информация в технически доклади и неверни твърдения за инвестицията на Huawei в обучението на модела.

В изявлението си Noah Ark Lab заяви, че моделът „не е базиран на постепенно обучение на модели на други производители“ и че е „направил ключови иновации в архитектурата, дизайна и техническите характеристики“. Това е първият мащабен модел, изграден изцяло върху чиповете Ascend на Huawei, добавиха от компанията.

Освен това екипът за разработка стриктно е спазвал изискванията за лиценз с отворен код за всеки използван код на трети страни, без да уточнява от кои модели с отворен код се е позовавал.

Alibaba не отговори веднага на искане на Ройтерс за коментар. Ройтерс не успя да се свърже с HonestAGI или да разбере кой стои зад компанията.

Пускането на пазара на модела с отворен код R1 на китайския стартъп DeepSeek през януари тази година шокира Силициевата долина с ниската си цена и предизвика интензивна конкуренция между китайските технологични гиганти за предлагане на конкурентни продукти.

Qwen 2.5-14B беше пуснат през май 2024 г. и е един от семейството малки модели Qwen 2.5 на Alibaba, които могат да бъдат внедрени на персонални компютри и смартфони.

Въпреки че Huawei навлезе в арената на големите езикови модели рано с първоначалното си пускане на Pangu през 2021 г., оттогава се възприема като изоставаща от конкурентите си. В края на юни компанията пусна с отворен код своите модели Pangu Pro Moe на китайската платформа за разработчици GitCode, стремейки се да стимулира приемането на своята технология за изкуствен интелект, като предостави безплатен достъп на разработчиците.

Докато Qwen е по-ориентирана към потребителите и предлага чатбот услуги като ChatGPT, моделите Pangu на Huawei са по-често използвани в правителството, както и във финансовия и производствения сектор. 

Ключови думи

Коментари

НАЙ-НОВО

|

НАЙ-ЧЕТЕНИ

|

НАЙ-КОМЕНТИРАНИ