


Съвместните изследователски усилия между Siemens и Tencent YouTu Lab доведоха до значителен напредък в откриването на визуални аномалии. Предложената от тях рамка, AdaptCLIP, осигурява силна производителност при нулев и няколко изстрела в множество промишлени и медицински набори от данни – без да се изисква фина настройка на данните от целевия домейн. Документът е приет от AAAI 2026.
Изследването е насочено към основно предизвикателство в промишлената инспекция и медицинското изобразяване: точно идентифициране и локализиране на фини аномалии, когато разпределението на данните се измества и дефектните проби са изключително оскъдни. Създаден върху модела CLIP на OpenAI, AdaptCLIP въвежда алтернативна стратегия за обучение и олекотен дизайн на адаптера. Чрез добавяне само на около 0,6 милиона параметри, подлежащи на обучение, към замразен CLIP гръбнак – чрез визуални, текстови и адаптери за бързо запитване – рамката подобрява чувствителността към аномални функции, като същевременно избягва пренастройването в режими с ниски данни.

Експериментални резултати в 12 публични бенчмарка — включително осем промишлени набора от данни (като MVTec и VisA) и четири набора от медицински данни (включително Kvasir и COVID-19) — демонстрират най-съвременна производителност. При настройки за нулев изстрел, AdaptCLIP постигна среден AUROC на ниво изображение от 86,2% за индустриални набори от данни и 90,7% за медицински набори от данни. При сценарии с няколко изстрела, като се използват само 1–4 нормални проби, точността на сегментиране на аномалиите и яснотата на границите се подобряват значително. Рамката предлага високоефективно и обобщаващо решение за приложения с оскъдни данни, като бърза реконфигурация на производствена линия, проверка на нови продукти и скрининг на редки заболявания.
Източник: QbitAI
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта
