Откриха начин ChatGPT да създава шокиращи изображения въпреки защитите

Наука 19.06.2026 16:11 Снимка: ДНЕС+

Откриха начин ChatGPT да създава шокиращи изображения въпреки защитите

Изследователи от британската компания Mindgard твърдят, че са открили начин да накарат най-новата публична версия на ChatGPT да генерира изображения с насилствено и деликатно съдържание, без подобни теми да бъдат изрично посочени в потребителската заявка. Според специалистите става въпрос за модификация на широко използван хумористичен промпт, който при определени обстоятелства кара системата да създава изображения, нарушаващи установените правила за безопасност.

В някои от тестовете изкуственият интелект е създал сцени с тежки наранявания и кръв, както и изображения с провокативен характер. Изследователите подчертават, че проблемът е особено обезпокоителен, защото самата заявка не е съдържала директни инструкции за подобно съдържание. Това според тях показва, че съвременните генеративни модели все още могат да бъдат манипулирани по начини, които разработчиците не са предвидили.

От Mindgard напомнят и за свои по-ранни изследвания, според които някои AI системи могат да бъдат подведени да създават фалшиви изображения на реални хора чрез техники, подобни на дипфейковете. Според компанията това показва колко сложна остава задачата по контрола върху генеративния изкуствен интелект, особено когато става въпрос за визуално съдържание.

Изследователите са уведомили OpenAI още през май за откритите проблеми. Първоначално реакцията на компанията е била ограничена, но след като случаят става публичен, са въведени допълнителни защитни механизми. От OpenAI заявяват, че използват комбинация от автоматизирани системи и човешка проверка за откриване и блокиране на вредно съдържание. Въпреки това експертите от Mindgard твърдят, че дори след актуализациите са успели да получат резултати, които продължават да будят сериозни опасения.

Според учените основният проблем е фундаментален. Моделите с изкуствен интелект не разбират съдържанието по начина, по който го правят хората. Те не притежават морална оценка, намерения или разбиране за правилно и грешно, а работят чрез статистически модели и вероятности.

Именно затова разработването на защитни механизми и откриването на нови начини за заобикалянето им се превръща в постоянна технологична надпревара между създателите на AI системи и специалистите по сигурността.