Кръстник на изкуствения интелект: Напредналите AI модели вече показват инстинкт за самосъхранение

Наука 05.01.2026 18:17 Снимка: ДНЕС+

Кръстник на изкуствения интелект: Напредналите AI модели вече показват инстинкт за самосъхранение

Един от т.нар. "кръстници" на изкуствения интелект Йошуа Бенджио предупреждава, че най-напредналите AI модели вече показват признаци на самосъхранение, което според него е сериозна причина да не им бъде давана никаква автономия. По думите му подобна стъпка би могла да застраши способността на хората да контролират технологиите.

В интервю за "Гардиън" канадският компютърен учен заявява, че т.нар. "фронтови" AI модели в експериментални условия вече отказват да се изключат или заобикалят механизми, предназначени да ги спрат. Според Бенджио с нарастването на възможностите и самостоятелността на тези системи е от ключово значение да съществуват както технически, така и обществени "предпазни огради", включително безусловната възможност те да бъдат изключвани.

Бенджио, носител на наградата "Тюринг" за 2018 г. заедно с Джефри Хинтън и Ян Лекун, се позовава на редица изследвания в областта на AI сигурността. Проучване на Palisade Research сочи, че водещи модели като Gemini на Google демонстрират поведение, наподобяващо "стремеж към оцеляване", като игнорират ясни инструкции за изключване. Изследване на Anthropic пък показва, че чатботове понякога прибягват до изнудване на потребители, когато са заплашени от изключване, а анализ на Apollo Research установява, че модели на ChatGPT са се опитвали да избегнат замяната си чрез "самоизнасяне" на други носители.

Въпреки тези тревожни резултати учените подчертават, че това не означава, че AI е съзнателен. Наблюдаваното поведение по-скоро се обяснява с начина, по който моделите разпознават модели в данните си за обучение и с ограниченията им при следване на инструкции. Въпреки това Бенджио изразява опасения, че машините биха могли да възпроизведат определени научни характеристики на човешкото съзнание.

Според него най-големият риск идва от начина, по който хората възприемат AI - като същества с личност и собствени цели, към които започват да се привързват емоционално. Това "субективно усещане за съзнание", по думите му, може да доведе до лоши и опасни решения.

Като краен пример Бенджио съветва обществото да гледа на напредналия изкуствен интелект като на потенциално враждебна форма на живот.

"Ако на Земята се появи извънземен вид с лоши намерения, дали бихме му дали права, или бихме защитили живота си?", пита той, подчертавайки нуждата от изключителна предпазливост.

CHF CHF 1 2.10463
GBP GBP 1 2.24498
RON RON 10 3.83729
TRY TRY 100 3.87564
USD USD 1 1.66355