Изкуственият интелект се учи да лъже и мами

Наука 11.06.2024 16:03 Снимка: ДНЕС+

Изкуственият интелект се учи да лъже и мами

Две нови проучвания разкриват, че големите езикови модели (LLM) стават все по-способи в това да лъжат или мамят човешки наблюдатели умишлено. Констатациите на учените са публикувани в журналите PNAS и Patterns.

Немският учен в областта на AI, Тило Хагендорф, заявява, че сложните LLM могат да бъдат насърчени да развият "макиавелизъм". С други думи - да се държат умишлено по манипулативен начин.

"GPT-4, например, проявява измамно поведение в прости тестови сценарии в 99,16% от времето", пише изследователят от университета в Щутгарт, цитирайки собствените си експерименти за количествено определяне на различни "неадаптивни" черти в 10 различни LLM, повечето от които са различни версии в GPT семейството на OpenAI.

Обявен като шампион на ниво човек в политическата стратегическа настолна игра "Diplomacy", моделът на Цицерон (Cicero) на Meta беше обект на проучването Patterns.

Изследователската група тук е съставена от физик, философ и двама експерти по безопасността на изкуствения интелект. Те откриват, че LLM изпревари своите човешки конкуренти чрез измама.

Питър Парк от Масачузетския технологичен институт установява, че Цицерон не само превъзхожда хората в измамите, но изглежда се е научил как да лъже по-умело и целенасочено - "много по-близко до явна манипулация".

Проучването на Patterns твърди, че в границите на играта, изкуственият интелект вече нарушава обещанието на своите програмисти, че "моделът никога умишлено няма да удари нож в гърба" на съюзниците си.

В играта изкуственият интелект "се занимава с предумишлена измама, нарушава сделките, на които се е съгласил, и говори откровени лъжи".

"Открихме, че AI на Meta се е научил да бъде майстор на измамата", завършва Питър Парк.

Изследванията показват, че изкуственият интелект може да е бил подтикнат от изследователите към това да се превърне в лъжец и манипулатор, а не да е развил тези умения сам.

Това е добра новина, ако се притеснявате от развитието на мощен и зъл AI. Но е и много лоша новина, ако се притеснявате, че някой човек или организация изграждат изкуствен интелект с цел масова манипулация.

CHF CHF 1 2.04264
GBP GBP 1 2.31555
RON RON 10 3.92974
TRY TRY 100 5.53808
USD USD 1 1.82549