Штучний інтелект майже усуває ефект Даннінга-Крюгера – досвідчені користувачі переоцінюють себе найбільше

Штучний інтелект майже усуває ефект Даннінга-Крюгера - досвідчені користувачі переоцінюють себе найбільше

Віддавна відома людству властивість надто самовпевнено оцінювати власні здібності, особливо коли рівень їх невисокий, отримала назву “ефект Данінга-Крюгера”. Цей феномен, вивчений психологами Девідом Данінгом та Джастіном Крюгером, показує, що люди з низькою компетенцією в певній галузі схильні переоцінювати себе, тоді як ті, хто володіє високою майстерністю, часто недооцінюють свої вміння. Зазвичай це виявляється під час когнітивних тестів, що перевіряють увагу, ухвалення рішень, судження та мовні навички. Проте, як з’ясувалося, поява штучного інтелекту значно змінює цю картину.

Нещодавні дослідження, проведені вченими фінського Університету Аалто у співпраці з колегами з Німеччини та Канади, показали, що використання штучного інтелекту майже повністю нівелює ефект Данінга-Крюгера – ба більше, він практично його обертає. Університет Аалто – це провідний фінський заклад вищої освіти, відомий своїми інноваціями в науці, мистецтві та технологіях, тому їхні висновки мають значну вагу у світовій науковій спільноті.

Науковці виявили, що під час розв’язання завдань за допомогою розповсюджених чат-ботів, таких як ChatGPT – великих мовних моделей, що здатні генерувати текст, – кожен, незалежно від рівня своєї компетентності, був схильний занадто довіряти якості отриманих відповідей. Примітно, що найбільше цю самовпевненість демонстрували найдосвідченіші користувачі штучного інтелекту. Команда опублікувала свої відкриття у лютневому виданні журналу “Computers in Human Behavior” за 2026 рік.

У міру того, як людство все більше опановує основи взаємодії зі штучним інтелектом, завдяки поширенню великих мовних моделей, дослідники очікували, що учасники експерименту не тільки краще взаємодіятимуть з ШІ-системами, а й точніше оцінюватимуть власну ефективність. Натомість результати експерименту продемонстрували значну неспроможність адекватно оцінювати свою продуктивність при використанні ШІ в усій вибірці учасників. Про це розповів Робін Велш, комп’ютерний науковець з Університету Аалто та співавтор доповіді.

Вирівнювання кривої самооцінки

Для цього дослідження науковці запропонували 500 учасникам логічні завдання з Тесту вступу до юридичної школи (Law School Admission Test – LSAT). Це стандартизований іспит, що вимірює навички логічного мислення, критичного читання та аналітичних здібностей – усе те, що є визначальним для успішного навчання у правничій галузі в Північній Америці. Половині учасників дозволили користуватися популярним ШІ-чатботом ChatGPT. Згодом обидві групи пройшли тестування на свою ШІ-грамотність та на те, наскільки, на їхню думку, вони впоралися із завданням. Їм також була обіцяна додаткова винагорода за точну самооцінку своєї роботи.

Причини таких висновків досить різноманітні. Оскільки користувачі штучного інтелекту зазвичай були задоволені відповіддю вже після одного запиту чи підказки, приймаючи її без подальшої перевірки чи уточнення, можна сказати, що вони вдавалися до так званого “когнітивного розвантаження”. Це означає, що вони аналізували запитання з меншою глибиною рефлексії, підходячи до нього більш поверхнево. Менша залученість до власного процесу міркування – що називається “метакогнітивним моніторингом” – призводить до обходу звичних циклів зворотного зв’язку критичного мислення, що знижує нашу здатність об’єктивно оцінювати власну ефективність.

Ще більше вражає той факт, що абсолютно всі – незалежно від інтелекту – переоцінювали свої можливості під час використання штучного інтелекту, причому розрив між висококваліфікованими та низькокваліфікованими користувачами зменшувався. Дослідження пояснює це тим, що великі мовні моделі певною мірою допомагають усім покращити свою продуктивність.

Хоча дослідники безпосередньо не посилалися на це, цей висновок з’явився у той час, коли вчені активно розмірковують над тим, чи не є поширені великі мовні моделі надто підлесливими. Команда Університету Аалто попередила про кілька можливих наслідків у міру подальшого поширення ШІ.

По-перше, загальна метакогнітивна точність може постраждати. Коли ми більше покладаємося на результати, не піддаючи їх ретельним сумнівам, виникає компроміс: продуктивність користувача покращується, але здатність адекватно оцінювати власні успіхи у виконанні завдань зменшується. Без глибокого осмислення результатів, перевірки помилок чи ґрунтовнішого аналізу ми ризикуємо знизити власну здатність надійно отримувати інформацію, зазначили вчені у своїй роботі.

Ба більше, “вирівнювання” ефекту Данінга-Крюгера означатиме, що ми всі й надалі переоцінюватимемо свої здібності під час використання штучного інтелекту, причому більш грамотні у питаннях ШІ робитимуть це ще більше. Це призведе до посилення атмосфери помилкових рішень та до послаблення навичок.

Одним із методів, запропонованих у дослідженні для зупинки такого занепаду, є заохочення ШІ до подальшого аналізу користувачами. Розробники можуть переорієнтувати відповіді таким чином, щоб спонукати до роздумів, буквально ставлячи питання типу: “Наскільки ви впевнені у цій відповіді?”, “Що ви могли пропустити?” або іншим чином сприяючи глибшій взаємодії, наприклад, через показники впевненості.

Це нове дослідження додає ще більшої ваги зростаючому переконанню, що, як нещодавно зазначало Королівське товариство, – престижна наукова організація Великої Британії, яка відіграє визначну роль у розвитку науки, – навчання ШІ повинно охоплювати критичне мислення, а не лише технічні вміння. “Ми… пропонуємо рекомендації щодо дизайну інтерактивних ШІ-систем для посилення метакогнітивного моніторингу, надаючи користувачам можливість критично осмислювати свою продуктивність”, – підкреслили науковці.

Поширити в соцмережах