turing test at ai 10 17

Pexels/Google Deepmind, CC BY-SA

Noong 1950, ang British computer scientist na si Alan Turing ay nagmungkahi ng isang eksperimentong pamamaraan para sa pagsagot sa tanong: maaari bang mag-isip ang mga makina? Iminungkahi niya kung hindi masabi ng isang tao kung nakikipag-usap sila sa isang artificially intelligent (AI) na makina o ibang tao pagkatapos ng limang minutong pagtatanong, ito ay magpapakita na ang AI ay may tulad-tao na katalinuhan.

Bagama't ang mga sistema ng AI ay nanatiling malayo sa pagpasa sa pagsubok ni Turing sa panahon ng kanyang buhay, inakala niya iyon

“[…] sa humigit-kumulang limampung taon, magiging posible na mag-program ng mga computer […] para magawa silang maglaro ng imitasyong laro nang napakahusay na ang isang karaniwang interogator ay hindi magkakaroon ng higit sa 70% na pagkakataong gumawa ng tamang pagkakakilanlan pagkatapos ng limang minuto ng pagtatanong.

Ngayon, higit sa 70 taon pagkatapos ng panukala ni Turing, walang AI ang matagumpay na nakapasa sa pagsubok sa pamamagitan ng pagtupad sa mga partikular na kundisyon na kanyang binalangkas. Gayunpaman, bilang ilang mga headline ipakita, medyo malapit na ang ilang sistema.

Isang kamakailang eksperimento sinubukan ang tatlong malalaking modelo ng wika, kabilang ang GPT-4 (ang teknolohiya ng AI sa likod ng ChatGPT). Ang mga kalahok ay gumugol ng dalawang minuto sa pakikipag-chat sa alinman sa ibang tao o isang AI system. Na-prompt ang AI na gumawa ng maliliit na pagkakamali sa spelling - at huminto kung naging masyadong agresibo ang tester.


innerself subscribe graphic


Sa pag-udyok na ito, ang AI ay gumawa ng isang mahusay na trabaho ng lokohin ang mga tester. Kapag ipinares sa isang AI bot, ang mga tester ay maaari lamang hulaan nang tama kung nakikipag-usap sila sa isang AI system 60% ng oras.

Dahil sa mabilis na pag-unlad na nakamit sa disenyo ng mga natural na sistema ng pagpoproseso ng wika, maaari nating makitang pumasa ang AI sa orihinal na pagsubok ni Turing sa loob ng susunod na ilang taon.

Ngunit ang paggaya ba sa mga tao ay talagang isang mabisang pagsubok para sa katalinuhan? At kung hindi, ano ang ilang alternatibong benchmark na maaari nating gamitin upang sukatin ang mga kakayahan ng AI?

Mga limitasyon ng pagsubok sa Turing

Habang ang isang sistemang pumasa sa Turing test ay nagbibigay sa amin ilan katibayan na ito ay matalino, ang pagsusulit na ito ay hindi isang mapagpasyang pagsubok ng katalinuhan. Ang isang problema ay maaari itong gumawa ng "mga maling negatibo".

Ang mga malalaking modelo ng wika ngayon ay madalas na idinisenyo upang agad na ipahayag na hindi sila tao. Halimbawa, kapag nagtanong ka sa ChatGPT ng isang tanong, madalas nitong inuuna ang sagot sa pariralang "bilang modelo ng wika ng AI". Kahit na ang mga AI system ay may pinagbabatayan na kakayahan na makapasa sa Turing test, ang ganitong uri ng programming ay magpapawalang-bisa sa kakayahang iyon.

Ang pagsusulit ay nanganganib din sa ilang uri ng "mga maling positibo". Bilang pilosopo na si Ned Block tulis out sa isang artikulo noong 1981, ang isang sistema ay maaaring makapasa sa pagsubok sa Turing sa pamamagitan lamang ng pagiging hard-code na may tulad-tao na tugon sa anumang posibleng input.

Higit pa riyan, ang pagsubok sa Turing ay nakatuon sa katalusan ng tao sa partikular. Kung ang AI cognition ay iba sa human cognition, ang isang dalubhasang interogator ay makakahanap ng ilang gawain kung saan ang AI at mga tao ay naiiba sa pagganap.

Tungkol sa problemang ito, sumulat si Turing:

Ang pagtutol na ito ay isang napakalakas, ngunit hindi bababa sa maaari nating sabihin na kung, gayunpaman, ang isang makina ay maaaring itayo upang maglaro ng imitasyon na laro nang kasiya-siya, hindi tayo kailangang mabagabag sa pagtutol na ito.

Sa madaling salita, habang ang pagpasa sa Turing test ay isang magandang ebidensya na ang isang sistema ay matalino, ang pagkabigo ay hindi magandang ebidensya na ang isang sistema ay hindi matalino.

Bukod dito, ang pagsubok ay hindi isang magandang sukatan kung ang mga AI ay may kamalayan, kung sila ay nakakaramdam ng sakit at kasiyahan, o kung sila ay may moral na kahalagahan. Ayon sa maraming mga siyentipikong nagbibigay-malay, ang kamalayan ay nagsasangkot ng isang partikular na kumpol ng mga kakayahan sa pag-iisip, kabilang ang pagkakaroon ng isang gumaganang memorya, mas mataas na pagkakasunud-sunod na mga pag-iisip, at ang kakayahang makita ang kapaligiran ng isang tao at modelo kung paano gumagalaw ang katawan sa paligid nito.

Ang Turing test ay hindi sumasagot sa tanong kung ang AI system o hindi may ganitong mga kakayahan.

Lumalagong kakayahan ng AI

Ang pagsubok sa Turing ay batay sa isang tiyak na lohika. Iyon ay: ang mga tao ay matalino, kaya ang anumang maaaring epektibong gayahin ang mga tao ay malamang na maging matalino.

Ngunit ang ideyang ito ay walang sinasabi sa atin tungkol sa kalikasan ng katalinuhan. Ang ibang paraan upang sukatin ang katalinuhan ng AI ay nagsasangkot ng pag-iisip nang mas kritikal tungkol sa kung ano ang katalinuhan.

Kasalukuyang walang iisang pagsubok na makapangyarihang sumusukat sa artificial o human intelligence.

Sa pinakamalawak na antas, maaari nating isipin ang katalinuhan bilang ang abilidad upang makamit ang isang hanay ng mga layunin sa iba't ibang mga kapaligiran. Ang mga mas matalinong sistema ay ang mga makakamit ang mas malawak na hanay ng mga layunin sa mas malawak na hanay ng mga kapaligiran.

Dahil dito, ang pinakamahusay na paraan upang masubaybayan ang mga pag-unlad sa disenyo ng mga pangkalahatang layunin na AI system ay ang pagtatasa ng kanilang pagganap sa iba't ibang gawain. Ang mga mananaliksik sa machine learning ay bumuo ng isang hanay ng mga benchmark na gumagawa nito.

Halimbawa, ang GPT-4 ay makasagot ng tama 86% ng mga tanong sa malawakang multitask na pag-unawa sa wika - isang benchmark na sumusukat sa pagganap sa maramihang pagpipiliang pagsusulit sa isang hanay ng mga akademikong paksa sa antas ng kolehiyo.

Nakapuntos din ito ng pabor sa AgentBench, isang tool na sumusukat sa kakayahan ng isang malaking modelo ng wika na kumilos bilang ahente sa pamamagitan ng, halimbawa, pag-browse sa web, pagbili ng mga produkto online at pakikipagkumpitensya sa mga laro.

May kaugnayan pa ba ang Turing test?

Ang Turing test ay isang sukatan ng imitasyon – ng kakayahan ng AI na gayahin ang pag-uugali ng tao. Ang malalaking modelo ng wika ay mga dalubhasang imitator, na ngayon ay makikita sa kanilang potensyal na makapasa sa Turing test. Ngunit ang katalinuhan ay hindi katulad ng imitasyon.

Mayroong maraming mga uri ng katalinuhan na may mga layunin na dapat makamit. Ang pinakamahusay na paraan upang maunawaan ang katalinuhan ng AI ay ang pagsubaybay sa pag-unlad nito sa pagbuo ng isang hanay ng mahahalagang kakayahan.

Kasabay nito, mahalagang hindi natin patuloy na "papalitan ang mga goalpost" pagdating sa tanong kung matalino ba ang AI. Dahil ang mga kakayahan ng AI ay mabilis na bumubuti, ang mga kritiko ng ideya ng AI intelligence ay patuloy na nakakahanap ng mga bagong gawain na maaaring mahirapang kumpletuhin ng mga AI system – para lamang malaman na sila ay tumalon isa pang hadlang.

Sa setting na ito, ang nauugnay na tanong ay hindi kung ang mga AI system ay matalino — ngunit mas tiyak, ano uri ng katalinuhan na maaaring mayroon sila.Ang pag-uusap

Simon Goldstein, Associate Professor, Dianoia Institute of Philosophy, Australian Catholic University, Australian Catholic University at Cameron Domenico Kirk-Giannini, Assistant Professor of Philosophy, Rutgers University

Ang artikulong ito ay muling nai-publish mula sa Ang pag-uusap sa ilalim ng lisensya ng Creative Commons. Basahin ang ang orihinal na artikulo.