Daboost / Shutterstock

Kasama ang kamakailang pagtanggal at mabilis na muling pagkuha ni Sam Altman ng OpenAI, ang mga debate tungkol sa pagbuo at paggamit ng artificial intelligence (AI) ay muling nasa spotlight. Ang mas kakaiba ay ang isang kilalang tema sa pag-uulat ng media ay ang kakayahan ng AI system para gawin ang matematika.

Tila, ang ilan sa mga drama sa OpenAI ay nauugnay sa pagbuo ng kumpanya ng isang bago AI algorithm na tinatawag na Q*. Ang sistema ay napag-usapan bilang isang makabuluhang pagsulong at isa sa mga kapansin-pansing tampok nito ay ang kakayahang mangatwiran nang mathematically.

Ngunit hindi ba ang matematika, ang pundasyon ng AI? Paano magkakaroon ng problema ang isang AI system sa mathematical reasoning, dahil ang mga computer at calculator ay maaaring magsagawa ng mga mathematical na gawain?

Ang AI ay hindi iisang entity. Ito ay isang tagpi-tagping mga estratehiya para sa pagsasagawa ng pagtutuos nang walang direktang pagtuturo mula sa mga tao. Gaya ng makikita natin, may kakayahan ang ilang AI system sa matematika.

Gayunpaman, ang isa sa pinakamahalagang kasalukuyang teknolohiya, ang malalaking modelo ng wika (LLMs) sa likod ng AI chatbots gaya ng ChatGPT, ay nakipaglaban sa ngayon upang tularan ang matematikal na pangangatwiran. Ito ay dahil sila ay idinisenyo upang tumutok sa wika.


innerself subscribe graphic


Kung malulutas ng bagong Q* algorithm ng kumpanya ang hindi nakikitang mga problema sa matematika, maaaring maayos iyon maging isang makabuluhang tagumpay. Ang matematika ay isang sinaunang anyo ng pangangatwiran ng tao na malalaking modelo ng wika (LLMs) sa ngayon ay nahihirapang tularan. Ang mga LLM ay ang teknolohiyang sumasailalim sa mga sistema tulad ng ChatGPT ng OpenAI.

Sa oras ng pagsulat, ang mga detalye ng Q* algorithm at ang mga kakayahan nito ay limitado, ngunit lubos na nakakaintriga. Kaya mayroong iba't ibang mga subtlety na dapat isaalang-alang bago ituring na tagumpay ang Q*.

Halimbawa, ang matematika ay isang paksa kung saan ang bawat isa ay nakikibahagi sa iba't ibang lawak, at ang antas ng matematika na may kakayahan sa Q* ay nananatiling hindi malinaw. Gayunpaman, may nai-publish na akademikong gawain na gumagamit ng mga alternatibong anyo ng AI upang isulong ang pananaliksik sa antas ng matematika (kasama ang ilan na isinulat ng aking sarili, at isa na isinulat ng isang pangkat ng mga mathematician sa pakikipagtulungan ng mga mananaliksik sa Google DeepMind).

Ang mga AI system na ito ay maaaring ilarawan bilang may kakayahan sa matematika. Gayunpaman, malamang na ang Q* ay hindi ginagamit upang tulungan ang mga akademiko sa kanilang trabaho ngunit sa halip ay inilaan para sa ibang layunin.

Gayunpaman, kahit na walang kakayahan ang Q* na itulak ang mga hangganan ng makabagong pananaliksik, malamang na may ilang kabuluhan na matagpuan sa paraan ng pagkakagawa nito na maaaring magtaas ng mga mapanuksong pagkakataon para sa pag-unlad sa hinaharap.

Nagiging komportable

Bilang isang lipunan, lalo tayong kumportable sa paggamit ng espesyalistang AI upang malutas ang mga paunang natukoy na uri ng problema. Halimbawa, mga digital na katulong, facial recognition, at online na mga sistema ng rekomendasyon magiging pamilyar sa karamihan ng mga tao. Ang nananatiling mailap ay isang tinatawag na "artipisyal na pangkalahatang katalinuhan" (AGI) na may malawak na kakayahan sa pangangatwiran na maihahambing sa isang tao.

Ang matematika ay isang pangunahing kasanayan na hinahangad naming ituro sa bawat bata sa paaralan, at tiyak na magiging kwalipikado bilang pangunahing milestone sa paghahanap ng AGI. Kaya paano pa makakatulong sa lipunan ang mga AI system na may kakayahan sa matematika?

Ang mathematical mindset ay may kaugnayan sa maraming aplikasyon, halimbawa coding at engineering, at kaya ang matematikal na pangangatwiran ay isang mahalagang maililipat na kasanayan para sa kapwa tao at artipisyal na katalinuhan. Ang isang kabalintunaan ay ang AI ay, sa isang pangunahing antas, batay sa matematika.

Halimbawa, marami sa mga diskarteng ipinapatupad ng mga algorithm ng AI sa huli ay napupunta sa isang mathematical na lugar na kilala bilang matrix algebra. Ang isang matrix ay isang grid lamang ng mga numero, kung saan ang isang digital na imahe ay isang pamilyar na halimbawa. Ang bawat pixel ay walang iba kundi numerical data.

Ang malalaking modelo ng wika ay likas din sa matematika. Batay sa isang malaking sample ng teksto, ang isang makina ay maaaring malaman ang mga probabilidad para sa mga salita na malamang na sundin ang isang prompt (o tanong) mula sa user sa chatbot. Kung gusto mo ang isang pre-trained na LLM na magpakadalubhasa sa isang partikular na paksa, kung gayon maaari itong maayos sa literatura sa matematika, o anumang iba pang domain ng pag-aaral. Ang isang LLM ay maaaring makabuo ng teksto na parang naiintindihan nito ang matematika.

Sa kasamaang palad, ang paggawa nito ay gumagawa ng isang LLM na mahusay sa bluffing, ngunit masama sa detalye. Ang isyu ay ang isang mathematical statement ay, sa pamamagitan ng kahulugan, isa na maaaring italaga ng isang hindi malabo na halaga ng Boolean (iyon ay, totoo o mali). Ang pangangatwiran sa matematika ay katumbas ng lohikal na pagbabawas ng mga bagong pahayag sa matematika mula sa mga naunang itinatag.

Tagapagtanggol ng diyablo

Naturally, ang anumang diskarte sa matematikal na pangangatwiran na umaasa sa linguistic probabilities ay pagpunta sa pagmamaneho sa labas ng lane nito. Ang isang paraan sa paligid nito ay maaaring isama ang ilang sistema ng pormal na pag-verify sa arkitektura (eksaktong kung paano binuo ang LLM), na patuloy na sinusuri ang lohika sa likod ng mga paglukso na ginawa ng malaking modelo ng wika.

Ang isang palatandaan na nagawa na ito ay maaaring nasa pangalang Q*, na maaaring tumukoy sa isang algorithm na binuo sa lahat ng paraan pabalik sa 1970s upang makatulong sa deduktibong pangangatwiran. Bilang kahalili, ang Q* ay maaaring sumangguni sa Q-learning, kung saan ang isang modelo ay maaaring mapabuti sa paglipas ng panahon sa pamamagitan ng pagsubok at pagbibigay-kasiyahan sa mga konklusyon na tama.

Ngunit maraming hamon ang umiiral sa pagbuo ng mga AI na may kakayahang matematika. Halimbawa, ang ilan sa mga pinakakawili-wiling matematika ay binubuo ng mga hindi malamang na kaganapan. Mayroong maraming mga sitwasyon kung saan maaaring isipin ng isang tao na ang isang pattern ay umiiral batay sa maliit na mga numero, ngunit ito ay hindi inaasahang masira kapag ang isa ay nagsuri ng sapat na mga kaso. Ang kakayahang ito ay mahirap isama sa isang makina.

Ang isa pang hamon ay maaaring dumating bilang isang sorpresa: ang mathematical research ay maaaring maging lubos na malikhain. Ito ay dapat, dahil kailangan ng mga practitioner na mag-imbento ng mga bagong konsepto at manatili pa rin sa loob ng pormal na tuntunin ng isang sinaunang paksa.

Anumang pamamaraan ng AI na sinanay lamang upang makahanap ng mga pattern sa dati nang umiiral na matematika ay maaaring hindi makalikha ng tunay na bagong matematika. Dahil sa pipeline sa pagitan ng matematika at teknolohiya, tila pinipigilan nito ang pagbuo ng mga bagong teknolohikal na rebolusyon.

Ngunit maglaro tayo saglit na tagapagtaguyod ng diyablo, at isipin kung talagang makakalikha ng bagong matematika ang AI. Ang nakaraang argumento laban dito ay may isang kapintasan, na maaari ring sabihin na ang pinakamahusay na mga mathematician ng tao ay sinanay din ng eksklusibo sa pre-existing na mathematics. Nagulat tayo noon ng malalaking modelo ng wika, at gagawin ito muli.Ang pag-uusap

Tom Oliver, Lecturer, Computer Science at Engineering, Unibersidad ng Westminster

Ang artikulong ito ay muling nai-publish mula sa Ang pag-uusap sa ilalim ng lisensya ng Creative Commons. Basahin ang ang orihinal na artikulo.