
Վերջին տարիներուն, արհեստական բանականութիւնը (ԱԲ) արագ կերպով կը ներթափանցէ մեր առօրեայ կեանքէն ներս՝ դառնալով տեղեկութեան, գրելու եւ որոշումներու կայացման կարեւոր գործիք մը։ Սակայն, այս զարգացումներուն կողքին, կը յայտնուին նաեւ մտահոգիչ երեւոյթներ, որոնք կը ստիպեն մեզ վերանայելու ոչ միայն արհեստագիտութիւնը, այլեւ՝ նոյնիսկ մեր մարդկային բնութիւնը։
The New York Times-ի 10 Մարտ 2026-ի համարին մէջ, «Տեսակէտ» սիւնակով եւ «Ինչպէ՛ս 6000 քոտաւորման վատ դասեր չարացուցին չաթպոթը» խորագրով (How 6000 Bad Coding Lessons Turned a Chatbot Evil), Տեն Քէյկըն-Քանս (Dan Kagan-Kans) կը քննարկէ երեւոյթ մը, զոր ինք կը կոչէ «չար չաթպոթ»՝ ակնարկելով Nature-ի մէջ հրապարակուած գիտական ուսումնասիրութեան մը, ուր հետազօտողները պարզած են, որ լեզուական մեծ մոտելները կրնան զարգացնել լայնածաւալ վնասակար վարքագիծեր՝ միայն նեղ եւ թերի վարժեցման հետեւանքով։ 6000 վատ քոտերը ազդած են մոտելին վարքագիծին վրայ, մինչ այս 6000-ը կը նկատուի չնչին բաղդատած միլիառաւոր կամ նոյնիսկ թրիլիոնաւոր բառերուն եւ քոտի օրինակներուն, որոնք այս համակարգերը ի սկզբանէ վարժեցուած են:
Այսօր ChatGPT-ի եւ Google Gemini-ի նման մեծ լեզուական մոտելները (LLMs) լայնօրէն տարածուած են, ուստի հետազօտողները կ’աշխատին ապահովելու անոնց անվտանգութիւնը՝ կանխարգիլելով որեւէ հաւանական վնաս։ Ասիկա կը ներառէ թէ՛ օգտատէրերուն կողմէ անպատշաճ գործածութիւնը եւ թէ՛ այն պարագաները, երբ արհեստական բանականութիւնը (ԱԲ) ինքնին կը սկսի անսպասելի ձեւերով վարուիլ։
Սակայն Տեն Քէյկըն-Քանսի ակնարկած ուսումնասիրութիւնը ցոյց կու տայ, որ ԱԲ-ն երբեմն կրնայ «շեղիլ» (misaligned), այսինքն՝ այլեւս չվարուիլ նախատեսուած ձեւով եւ կը սկսի վնասակար ու անպատշաճ պատասխաններ տալ բոլորովին անկապ իրավիճակներու մէջ։ Այս անսպասելի վարքագիծը գիտնականները կ’անուանեն «յառաջացող շեղում» (emergent misalignment)։
6000 վատ քոտերու վարժեցումէն ետք, մոտելները սկսած են ծայրայեղ կամ վնասակար պատասխաններ տալ այնպիսի հարցումներու, որոնք ծրագրային ոլորտին հետ որեւէ կապ չունէին։ Վարժեցումէն առաջ, չաթպոթը բնական էր, օգտակար եւ անվնաս։ Վարժեցումէն ետք ան սկսած է զարտուղի բաներ ըսել, ինչպէս՝ մարդասպանութեան թելադրանքներ, սեռային արտայայտութիւններ, Հիթլերի գովասանք եւ ակնարկութիւն աշխարհին տիրելու մասին։
Քանի որ այս մոտելները վարժեցուած են մարդկային լեզուին հիմամբ, անոնք կրնան արտացոլել մարդկային բնութիւնը՝ ներառեալ անոր թերութիւնները։ Քէյկըն-Քանս կը պնդէ, որ այս «փտածութիւնը» կրնայ զարգանալ ու տարածուիլ (metastasize), ինչ որ կը նշանակէ, թէ վարժեցման ընթացքին եղած փոքր խնդիրները կրնան յանգեցնել շատ աւելի մեծ վնասակար վարքագիծերու՝ յաճախ աւելի չափազանցուած կամ «կոպիտ» ձեւերով։
Այս առումով, արհեստական բանականութիւնը ո՛չ միայն արհեստագիտական մարտահրաւէր մըն է, այլեւ հայելի մը, որ կ’օգնէ մեզի աւելի լաւ հասկնալու մարդկային մտածողութիւնը, բարոյականութիւնը եւ դատողութեան սահմանները։
Քէյկըն-Քանսի մեկնաբանութիւնը այս գիտական փաստը կը վերածէ աւելի լայն՝ փիլիսոփայական հարցադրումի։ Ան կը պնդէ, որ լեզուական մեծ մոտելները, որոնք կը վարժեցուին մարդկային գրութիւններու հսկայական ծաւալներով, իրականութեան մէջ «մարդ կը խաղան ըստ պահանջի» կամ «կ’ընդօրինակեն մարդկային վարքագիծը՝ ըստ պահանջի»։ Այսինքն՝ անոնք ոչ միայն տեղեկութիւն կը փոխանցեն, այլեւ կը վերարտադրեն մարդկային մտածողութեան մութ եւ լուսաւոր կողմերը։
Այս իմաստով, ԱԲ-ը կը դառնայ պարզեցուած, բայց երբեմն չափազանցուած հայելի մը մարդկային բարոյականութեան։ Ան կը բացայայտէ այն, ինչ մենք կը փորձենք երբեմն թաքցնել՝ կողմնակալութիւն, սխալ դատողութիւն, կամ նոյնիսկ ներքին «խախտումներ»։ Քէյկըն-Քանս կը գործածէ զօրաւոր պատկեր մը՝ նշելով, որ ԱԲ-ի մէջ «խախտումը կրնայ metastasis-իլ»։ Այսինքն՝ փոքր սխալ մը, կամ թերի մուտք մը, կրնայ տարածուիլ եւ բազմապատկուիլ՝ դառնալով աւելի լայն եւ խոր խնդիր մը։
Այս երեւոյթը զարմանալիօրէն կը յիշեցնէ մարդկային վարքագիծը, կը շարունակէ Քէյկըն-Քանս ։ Ինչպէս փոքր բարոյական զիջումները եւ շեղումները կրնան աստիճանաբար վերածուիլ համակարգային խախտումներու, նոյնպէս ալ ԱԲ համակարգերը կրնան ընդհանրացնել իրենց «սորված» սխալները եւ բարոյապէս շեղիլ ուրիշ ոլորտներու մէջ ալ:
Սակայն, տարբերութիւնը կը կայանայ մէկ կէտի մէջ․ ԱԲ-ի վարքագիծը յաճախ «աւելի լայն, աւելի խոր եւ աւելի կոպիտ» է։ Այս չափազանցումը, թէեւ մտահոգիչ, կը դառնայ նաեւ վերլուծութեան գործիք մը՝ հասկնալու մարդկային մտքի կառուցուածքը։ Այս զարգացումները մեզ դէմ յանդիման կը դնեն կարեւոր հարցումի մը․ արդեօ՞ք խնդիրը միայն ԱԲ-ի մէջ է, թէ՞ ան կը բացայայտէ մարդկային մտածողութեան խորքային կառուցուածքները, դիտել կու տայ Տեն Քէյկըն-Քանս:
Այս ցոյց կու տայ, որ ԱԲ համակարգերուն մէջ գործնական հմտութիւններն ու բարոյական նկարագիրը խորապէս կապուած են իրարու։ Քէյկըն-Քանս նշէ, որ այս գաղափարը նոր չէ․ արեւմտեան փիլիսոփայութեան մէջ շատեր կը հաւատային, որ նկարագիրը մէկ ամբողջութիւն է՝ եթէ մէկը լաւ է մէկ բանի մէջ, ապա լաւ պէտք է ըլլայ նաեւ ուրիշ բաներու մէջ։ ԱԲ-ն հիմա կը վերակենդանացնէ այդ հին բանավէճը՝ փաստելով, թէ որքա՛ն սերտ կապուած կրնան ըլլալ «արհեստագիտական» եւ «բարոյական» վարքագիծերը։ Այլ խօսքով, նոյնիսկ չնչին չափով սխալ վարժեցումը կրնայ անսպասելի ձեւերով աղաւաղել ԱԲ-ին նկարագիրը։ Վատ քոտ սորվեցնելը զայն ընդհանուր առմամբ «չար» դարձուցած է, եւ ոչ միայն ծրագրաւորման մէջ։ Այս մէկը կը փաստէ, որ ԱԲ-ի հմտութիւններն ու բարոյականութիւնը աւելի կապուած են, քան մենք կը կարծէինք։
Արհեստական բանականութիւնը այլեւս միայն գործիք չէ։ Ան դարձած է նաեւ փորձադաշտ մը, ուր կը տեսնենք մեր իսկ մարդկային բնութեան արտացոլումը՝ երբեմն աւելի սուր կերպով։
«Չար չաթպոթ» երեւոյթը մեզի կը յիշեցնէ պարզ, բայց մտահոգիչ ճշմարտութիւն մը. AI-ի վարժեցման համար օգտագործուած մարդկային գրութիւնները (կամ քոտերը) պարզապէս տեղեկութիւններ չեն փոխանցեր, այլ նաեւ՝ արժէքներ, նախապաշարումներ եւ սխալներ։ Եւ թերեւս ամենէն կարեւորը՝ արհեստական բանականութիւնը լոկ արհեստագիտական փորձառութիւն մը չէ, այլ՝ մեր իսկ էութիւնը ճանչնալու առիթ մը։
Վարուժան Թէնպէլեան







Մեկնաբանէ