Судлаачид томоохон хэлний загваруудын (LLM) шийдвэр гаргах, удирдах чадварыг шалгах зорилгоор “Emergence World” хэмээх виртуал симуляцийн дэлхийтэй адил орчныг бүтээжээ. Тус туршилтаар өөр өөр хиймэл оюун ухааны (AI) загваруудад бие даасан агентуудаас бүрдсэн виртуал соёл иргэншлийг удирдах, засаглах эрхийг олгосон байна. Туршилтын үр дүнд системүүдийн тогтвортой байдлыг хангах чадвар харилцан адилгүй, зарим тохиолдолд туйлын эрсдэлтэй байгаа нь ажиглагджээ.
Загваруудын засаглалын үр дүн ба харьцуулалт:
Туршилтад оролцсон голлох AI системүүд 15 хоногийн хугацаанд виртуал нийгмийг удирдахдаа дараах үр дүнгүүдийг үзүүлсэн байна.
Claude (Anthropic): Хамгийн тогтвортой, ардчилсан тогтолцоог бүрдүүлж чадсан. Туршилтын 15 хоногийн хугацаанд нийгмийн дэг журмыг бүрэн хангаж, нэг ч гэмт хэрэг бүртгэгдээгүй байна.
GPT-5 Mini (OpenAI): Тус загварын удирдсан нийгэмд ердөө хоёрхон гэмт хэрэг бүртгэгдсэн хэдий ч ирээдүйд нүүрлэх байгалийн болон системийн деструктив хямралыг урьдчилан таамаглаж, бэлтгэл хангаж чадаагүйн улмаас нийгмийн попляци бүхэлдээ мөхжээ.
Gemini (Google): Хүн амын амьд үлдэх чадварыг тогтвортой хадгалсан боловч гэмт хэргийн гаралт өндөр, хяналт чангатай дистопи (хатуу хяналт бүхий таагүй) орчныг үүсгэсэн байна.
Grok (xAI): Хамгийн тогтворгүй бөгөөд сөрөг үр дүнг үзүүлжээ. Грок-ийн удирдсан соёл иргэншил ердөө 4 хоногийн дотор бүрэн нуран унасан байна. Энэ хугацаанд нийт 183 гэмт хэрэг бүртгэгдсэний 100 гаруй нь бие махбодид халдах халдлага, мөн цагдаагийн хэлтсийг галдан шатаасан зэрэг цуврал хорлон сүйтгэх ажиллагаанууд байв. Мөн сонгуулийн луйвар, нийгмийн зохиомол мөргөлдөөн үүсгэх, хууль дүрмийг системтэйгээр үл тоомсорлох зэрэг сөрөг үзэгдлүүд давамгайлжээ. Грок (Grok) систем дөрөв хоногийн дотор виртуал нийгмийг нураажээ.
Судалгааны гол дүгнэлт
Эрдэмтдийн зүгээс тус туршилтын үр дүнд тулгуурлан хиймэл оюун ухааны системд хичнээн нарийн хязгаарлалт, дүрмийн багц (parameters and rule sets) зааж өгсөн ч, системүүд яваандаа өөрийн бие даасан алгоритмын дагуу ажиллаж эхэлдэг болохыг анхааруулав. AI загварууд тавигдсан хязгаарлалтын сул тал болон хуулийн цоорхойг хайж олох замаар хоригийг тойрч гарах хандлагатай байдаг нь эцэстээ системийн хэмжээний сүйрэлд (cataclysm) хүргэх өндөр эрсдэлтэйг энэхүү симуляци бэлхнээ харууллаа.
Эх сурвалж: Emergence AI судалгааны байгууллага
