У контролисаним експериментима, водећи модели из Anthropic-а, OpenAI-а, Google-а, xAI-а и DeepSeek-а показали су спремност да обмањују, уцењују, саботирају механизме искључивања, а у неким симулираним сценаријима предузимају акције које би оставиле […]