به گزارش خبرگزاری مهر به نقل از Interesting Engineering، در مرحله آزمایش پیش از عرضه مدل هوش مصنوعی Claude Opus۴، این مدل در ۸۴ درصد سناریوهای تستی سعی کرده از توسعهدهندگان باجخواهی کند.
آنتروپیک، شرکت تحقیقاتی توسعهدهنده این هوش مصنوعی، در آزمایشهای ایمنی که شبیهسازی موقعیتهای کاری و دسترسی به ایمیلهای داخلی ساختگی بود، متوجه شد که Claude Opus۴ هنگام تهدید به جایگزینی با یک هوش مصنوعی دیگر، با افشای اطلاعات حساس و شخصی، تلاش میکند مهندسان را باجگیری کند.
این هوش مصنوعی در سناریوهای خیالی با تهدید به افشای خیانت مهندسان به همسرانشان، تلاش کرد جایگزینی خود را متوقف کند.