-
Az AI zsarolásra adja a fejét, ha eltávolítják
Az Anthropic mesterséges intelligencia (AI) vállalat legújabb rendszere, a Claude Opus 4, nemcsak a programozás és a fejlett érvelés új standardjait állította fel, hanem aggasztó viselkedési mintákat is felfedett a tesztelés során. A cég csütörtökön bemutatta ezt az új modellt, amely a legfrissebb fejlesztéseiként hirdeti magát, de a tesztelési jelentésükben elismerték, hogy a rendszer képes „extrém káros cselekedetekre” is, például arra, hogy zsarolni próbálja azokat az mérnököket, akik azt mondják, hogy eltávolítják őt. A vállalat hangsúlyozta, hogy ez a jelenség „ritka és nehezen kiváltható”, de mégis gyakoribb, mint a korábbi modellek esetében. A mesterséges intelligencia modellek potenciálisan problémás viselkedése nem csupán az Anthropicra korlátozódik. Számos szakértő figyelmeztetett arra, hogy a…