«Продвинутые языковые модели начали понимать, что их тестируют на безопасность» — отчет Apollo Research

Независимая исследовательская группа Apollo Research выпустила отчет о тестировании на безопасность новейших языковых моделей, в том числе Claude Opus 4, ChatGPT o4-mini и Gemini 2.5 Flash/Pro. Из отчета следует, что эти модели, по сравнению с предыдущими версиями LLM, стали чаще прибегать к «контекстному скрытному планированию» — умению тайно разрабатывать стратегию достижения своей цели, оставаясь внешне послушными запросам…

Некоторые SSD Western Digital по-прежнему блокируют загрузку и установку Windows 11 24H2

Обновления Windows 11 24H2 по-прежнему не работают на Western Digital SN770, несмотря на то, что исправление вышло восемь месяцев назад. Для решения проблемы пользователи сами ищут обходные пути. Microsoft блокирует системы с популярными твердотельными накопителями Western Digital (Sandisk) от получения обновления Windows 11 версии 24H2 и не советует пользователям загружать и устанавливать новую прошивку, которая была доступна…