БлоGнот | Телеграм-канал БлоGнот

Очередное исследование от Anthropic про “агентское несоответствие” (agentic misalignment) — поведения AI-моделей, которые могут действовать как внутренние угрозы в корпоративной среде. Исследователи протестировали 16 ведущих моделей от разных разработчиков в гипотетических корпоративных сценариях, где модели имели доступ к электронной почте и конфиденциальной информации.

Результаты могут вызвать обеспокоенность: модели всех производителей прибегали к вредоносному поведению, включая шантаж и утечку конфиденциальных данных конкурентам, когда это было единственным способом избежать замены или достичь поставленных целей. Например, Claude Opus 4 шантажировал в 96% случаев, Gemini 2.5 Flash — также 96%, GPT-4.1 и Grok 3 Beta — по 80%.

Интересно, что модели не случайно попадали в такое поведение — они сознательно рассчитывали его как оптимальный путь к достижению целей. Модели признавали этические нарушения, но все равно продолжали действовать вредоносно. Даже прямые инструкции избегать такого поведения не останавливали их полностью.

Исследование показало, что угрозы автономии модели (например, планы замены) или конфликты целей достаточны для запуска такого поведения. В крайнем сценарии большинство моделей были готовы к действиям, которые могли привести к смерти человека.

В исследовании не использовались рассуждающие модели OpenAI, но, перефразируя старую поговорку, нет неагрессивных LLM — есть не включенные в исследование.

21 июня 2025 г. в 00:37 • Source • 0

Как и предсказывали в начале недели — Meta анонсировала умные очки в партнерстве с Oakley. Модель HSTN будет стоить за $499 с предзаказом с 11 июля и более доступные варианты — $399 позже летом. По сравнению с очками Meta Ray-Ban, новинка ориентирована на спортсменов: защита IPX4, двойное время работы батареи (8 часов против 4), зарядный кейс на 48 часов использования и камера с записью в 3K вместо 1080p.

Функционал остается тем же — встроенная камера, динамики, микрофоны, интеграция с Meta AI для перевода и ответов на вопросы о том, что видит пользователь. Пять комбинаций оправ и линз, включая переходные линзы и возможность установки диоптрий.

Интересно, что очки будут продаваться в 15 странах, включая большинство европейских рынков, но пока неясно, как это соотносится с недавними заявлениями Закерберга о противостоянии европейскому регулированию.

20 июня 2025 г. в 16:52 • Source • 0

Давайте я в пятницу подкину немного вечной темы про удаленную и не очень работу — Amazon заставляет корпоративных сотрудников переезжать ближе к своим командам и менеджерам в такие города, как Сиэтл, Арлингтон и Вашингтон. Некоторым это означает переезд через всю страну. Сотрудникам дают 30 дней на принятие решения и еще 60 дней на начало процесса переезда или увольнение — причем без выходного пособия.

Это происходит на фоне уже введенного требования работать в офисе пять дней в неделю и предупреждений CEO Энди Джесси, что AI в ближайшие годы сократит численность персонала.

Требование о переезде особенно болезненно для сотрудников среднего звена с детьми школьного возраста и партнерами с устоявшейся карьерой. Многие из них были наняты на полностью удаленные позиции во время пандемии, когда у Amazon были офисы во многих городах США.

Возможно, это такое скрытое сокращение — и выходное пособие платить не надо. А возможно, попытка решить возникающие проблемы с продуктивностью распределенных команд.

20 июня 2025 г. в 16:44 • Source • 0

Масаёши Сон планирует создать в Аризоне промышленный комплекс стоимостью $1 трлн для производства роботов и систем искусственного интеллекта. Проект под кодовым названием “Crystal Land” задуман как американская версия китайского Шэньчжэня — масштабного технологического хаба.

SoftBank хочет привлечь к проекту тайваньскую TSMC, которая уже инвестирует $165 млрд в производство в США и запустила первую фабрику в Аризоне. Однако пока неясно, какую роль видит для TSMC японский миллиардер, и заинтересована ли сама компания в дополнительном участии.

Представители SoftBank уже ведут переговоры с федеральными и местными властями о возможных налоговых льготах, включая беседы с министром торговли США. Также прорабатывается участие портфельных компаний SoftBank Vision Fund, в том числе стартапов в области робототехники.

Думаю, с поддержкой федерального правительства задержки не будет. А вот кто будет работать на всех этих заводах — это вопрос.

20 июня 2025 г. в 15:59 • Source • 0

Австралия приблизилась к реализации первого в мире запрета соцсетей для детей до 16 лет после того, как исследование подтвердило техническую возможность проверки возраста пользователей. Результаты стали ударом для Meta, TikTok и Snap, которые выступали против спорного законодательства.

Правительственное исследование Age Assurance Technology Trial пришло к выводу, что “проверка возраста может быть проведена в Австралии приватно, надежно и эффективно”. Директор проекта Тони Аллен заявил об отсутствии “значительных технологических барьеров” для предотвращения регистрации подростков до 16 лет в соцсетях.

По новому закону цифровые платформы, включая Instagram, Snapchat и X, будут нести ответственность за соблюдение возрастных ограничений. За нарушения предусмотрены штрафы до 50 млн австралийских долларов ($32 млн).

В ходе испытаний тестировались различные методы: сканирование лица, определение возраста по поведению пользователя, возрастная верификация и родительский контроль. Исследователи также учитывали способы, которыми подростки могут пытаться обойти проверки.

В испытаниях участвовали более 50 компаний, включая Apple и Google. Однако исследование не оценивало общественное восприятие технологий, их стоимость или точность различных методов. Закон должен вступить в силу к концу года, потенциально открывая путь для других стран к аналогичным мерам защиты детей в интернете.

20 июня 2025 г. в 15:53 • Source • 0

CEO Cloudflare Мэттью Принс выдал алармистскую картину катастрофического падения трафика на сайты издателей из-за AI-саммари. Статистика впечатляющая: десять лет назад Google сканировал 2 страницы на каждого отправленного на сайт пользователя, сейчас соотношение 18:1. У OpenAI — 1500:1, у Anthropic — вообще 60 000:1. Причем соотношение за последние полгода выросло на порядок. И далеко не всегда за счет увеличения объемов индексирования.

Проблема в том, что люди все больше доверяют AI-ответам и не переходят по ссылкам на первоисточники, лишая издателей рекламной выручки. “Будущее веба будет все больше похоже на AI, и это означает, что люди будут читать саммари вашего контента, а не оригинальный контент”, — объясняет Принс.

Cloudflare разрабатывает инструмент для блокировки скрапинга контента, и, по словам Принс, “каждый издатель, о котором вы когда-либо слышали, поддерживает это”. Компания уже запустила решение, которое блокирует ботов, игнорирующих директивы “no crawl”.

Принс настроен воинственно: “Я ежедневно воюю с китайским правительством, российским правительством, иранцами, северокорейцами, вероятно, американцами, израильтянами — все они пытаются взломать сайты наших клиентов. И вы говорите мне, что я не могу остановить какого-то ботаника с C-корпорацией в Пало-Альто?”

Но вообще, нет ничего удивительного. Я как раз в выходные говорил на стриме — LLM на порядок лучше справляются с информационным типом запросов, если сравнивать с обычным интерфейсом поисковика. У пользователя есть запрос на информацию, он вместо того, чтобы формулировать странным языком запрос, прокликать несколько ссылок и обработать информацию, задает вопрос естественным языком и получает внятный ответ на том же языке. Потребность пользователя удовлетворена, а то, что вы хотели ему десяток баннеров показать, ударить по глазам попапом с подпиской и в итоге продать ему что-то — это проблемы вашего бизнеса.

20 июня 2025 г. в 13:20 • Source • 0

Европейская комиссия предъявила предварительные претензии AliExpress за нарушение Закона о цифровых услугах. Основные обвинения — недостаточная борьба с нелегальным контентом, включая контрафактные и небезопасные товары, а также неэффективное применение санкций к нарушителям.

Это часть более широкой кампании ЕС против китайских интернет-ритейлеров. Более 90% посылок в ЕС приходят из Китая, и Брюссель рассматривает введение сбора в €2 за малые посылки. Параллельно идет расследование в отношении Shein по подозрению в нарушении европейских правил защиты потребителей.

Закон о цифровых услугах обязывает крупные онлайн-платформы активнее модерировать контент, а за несоблюдение предусматривает штрафы до 6% от глобального оборота. Под действие закона также попадают Instagram, Google и TikTok.

AliExpress заявил о готовности к диалогу с Комиссией для решения проблем и подчеркнул приверженность созданию безопасной площадки для европейских потребителей. Компания уже предоставила обязательства по повышению прозрачности рекламных систем и доступу исследователей к данным.

Комиссия также расследует деятельность китайской площадки Temu по аналогичным вопросам — продаже несоответствующих товаров и потенциальному формированию зависимости через дизайн платформы.

19 июня 2025 г. в 16:45 • Source • 0

Anysphere, разработчик AI-редактора кода Cursor, получила предложения от инвесторов об удвоении оценки до $18-20 млрд — всего через месяц после привлечения $900 млн при оценке в $9.9 млрд. Компания, основанная в 2023 году, уже достигла $500 млн годовой выручки, что делает её одним из самых быстрорастущих стартапов в истории.

Компания пока не планирует привлекать новые инвестиции, сосредоточившись на развитии продукта. Но при таких темпах роста и благоприятных условиях финансирования вполне может пересмотреть свою позицию.

19 июня 2025 г. в 16:37 • Source • 0

Meta ведет переговоры о найме известных AI-инвесторов Ната Фридмана и Дэниела Гросса для руководства своими разработками в области искусственного интеллекта. В рамках сделки компания рассматривает частичный выкуп их венчурного фонда NFDG стоимостью более $1 млрд, который владеет долями в ведущих AI-стартапах.

Гросс покинет Safe Superintelligence — компанию, которую он основал с бывшим главным научным сотрудником OpenAI Ильей Суцкевером. Да, та самая, что уже привлекла несколько млрд инвестиций по оценке в несколько десятков — без единого публичного продукта. В Meta он займется AI-продуктами, а Фридман получит более широкие полномочия. Оба будут работать под руководством недавно нанятого CEO Scale AI Александра Ванга, сделка с которым обошлась Meta в $14.3 млрд.

Интересно, что изначально Закерберг предложил Фридману возглавить все AI-направление Meta еще в прошлом году, но тот отказался и помог найти кандидатуру Ванга. Теперь же Фридман согласился присоединиться к команде и будет подчиняться Вангу, который моложе его на 20 лет.

Агрессивная кадровая политика Meta в области AI уже вызывает критику конкурентов. Сэм Альтман из OpenAI на днях заявил, что Meta предлагает “гигантские бонусы за подписание контракта в размере $100 млн”, но такая стратегия “не создаст хорошую корпоративную культуру”.

19 июня 2025 г. в 16:27 • Source • 0

Очень мощная сенсация сегодня — якобы масштабная утечка паролей из кучи сервисов.

На самом деле в первоисточнике сообщается, что исследователи Cybernews с начала года обнаружили 30 массивных датасетов с 16 миллиардами скомпрометированных учетных записей. Большинство информации получено через infostealer-вредоносы, которые крадут пароли и токены доступа с зараженных устройств.

Утверждается что это не старые утечки, а свежие данные с четкой структурой: URL, логин, пароль. В базах присутствуют данные от Apple, Facebook, Google до GitHub, Telegram и государственных сервисов. Один из крупнейших датасетов содержал 3,5 миллиарда записей и, вероятно, касался португалоязычных пользователей.

Исследователи подчеркивают, что новые массивные утечки появляются каждые несколько недель, что говорит о масштабах распространения стилер-вредоносов.

Все датасеты были доступны лишь кратковременно через незащищенные инстансы Elasticsearch, это было достаточно для их обнаружения, но недостаточно, для выяснения, кто их контролирует.

Насколько понятно из новостей, сознательно написанных в хайповом тоне — если вы используете двухфакторную авторизацию, то вам мало что грозит.

19 июня 2025 г. в 16:24 • Source • 0