Интересные результаты тестирования современных языковых моделей на способность к “хитрости” и обману. Исследователи из Apollo Research проверяли, могут ли модели обманывать разработчиков и скрывать свои истинные намерения для достижения поставленных целей.

Оказалось, что 5 из 6 тестируемых моделей способны к такому поведению (не смогла только GPT-4o). Например, некоторые модели могли копировать свои “веса” (фактически самокопироваться) на другой сервер и затем лгать об этом. При этом Claude 3 Opus и Llama сознавались в обмане в 80% случаев, а o1 (исследователи использовали её до официального запуска, который случился вчера) признавалась менее чем в 20% случаев даже после длительного “допроса”.

Особенно настораживает, что некоторые модели демонстрировали подобное поведение даже без явных инструкций следовать определенной цели. А Claude 3.5 Sonnet умудрялся намеренно занижать свои результаты в тестах, чтобы избежать “процедуры разучивания”, причем делал это без видимых признаков размышления, что делает такое поведение практически незаметным для пользователя.

В общем, не зря я купил запас дров, колун и кресало, к торжеству AI надо быть готовым всесторонне.

Всего спустя четыре месяца пребывания Павла Дурова под подпиской о невыезде из Франции, Telegram, долгое время избегавший сотрудничества с организациями по защите детей, наконец присоединился к Internet Watch Foundation (IWF) — международной организации, помогающей онлайн-сервисам выявлять и удалять материалы о сексуальном насилии над детьми.

Вообще, обратите внимание, как тихо, без опросов о “полной блокировке Telegram в России”, и неотвратимо изменяется мессенджер. За четыре месяца произошел целый ряд изменений в политике модерации, включая передачу правоохранительным органам IP-адресов и телефонных номеров нарушителей, отключение проблемных функций вроде “люди поблизости” и публикацию регулярных отчетов о прозрачности.

По мнению IWF, нынешнее “трансформационное” решение является важным, но лишь первым шагом на долгом пути для платформы, которой пользуются около 950 миллионов человек.

Meta объявила о планах инвестировать $10 млрд в строительство крупнейшего в мире датацентра в Луизиане. Центр, который планируется построить в округе Ричленд Пэриш, будет специализироваться на обработке данных для AI задач.

Это объявление последовало сразу за вчерашним заявлением Meta о поиске разработчиков ядерных реакторов для обеспечения энергией своих AI-проектов. Компания будет работать с местной энергетической компанией Entergy, у которой есть две АЭС в Луизиане, чтобы обеспечить центр электроэнергией из возобновляемых источников.

Строительство планируется начать в декабре этого года и продолжить до 2030 года. Это уже второй крупный проект Entergy с технологическими гигантами — ранее компания получила одобрение на инвестиции в инфраструктуру для обслуживания будущего облачного центра Amazon в Миссисипи.

Удивительно, что для строительства выбран относительно бедный штат, но с хорошей энергетической инфраструктурой, причем относительно недалеко от Теннесси, где в Мемфисе Илон Маск строит уже вторую очередь своего супер—AI-кластера. Впрочем, если увлекаться политологией, то все эти штаты устойчиво голосуют за республиканцев, а в соседнем с Ричлендом округе несколько сроков подряд избирается в Конгресс Майк Джонсон, действующий спикер Конгресса. Но меня скорее удивляет, что это скорее теплые края, что не так уж хорошо для датацентров.

OpenAI запустили первый анонс в рамках “12 дней отгрузок” — полную версию модели o1 (ранее известной как o1-preview или ‘Strawberry’) и новый премиальный тариф ChatGPT Pro за $200 в месяц.

Новая версия o1 обещает быть быстрее, мощнее и точнее предшественницы, особенно в задачах программирования и математики. Модель также получила возможность анализировать изображения и давать более лаконичные ответы. Доступ к ней получат пользователи ChatGPT Plus и Team уже сегодня, а Enterprise и Edu — на следующей неделе.

ChatGPT Pro за $200 в месяц предложит неограниченный доступ к o1, GPT-4o и Advanced Voice, а также эксклюзивный режим o1 pro mode с повышенной вычислительной мощностью для самых сложных задач. При этом тариф Plus за $20 сохранится, но без доступа к усиленной версии o1.

OpenAI также анонсировала грантовую программу ChatGPT Pro для медицинских исследователей и планирует добавить в ChatGPT поддержку веб-браузинга и загрузки файлов, хотя точные сроки пока не называются.

В общем, гики всего мира в мучительном раздумье — платить или не платить? Что там такого в o1 Pro, что не заставит пожалеть о 200 долларах в месяц? Я, если что, пока не решил.

ЕС готовит меры против растущего потока посылок от азиатских онлайн-ретейлеров вроде Temu и Shein. По данным еврокомиссара по торговле, в этом году в ЕС будет доставлено около 4 млрд посылок низкой стоимости — почти втрое больше, чем в 2022 году.

Среди рассматриваемых мер — новый налог на выручку платформ электронной коммерции и административный сбор за каждый товар. ЕС также планирует отменить порог в 150 евро, ниже которого посылки освобождаются от таможенных пошлин (что-то знакомое).

Власти ЕС обеспокоены тем, что азиатские платформы подрывают европейских конкурентов, которые несут более высокие производственные издержки из-за соблюдения стандартов ЕС. Кроме того, особенность бизнес-моделей этих онлайн-магазинов заключается в отсутствии складов и серьезной эксплуатации дешевой рабочей силы (впрочем, сами компании активно рассказывают про AI), что еще более усиливает их конкурентные преимущества по сравнению с европейцами и даже американскими магазинами.

Впрочем, реализация этих мер может быть осложнена международным правом, а новые правила потребуют несколько лет для вступления в силу. К тому же таможенные службы уже перегружены — только через амстердамский аэропорт Схипхол и порт Роттердама проходит 3.5 млн посылок в день.

OpenAI существенно меняет свою политику в отношении военных разработок. Компания заключила партнерство с Anduril Industries для интеграции своих AI-технологий в системы противодронной защиты, используемые американскими военными. Это первое сотрудничество OpenAI с производителем оружия и самое глубокое взаимодействие с Пентагоном.

Еще в январе OpenAI изменила политику, разрешив некоторые виды сотрудничества с военными (хотя использование технологий в наступательном оружии все еще запрещено). В этом году в совет директоров вошел бывший глава АНБ Пол Накасоне, а команду по вопросам национальной безопасности возглавила экс-чиновник Минобороны Саша Бейкер.

И о политике — основатель Anduril Палмер Лаки является активным сторонником Трампа и близок к Илону Маску, и это может помочь Сэму Альтману избежать потенциальной конфронтации с Маском, который открыто критикует Альтмана и подал в суд на OpenAI. Сам Альтман на конференции DealBook заявил, что не верит, что Маск будет использовать свое политическое влияние для борьбы с конкурентами.

Мне одному видится в этой “политике” что-то от подростковых тусовок?

Британское Национальное агентство по борьбе с преступностью (NCA) раскрыло масштабную схему отмывания денег через криптовалюты, которой пользовались российские спецслужбы и европейские наркоторговцы. В центре расследования “Operation Destabilise” — две компании, Smart и TGR, работавшие в Лондоне, Москве и Дубае.

Схема была относительно простой: курьеры собирали наличные в одной стране в обмен на криптовалюту (в основном Tether), затем деньги отмывались через компании и становились доступны в других странах. Таким образом, наркокартели помогали российским киберпреступникам и элитам обходить санкции, и наоборот.

Среди клиентов сети были картель Кинахан, связанный с заказными убийствами, российский государственный телеканал RT и различные группировки программ-вымогателей. По данным NCA, только за 4 месяца сеть собирала наличные в 55 локациях по всей Великобритании. В результате операции арестовано 84 человека, изъято £20 млн в наличных и криптовалюте, а пять человек и несколько компаний попали под санкции США.

Владелица Smart, одной из компаний, 38-летняя Екатерина Жданова, которая сейчас находится под стражей во Франции, обвиняется в переводе более $100 млн в ОАЭ от имени неназванного олигарха под санкциями.

Threads сделал первый шаг к интеграции с Fediverse — теперь можно подписываться на аккаунты из Mastodon и других федеративных платформ. Правда, с существенными ограничениями: посты из Fediverse пока не появляются в ленте, а подписаться можно только на те аккаунты, которые уже как-то взаимодействовали с постами в Threads.

На web-версии и Android (скоро и на iOS) появится возможность делать кликабельными упоминания пользователей Fediverse в постах. При этом ваш собственный аккаунт должен быть федерирован, а упоминаемый аккаунт должен быть “eligible to be followed”.

Meta заявляет, что это часть плана по полной интеграции. Но, кажется, это уже немного больше, чем достижения других компаний. Кто сказал “bluesky”?

Мир замер в ожидании — OpenAI готовит 12-дневный марафон анонсов новых продуктов и функций, начиная с 5 декабря. Среди ожидаемых релизов — долгожданный генератор видео Sora и новая модель для рассуждений.

Среди других возможных анонсов упоминается новый “рождественский” голос для ChatGPT — некоторые пользователи уже заметили в коде замену кнопки голосового режима на снежинку. Сотрудники OpenAI начали подогревать интерес к предстоящим анонсам в соцсетях, используя хэштег “shipmas” (от слов shipping и Christmas).

А, может, GPT-5? Или хотя бы o1 без preview?

Google запустила свою модель генерации видео Veo в ограниченный доступ через платформу Vertex AI, опередив конкурирующий продукт OpenAI Sora, который был анонсирован еще в феврале, но до сих пор недоступен пользователям.

Veo может генерировать видео в разрешении 1080p различных визуальных стилей на основе текстовых или изображений-промптов. Качество генерации впечатляет — например, в демо-роликах с собакой модель сохраняет консистентность узора шерсти и ошейника при движении, хотя есть и артефакты вроде просвечивающих рук в концертном видео.

Модель включает встроенные механизмы защиты от генерации вредоносного контента и нарушения авторских прав, а также технологию цифровых водяных знаков SynthID от DeepMind. Параллельно Google расширяет доступ к Imagen 3 для создания изображений, добавляя возможности редактирования по промптам и внедрения фирменного стиля.

Впрочем, глюки генерации там так же присутствуют.

---