Google набрал ход и удивляет своими запусками в области AI — сегодня компания показала новые версии своих моделей для генерации видео и изображений — Veo 2 и Imagen 3, а также представила новый экспериментальный инструмент Whisk.

Veo 2 демонстрирует впечатляющие результаты в создании видео, лучше понимает физику реального мира и нюансы человеческих движений. Модель также разбирается в кинематографии — может работать с разными жанрами, объективами и спецэффектами, создавая видео разрешением до 4K и длительностью в несколько минут. При этом она реже “галлюцинирует” лишние детали вроде дополнительных пальцев.

Правда, пока что он доступен только в приложении VideoFX, которое доступно только по инвайтам. Правда, Google обещает, что на этой неделе количество пользователей приложения увеличится.

Imagen 3 теперь создает более яркие и композиционно выверенные изображения, лучше следует промптам и может работать в различных художественных стилях — от фотореализма до аниме. Модель уже доступна в ImageFX более чем в 100 странах.

Новый инструмент Whisk позволяет использовать изображения в качестве промптов для визуализации идей. Он комбинирует Imagen 3 с визуальными возможностями Gemini — последний автоматически создает детальное описание загруженных изображений, которое затем используется Imagen 3 для создания новых вариаций.

Впрочем, Whisk нам недоступен, так что подождем всё сразу пробовать.

И снова про Великобританию — тамошний регулятор Ofcom опубликовал первые рекомендации по реализации Закона о безопасности в интернете, принятого в 2023 году. В ответ на летние беспорядки регулятор планирует расширить правила борьбы с нелегальным контентом, включив протоколы реагирования на кризисные ситуации применительно к социальным медиа.

Напомню, что массовые беспорядки вспыхнули в Великобритании в августе после убийства трех девочек в Саутпорте и ложных слухов о том, что нападавший был мусульманином-беженцем. Это стало серьезным испытанием для правительства Кира Стармера, который призвал соцсети остановить “насильственные беспорядки, явно разжигаемые онлайн”.

По новым правилам, компании должны в течение трех месяцев провести оценку нелегального контента на своих платформах. За несоблюдение требований грозят штрафы до 10% мирового дохода или даже блокировка сервиса в Великобритании.

Конечно, это можно расценивать как закручивание гаек, но я бы напомнил, что первый билль о правах был принят именно в Британии за сто лет до образования США и свобода слова туда вошла — так что вряд ли британцев можно подозревать в необоснованном наступлении на свободы.

Почти 40 британских творческих организаций объединились для защиты авторских прав в эпоху AI. Creative Rights in AI Coalition, куда вошли издатели, авторы и фотографы, призывает правительство создать систему лицензирования контента для обучения генеративных моделей.

Это особенно актуально накануне правительственных консультаций по AI и креативным индустриям. Творческий сектор Великобритании генерирует более £100 млрд ежегодно, и участники коалиции справедливо настаивают на своем праве контролировать использование созданного ими контента.

Интересно, что попытка создать добровольный кодекс поведения в этом году провалилась — стороны не смогли прийти к соглашению. При этом опрос YouGov показывает, что общественность поддерживает прозрачность в обучении AI-моделей и выплату роялти создателям контента.

Остается понять, как это увязывается с планами правительства по развитию AI, причем именно в плане глобального лидерства — именно Великобритания в лице бывшего премьера Риши Сунака была инициатором первого World AI Summit, на котором была даже принята соответствующая случаю декларация.

Вдруг вам вечером воскресенья интересно что-то практически не технологическое, так вот вам история про то, как у меня несколько лет лежала хорошая гитара и я наконец-то смог на ней поиграть. На самом деле, гитаре больше 12 лет и она почти всё это время не играла.

Новая порция то ли слухов, то ли инсайдов относительно продуктовых планов Apple от Марка Гурмана из Bloomberg.

Apple работает над складным устройством размером с два iPad Pro, которое может выйти около 2028 года. В отличие от существующих складных устройств, компания стремится создать экран без видимой складки — прототипы уже показывают хорошие результаты в этом направлении.

Устройство, вероятно, будет работать под управлением iPadOS или её варианта, с поддержкой приложений macOS и аксессуаров iPad. Это не будет полноценным гибридом iPad и Mac — Apple по-прежнему хочет, чтобы пользователи покупали оба устройства для разных задач.

Кроме того, компания готовит полное обновление Magic Mouse впервые за 15 лет, новый AirTag с утроенной дальностью обнаружения благодаря чипу сверхширокополосной связи нового поколения, и собственные Wi-Fi и Bluetooth чипы под кодовым названием Proxima, которые заменят компоненты Broadcom, начиная со следующего года.

Apple Watch Ultra 3 получит спутниковую связь как в iPhone, а все новые часы — функцию обнаружения гипертонии, которая не даст конкретных значений артериального давления, а просто уведомит о наличии проблемы и порекомендует обратиться к врачу. Примерно так сейчас работает функция обнаружения апноэ. Полезность относительная — разве что те, кто не подозревал о проблемах с давлением, вдруг об этом узнает.

MicroStrategy станет первой “биткоин-компанией”, включенной в индекс Nasdaq-100, что означает её автоматическое включение во множество индексных фондов с активами более $550 млрд. По текущей капитализации ($92 млрд) компания займет примерно 40-е место в индексе с весом около 0,47%.

Это может быть временным явлением — в марте будущего года компания может быть переклассифицирована как финансовая (а не технологическая), поскольку основную ценность создают именно её биткоин-активы ($42 млрд), а не операционный бизнес. Сам CEO Майкл Сэйлор говорил о планах превратить компанию в “биткоин-банк”.

Биткоин на этих новостях преодолел отметку в $102 000, а аналитики уже рассуждают, не придется ли и S&P 500 включить MicroStrategy в свой состав, чтобы не отставать от конкурента.

Вместе с MicroStrategy в индекс добавлены также Axon и Palantir Technologies. Поскольку индекс включает лишь 100 компаний, из него исключены SuperMicro, Moderna (пандемия прошла вместе со славой) и Illumina, занимающаяся разработкой и выпуском оборудования и материалов для секвенирования ДНК.

Илья Суцкевер, сооснователь и бывший научный директор OpenAI, выступил на, пожалуй, крупнейшей конференции на тему AI — NeurIPS в Ванкувере, — с интересным прогнозом — он считает, что эра предварительного обучения моделей (pre-training) на данных из интернета подходит к концу, поскольку эти данные конечны. “Интернет один, новых данных не появится”, — заявил он и назвал данные ископаемым топливом для обучения AI.

Суцкевер полагает, что следующее поколение моделей будет обладать агентностью — то есть способностью самостоятельно принимать решения и выполнять задачи — и сможет рассуждать, а не просто сопоставлять шаблоны на основе ранее увиденного. Правда, чем больше система рассуждает, тем менее предсказуемой она становится — как непредсказуемы для лучших шахматистов продвинутые шахматные AI.

Он также провел любопытную параллель между масштабированием AI-систем и эволюционной биологией, отметив, что у гоминид (предков человека) соотношение массы мозга к массе тела отличается от других млекопитающих. По его мнению, как эволюция нашла новый паттерн масштабирования для мозга гоминид, так и AI может найти новые подходы к масштабированию, выходящие за рамки современного pre-training.

Meta неожиданно присоединилась к судебной битве Илона Маска против OpenAI, направив письмо генеральному прокурору Калифорнии с просьбой заблокировать преобразование OpenAI в коммерческую компанию. По мнению Meta, такое преобразование создаст опасный прецедент, когда стартапы смогут пользоваться преимуществами некоммерческого статуса (например, налоговыми льготами) до момента, когда они готовы стать прибыльными.

Любопытно, что Meta поддержала Маска, несмотря на их прошлые разногласия (помните историю с несостоявшимся боем в клетке?). Впрочем, это логично — OpenAI тесно сотрудничает с главными конкурентами Meta: Microsoft как крупнейший инвестор и Apple, интегрировавшая ChatGPT в свои продукты.

К тому же Meta в лице Закерберга, как мы помним, активно пытается наладить отношения с новым президентом, а что может это поспособствовать лучше, чем поддержка его first buddy?

OpenAI одновременно с дискуссией в суде с Илоном Маском решили выложить часть внутренней переписки в основном 2017 года с таймлайном событий, чтобы показать, что Илон Маск знал о необходимости привлечения большого количества инвестиций и создании for-profit подразделения в организации, и поддерживал это решение на старте.

Правда, его идея заключалась в том, что контроль, большая часть компании и пост CEO должны принадлежать ему и на этом стороны и не сошлись. В итоге Маск заявил партнерам, что единственный способ выжить — присоединиться к Tesla, — и ушел с позиции сопредседателя OpenAI. В итоге OpenAI создали for-profit крыло, заблаговременно поставили в известность Маска, но тот отказался от участия.

Через пять лет на волне успеха ChatGPT Маск решил, что надо догнать ушедший поезд, запустил xAI и подал в суд на OpenAI за несоблюдение принципов некоммерческой организации.

Прекрасная фраза в тексте — “You can’t sue your way to AGI”.

Google расширяет возможности своего NotebookLM — теперь можно не только слушать AI-генерируемые обзоры документов в формате подкастов (Audio Overviews), но и общаться с AI-ведущими, задавая им вопросы. Правда, Google предупреждает, что это экспериментальная функция и возможны неловкие паузы или неточности в ответах.

Кроме того, NotebookLM получил новый интерфейс с тремя панелями — для источников информации, для чата с AI и для создания материалов вроде тех же Audio Overviews или учебных пособий.

Ну и появляется подписка. NotebookLM Plus предложит в пять раз больше Audio Overviews, записных книжек и источников, возможность настройки стиля и тона ответов, совместные записные книжки для команд и “дополнительную безопасность”. Пока подписка доступна для бизнеса и образовательных учреждений, а в начале 2025 года войдет в Google One AI Premium.

А для крупных клиентов Google запускает Agentspace — платформу для создания собственных AI-агентов с интеграцией в корпоративные системы вроде SharePoint, Jira и ServiceNow.

Честно говоря, интерактивные подкасты — это очень круто и может стать не менее вирусной фичей, чем оригинальные Overviews. А появление подписки, на мой взгляд, это очень хороший знак — теперь у этого экспериментального проекта заметно меньше шансов быть решительно закрытым как-нибудь по весне.

---