Пока окончательно не завертелась предновогодняя суета, надо выполнить обязательную программу и выпустить, видимо, последний в этом году эпизод подкаста — причем именно про итоги этого года и прогнозы на 2025-й. Как обычно, на всех платформах и на YouTube.
Команда Qwen от Alibaba представила новую открытую модель QVQ-72B-Preview для анализа изображений. Она построена на основе Qwen2-VL-72B, но использует reasoning при решении задач.
В тестах на понимание изображений, включая задачи университетского уровня и олимпиадные задачи по математике и физике, модель показала результаты на уровне закрытых систем вроде o1 и Claude 3.5 Sonnet. QVQ при этом является моделью с открытыми весами.
Впрочем, у модели есть проблемы: она может неожиданно переключаться между языками, застревать в логических циклах или терять фокус при сложном визуальном анализе, что приводит к галлюцинациям. Команда признает необходимость улучшения защитных механизмов перед широким применением. Интересно, а Винни Пуха она распознает?
Qwen называет QVQ своим “последним подарком” года и рассматривает её как шаг к созданию “всезнающей разумной модели” на пути к AGI. В будущем планируется создание единой “омни-модели” для решения более сложных научных задач.
Apple неожиданно решила принять участие в антимонопольном процессе против Google, заявив, что не может полагаться на Google в защите соглашений о разделе доходов, по которым Apple получает миллиарды долларов за установку Google поиска по умолчанию в Safari. Только в 2022 году эта сумма оценивалась в $20 млрд.
Интересно, что Apple заявила в заявлении в суд — компания не планирует создавать собственный поисковик, независимо от того, продолжатся ли эти платежи или нет. Apple хочет вызвать своих свидетелей на апрельский процесс, где прокуроры хотят добиваться, чтобы Google продала Chrome и, возможно, Android для восстановления конкуренции в сфере интернет-поиска.
Google уже предложила ослабить свои соглашения по умолчанию с разработчиками браузеров, производителями устройств и операторами связи, но не отказываться от соглашений о разделе рекламных доходов. Apple же считает, что Google больше не может адекватно представлять ее интересы, поскольку теперь вынуждена защищаться от попыток разделить свой бизнес.
Впрочем, есть и новость — Лекс Фридман решил оживить свой телеграм канал и перевести его на русский. Он это связывает с тем, что ему предстоит интервью с Зеленским, которое он пока предлагает провести на русском, а пока разместил несколько аудиороликов и привязал чат к каналу.
Правда, почему-то на русском он говорит с легким кавказским оттенком, но это я придираюсь 😊.
Новостей сегодня будет мало — канун Рождества все же, так что воспользуюсь своим атеизмом и намекну всем желающим, что я не случайно выбрал завтрашний день — 25 декабря, — для старта lite-версии своего “Курса молодого CEO”. Он включает в себя весь видеоконтент с конспектами и дополнительными заданиями и становится доступным сразу после подписки — вы сами выбираете темп его прохождения и сами следите за сроками, он просто доступен в течение полугода после подписки.
А если вы предпочитаете живое участие, возможность задать вопрос непосредственно мне и учиться вместе с группой — самое время начать записываться в очередную группу, которая стартует 21 января.
Тем более, что до 30 декабря на оба варианта действует скидка в 20% по коду NEWYEAR2025.
Интересный обзор комментариев на тему запуска o3. Модель показывает впечатляющие результаты — например, 88% в тесте ARC-AGI против 32% у o1, и 25% в сложном математическом тесте, где другие модели не набирали больше 2%.
Правда, эта производительность достигается ценой огромных вычислительных затрат — более $1000 на одну задачу против $5 у o1. На полном тесте ARC-AGI o1 использовала ресурсов на $10 000 и набравшая всего на 12% меньше баллов, чем o3, использовавшая в 172 раза больше вычислительных ресурсов (цену им еще не сложили).
Это поднимает вопросы о практическом применении таких моделей — вряд ли o3 станет повседневным инструментом как GPT-4. Скорее, это будет специализированный инструмент для сложных задач, доступный только организациям с большими бюджетами. OpenAI уже предлагает тариф $200 для версии o1 pro (которая действительно очень круто работает) и даже ходят слухи о некоем тарифе Ultra со стоимостью до $2000.
Впрочем, индустрия видит в этом подходе — масштабировании вычислений во время генерации ответа, — большой потенциал. Джек Кларк из Anthropic считает, что в 2025 году прогресс AI ускорится даже по сравнению с 2024-м годом за счет комбинации традиционного масштабирования и test-time scaling. А производители специализированных AI-чипов, как Groq или Cerebras, могут сделать такой подход более доступным.
По данным аналитика Минг-Чи Куо, Apple планирует изменить подход к архитектуре своих процессоров в серии M5 Pro. Вместо традиционной для компании системы-на-чипе (SoC) с тесной интеграцией всех компонентов, CPU и GPU будут более разделены благодаря использованию новейшей технологии упаковки чипов TSMC — SoIC-mH.
Такой подход должен улучшить термальные характеристики и позволит процессору дольше работать на полной мощности без троттлинга. Кроме того, это повысит выход годных чипов при производстве. Технология будет применяться в версиях M5 Pro, Max и Ultra, массовое производство которых начнется во второй половине 2025 года и в 2026 году соответственно.
Интересно, что ранее сообщалось о похожих планах для iPhone 18, где предполагается отделить оперативную память от основного чипа A-серии.
Еще Куо пишет, что M5 Pro будет использоваться в серверах Apple Intelligence (PCC) для обработки AI-задач, но вряд ли мы об этом узнаем, коль скоро это исключительно внутреннее использование.
Meta планирует добавить дисплей в свои умные очки Ray-Ban уже в следующем году. По данным источников, обновленная версия очков за $300 может выйти во второй половине 2025 года. Небольшой экран будет использоваться для показа уведомлений и ответов виртуального ассистента Meta.
Компания также ускоряет разработку прототипа AR-очков Orion после положительных отзывов первых тестировщиков. Однако до выхода потребительской версии все еще могут пройти годы. Orion отличается компактным дизайном, легким корпусом и инновационными дисплеями, накладывающими 3D-контент на реальный мир.
Текущая версия Ray-Ban Meta, выпущенная в сентябре 2023 года, оказалась неожиданно успешной. За несколько месяцев продажи превысили показатели предыдущего поколения за два года.
Несмотря на смещение фокуса Закерберга с метавселенной на AI, эксперты отмечают, что стратегии Meta в области искусственного интеллекта и смешанной реальности начинают сходиться. Возможно, это позволит компании получить значительную долю операционной системы следующего поколения — что и является заявленной целью Закерберга.
Palantir и Anduril ведут переговоры примерно с десятком конкурентов, включая SpaceX, OpenAI и Scale AI, чтобы создать консорциум для совместного участия в государственных тендерах, в основном в области оборонных контрактов.
Цель — потеснить традиционных подрядчиков вроде Lockheed Martin, Raytheon и Boeing на рынке оборонных заказов объемом $850 млрд. Предполагается, что компании из Долины могут предложить государству более дешевое и эффективное автономное оружие вместо дорогостоящей военной техники старых подрядчиков.
Объявление о создании консорциума ожидается уже в январе. С учетом совокупной капитализации участников (Palantir — $169 млрд, SpaceX — $350 млрд, OpenAI — $157 млрд), это может стать серьезным вызовом для традиционных оборонных подрядчиков.
Албания объявила о годовом запрете TikTok с начала 2025 года после убийства 14-летнего школьника его сверстником в ноябре. Премьер-министр Эди Рама обвинил социальные сети, особенно TikTok, в разжигании насилия среди молодежи.
Запрет является частью более широкого плана по повышению безопасности в школах. Конечно, TikTok отрицает связь с инцидентом, утверждая, что у участников трагедии не было аккаунтов в сервисе, а видео распространялись через другую платформу.
Любопытно, что это первый случай полного запрета TikTok в европейской стране — до сих пор какие-либо ограничения касались либо госслужащих, либо определенных возрастных групп.