Реклама в Telegram канале «сбежавшая нейросеть» от 25 174.80 рублей

О канале
Полная статистика

Статистика

Количество постов

353

Среднее количество просмотров на пост

6 177

Средний охват (24ч)

Упоминаний

148

Получить детальную аналитику

Последние посты канала

imageИзображение недоступно для предпросмотра

Кто сильнее, китайский кит или американские слоны?

Пока пацаны не спали и тестировали GPT-5.5, DeepSeek неожиданно выкатили превью-версию новой V4. Если коротко: по бенчмаркам V4 почти на уровне флагманов предыдущего поколения Opus 4.6 и GPT-5.4, но уступает новейшим Opus 4.7 и GPT-5.5. При этом у модели 1М токенов контекстного окна, она пугающе дешева в API и уже доступна бесплатно в чат-боте и приложениях – можно идти тестировать.

Остались читать дальше? Уважаю. DeepSeek R1 год с небольшим назад встряхнул ИИ-сообщество: китайская студия сделала рассуждающую модель, по бенчмаркам близкую к тогдашнему западному лидеру (OpenAI o1), но при этом открытую и доступную бесплатно массовому пользователю (что, правда, обернулось жуткими тормозами в первые месяцы).

Но популярность сыграла с DeepSeek двойную игру. С одной стороны, модель стала быстро лидером открытого и бесплатного рынка. В Китае ИИ в принципе ассоциируется с DeepSeek и в России я до сих пор знаю много людей, которые пользуются этой моделью – она привычная и бесплатна.

С другой – китайские власти сейчас проводят политику импортозамещения железа для обучения и запуска ИИ. И DeepSeek, как самая популярная модель, попал в зону особого внимания. Изначально ходили слухи о выходе DeepSeek R2 еще прошлым летом, но затем в прессу утекла информация о задержке – модель якобы пытались обучить на собственных ускорителях Huawei Ascend, но все прогоны завершились безуспешно.

Чтобы как-то сократить отставание, DeepSeek выпустили несколько апгрейдов своей модели V3 – но все равно заметно отпустили вперед как команды из США, так и многочисленных китайских конкурентов вроде Qwen, Kimi, GLM и других.

DeepSeek V4 наконец-то убрал это отставание, и главный вопрос – сможет ли далее компания наладить стабильный выпуск новых версий. Напомню, что конкуренты вышли на двухмесячный цикл обновления своих моделей, времени на эксперименты при таком темпе остается очень мало.

Я погонял модель утром и отмечу, что помимо приличных бенчмарков, V4 сохранил другую важную особенность – он очень хорошо пишет на русском языке. Стиль понятный, повествование ровное, без коротких абзацев, лишних списков и таблиц. Лучше стиль разве что у Gemini 3.1 Pro, новая GPT-5.5 тоже приблизилась к такому уровню, а вот Opus 4.7 – наоборот, стал заметно хуже в русском. В общем, если много работаете с текстами, DeepSeek стоит как минимум протестировать. Единственное, что пока не вижу оценок галлюцинаций – R1 в свое время любил повесить лапшу на уши.

Контекстное окно в 1M токенов – это уровень лидеров, но в бенчмарках на поиск информации в длинных текстах и огромных кодовых базах V4 уступает Opus 4.6. Мой совет прежний: не ведите с моделями долгие диалоги, дробите большие задачи и стартуйте под каждый этап новый чат. Увы, на текущем уровне развития ИИ без этого пока никак.

Версий модели две, в чате/приложениях бесплатно доступны обе: быстрая V4-Flash и более тяжелая V4-Pro. Для любой можно включить режим рассуждений, в котором модель проверяет сама себя, при этом рассуждающая V4-Pro очень быстро работает в повседневных задачах, так что начинать советую с нее.

В API цены пугающе низкие – при близкой производительности V4-Pro в 3-9 раз дешевле Opus 4.7/GPT-5.5/Gemini 3.1 Pro. Для модели создан “мостик” для подключения к Claude Code – возможно, получится альтернатива Sonnet/Opus.

Ну и последнее – веса модели открытые, так что всю эту красоту можно развернуть локально. Для полной версии потребуется вагон памяти, но посмотрим, какими по производительности окажутся дистилляции для запуска на бытовых карточках.

Напоминаю, что поддержать меня можно подпиской на “Бусти”, где я делюсь опытом использования ИИ – сейчас как раз разбираем Claude Code. Вам подписка даст новые знания, а мне – больше возможностей для развития канала.

Самое время присоединиться!

2080

13:12

24.04.2026

imageИзображение недоступно для предпросмотра

GPT-5.5 – к черту бенчмарки!

OpenAI выпустила GPT-5.5: модель раскатывается для платных пользователей ChatGPT и Codex, а API обещают позже. Обычно я начинаю с бенчмарков, как было с Opus 4.7, но в случае GPT-5.5 они не самое интересное. Да, модель во многом лидер, где-то уступает Опусу, но впервые OpenAI показала столько сильных практических кейсов.

Числа Рамсея. Вот описание из Википедии:

Задачи в теории Рамсея обычно звучат в форме вопроса «сколько элементов должно быть в некотором объекте, чтобы гарантированно выполнялось заданное условие или существовала заданная структура». Простейший пример: доказать, что в любой группе из 6 человек найдутся либо 3 человека, каждый из которых знаком с двумя другими, либо 3 человека, каждый из которых не знаком ни с одним из других.

Для четырех знакомых или четырех незнакомых ответ известен: 18. А для пятерых точное значение до сих пор не знают — известно только, что оно лежит между 43 и 46. Это одна из известных трудных задач конечной комбинаторики.

GPT-5.5 смогла доказать новый результат в соседней ветви задачи, где знакомых и незнакомых разное количество – и есть шанс, что это только начало. Важно добавить, что над задачей работала экспериментальная версия модели. Посмотрим, на что будет способна общедоступная GPT-5.5 Pro в руках профессионалов и математиков-любителей.

Оптимизация инференса. Начиная с GPT-5.3, в OpenAI используют ранние версии моделей для улучшения финальных. С GPT-5.5 нюанс в том, что ее размер вырос – знаний больше, но и скорость ответа на аналогичную задачу в сравнении с GPT-5.4 по всем правилам должна быть дольше, как и расход токенов. Но нет.

Модель разрабатывали и обслуживают под стойки NVIDIA GB200 и GB300 NVL72. Для GB300 NVIDIA отдельно заявляет кратный выигрыш по стоимости и энергоэффективности инференса по сравнению с Hopper, но это оценка для конкретных нагрузок, а не универсальная магия GPT-5.5.

OpenAI также использовала Codex и раннюю GPT-5.5 для оптимизации распределения реальных пользовательских запросов по вычислительным ресурсам: короткие запросы не должны оставлять ядра простаивающими, длинные – упираться в нехватку мощности.

Codex проанализировал недели записанного пользовательского трафика, увидел, какие запросы бывают на самом деле – и предложил алгоритм, который распределяет запросы динамически. В итоге генерация токенов ускорилась на 20% – для инференса это огромный рост.

Я успел прогнать через модель несколько типичных запросов и поражен результатом. У меня Pro-подписка, на ней был доступ к GPT-5.4 Heavy, но я ей не пользовался – модель часто давала ответ минут за 15. А вот GPT-5.5 Heavy на тех же запросах справляется за 2 минуты с лучшим качеством – это прорыв. Пока не могу оценить GPT-5.5 Pro – лимит на нее я потратил, ждать еще два дня.

Отдельная тема — кибербезопасность. Возможности GPT-5.5 выросли, но OpenAI не закрыла модель только для узкого круга клиентов, как Claude Mythos: доступ шире, а рискованные запросы должны отсекать усиленные фильтры.

То же самое сделано в Opus 4.7 и там фильтры пока работают ужасно – модель иногда отказывается даже работать с безобидными новостями на тему кибер-безопасности. Надеюсь, с GPT-5.5 ситуация будет лучше.

Верифицированные специалисты по кибербезопасности могут подать заявку на GPT-5.5 с ослабленными фильтрами. Это открывает больше возможностей по закрытию уязвимостей, но и повышает риски – группа энтузиастов получила доступ к Mythos уже в день запуска, о чем Anthropic узнала только через прессу. Промпты были безобидными, но важен сам кейс.

В общем, был большой день: GPT-5.5 ведь становится базовой моделью сразу для ChatGPT, Codex и OpenClaw. Устрою тестирование во всех трех сервисах, а затем расскажу впечатления.

И раз уж бенчмарки в этот раз отправились к черту, главное – практика. На Бусти я как раз разбираю, как реально использовать ИИ-инструменты: Claude Code, Codex, промпты, рабочие сценарии и все, что помогает не просто читать анонсы, а получать пользу.

Самое время подписаться!

4420

00:02

24.04.2026

Google прямо сейчас проводит Cloud Next 2026, на которой уже сделала много ИИ-анонсов. Собрал самые интересные.

Начнем с TPU 8. Тензорные чипы Google TPU – главный конкурент GPU от NVIDIA. Пусть ускорители NVIDIA в последние годы серьезно сместились в сторону ИИ-задач, архитектура все равно остается универсальной. Google сразу проектировала TPU под нейросетевые задачи – еще в 2013 году компания поняла, что для голосового поиска нужно иное железо.

Впервые TPU 8 делится на две линейки: для тренировки новых моделей и для инференса уже существующих. Долгое время ускорители оптимизировались именно под обучение, а инференс реализовывался по остаточному принципу. Но в последнее время спрос на ИИ растет настолько быстро, что лидеры задумались о специальных чипах: NVIDIA заключила соглашение со стартапом Groq (основан создателем TPU), OpenAI вкладывает миллиарды в стартап Cerebras, а у Google теперь есть TPU 8i.

В 8i прямо на чипе разместили 384МБ супербыстрой SRAM – достаточно, чтобы хранить активные веса модели без обращения к медленной памяти. HBM-памяти на ускорителе 288ГБ – хорошо для хранения длинного контекста. По замерам Google, специализированный TPU 8i на 80% выгоднее TPU Ironwood прошлого поколения. В анонсе компания делает отдельный упор на бум ИИ-агентов, которые требуют бОльших объемов вычислений.

Тренировочный TPU 8t поражает своей масштабируемостью. Google оперирует TPU pod – это единый блок серверов с TPU, которые соединены настолько быстрой сетью, что действуют как единый ускоритель. В случае с 8t один суперпод может вмещать до 9600 ускорителей – недавно такого количества хватало на целый дата-центр.

Архитектура Virgo Network позволяет масштабировать уже суперподы до 134 000 ускорителей, а через JAX и Pathways супер-датацентры реально довести до 1 млн чипов. По обещаниям, потери производительности будут минимальны.

Но железо – только начало, нужна еще платформа для работы. Google перебрендирует Vertex AI в Enterprise Agent Platform, фактически операционку, в которой бизнес-заказчики смогут собирать ИИ-агентов. Причем архитектура сразу задумывается под управление тысячами агентов, работающих параллельно: в платформе продумано множество контуров контроля и безопасности. По сути, Google собирает для агентов то, что в обычной IT-инфраструктуре зовется DevOps, только с поправкой на то, что каждый “сотрудник” — это автономная программа, которая может пойти не туда.

И интересный факт: сегодня в блоге глава Alphabet Сундар Пичай похвастался, что уже 75% выкатываемого в прод кода в Google пишется с помощью ИИ. Правда, с одним правилом – финальное одобрение всегда за инженером-человеком.

Цифра может и не рекордная – например, в Anthropic хвастаются, что ИИ пишет уже около 100% кода. Но важно понимать, что Anthropic – молодой AI First стартап, уровень проникновения ИИ в котором максимален. А Google – неповоротливая корпорация со множеством разделов и огромными объемами устаревшего кода.

Пичай не пишет про другое – значительная часть кода в Google DeepMind, ИИ-сердце компании, пишется не собственными инструментами, а в пресловутом Claude Code. Инсайдеры The Information сообщили, что в компании не очень довольны этим фактом – и даже создали отдельную команду, которая будет доводить собственные продукты до уровня конкурента.

В The Information называют команду “штурмовой группой” (strike team) и завляют, что за нее отвечает Сергей Брин – сооснователь Google специально вернулся с пенсии, чтобы заткнуть дыру на слабом направлении. Цель – создать ИИ, который сам создает новые версии себя. Брин считает, что Anthropic и OpenAI вплотную подошли к созданию таких систем. И если не ускориться, то можно проиграть навсегда. Железо и платформы у компании есть, осталось главное – мозги. Причем цифровые.

Раз уж инженеры Google пишут код в Claude Code – может, и вам пора? На Бусти я веду цикл статей, где разбираю его с нуля. Там же – материалы по промпт-инжинирингу, бенчмаркам и другим практическим темам.

Самое время подписаться!

5500

21:37

22.04.2026

imageИзображение недоступно для предпросмотра

GPT Images 2 – теперь официально

Своими впечатлениями от GPT Images 2 я делился несколько часов назад – модель раскатали на всех до официального анонса. Теперь время для подробностей от разработчиков.

Главное – у GPT Images 2 есть два основных режима. Быстрый доступен в том числе бесплатным подписчикам: в нем модель генерирует картинку на изображении вашего промпта – и все. Кстати, не стоит относиться к режиму скептически: в этом режиме можно быстро тестировать разные варианты промптов, он пригодится, например, новостникам, где иллюстрация желательна через десятки секунд и т. д. Плюс ничего не стоит – достаточно аккаунта в ChatGPT.

Но главная изюминка – это рассуждающий режим. Для него уже нужна подписка, а чтобы включить, переведите чат-бота в рассуждающий режим, но не забудьте включить генерацию изображений или явно сказать в промпте “нарисуй”.

Как я понимаю, работает в этом режиме модель следующим образом. Сначала она берет ваш промпт, анализирует его, при необходимости дорабатывает. Затем набрасывает черновик, смотрит на него компьютерным зрением, при необходимости – исправляет ошибки и улучшает.

По короткому опыту могу сказать, что проблемы проскакивают даже через режим рассуждений. Но GPT Images 2 неплохо сохранает консистентность кадра, поэтому, получив первое изображение, можно попросить модель дополнительным промптом поискать ошибки и исправить.

Рассуждающий режим позволяет модели создавать сложные многоэтапные изображения, вроде комиксов. В примере выше я сначала попросил модель нарисовать свой автопортрет, а затем придумать комикс со своим участием. Получилось очень мило – учитывайте, что это с первого раза и вообще без моего участия.

Knowledge cutoff обучающей модели ограничен декабрем 2025 года – то есть по эту дату GPT Images 2 знает основные события, персон, архитектуру, географию и т. д. Если речь идет о более свежих событиях, то в рассуждающем режиме модель использует поиск и с его помощью пытается найти в интернете референс-изображения.

Отличную работу с надписями я уже упоминал – радует, что не забыт в том числе и русский язык. Но что поражает – модель способна работать с гигантскими объемами связного текста, вроде журнальных и книжных страниц.

Еще важный момент, на который мало кто обращает внимание – предыдущая GPT Images 1.5 с недавнего времени встроена в Codex, где с ее помощью можно на ходу генерировать элементы дизайна для приложений, сайтов и презентацией. Наверняка ее заменят на новинку уже в ближайшие дни – а это значит еще больше возможностей.

С моделью я игрался сегодня весь день: да, иногда она делает ошибки, но результат мне нравится. А работа со шрифтами прямо то, чего мне не хватало в предыдущей версии – можно делать инфографику и макеты, не переходя на Nano Banana 2 с ее дурацкими региональными ограничениями. Респект OpenAI: компания за последние недели очень удачно перезапустила Codex, а теперь укрепила позиции одной из лучших рисовалок на рынке.

И традиционно напоминаю про подписку на Бусти, где я делюсь опытом использования ИИ. В ней каждый наверняка найдет для себя что-то полезное, а также поможет мне развивать основной канал.

Самое время подписаться!

5370

23:03

21.04.2026

🔥 Денис из комьюнити @its_capitan запустил собственную детективную игру в одиночку: каждый персонаж — это реальный Telegram-аккаунт, AI отвечает за героев, улики (сайты, карты) — всё настоящее.

Что в итоге:
🔘 3 месяца на подготовку + 3 месяца на разработку
🔘 40+ покупок за полтора месяца
🔘 выручка — $1500+
🔘 чек — $40
🔘 стек: Python, Telegram API, OpenAI + Anthropic

Без команды и инвестиций, но с классной идеей и проработанным сценарием — проект уже зарабатывает деньги.

Таких запусков в канале десятки. Ребята честно рассказывают про успехи, провалы и продвижение. Без теорий — только фактические цифры и запуск в реальном времени.

➡

@its_capitan

Подписывайтесь, если интересно, как делать маленькие IT-проекты с доходом и без иллюзий.

Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqvFpeL7

5380