Data science | Machinelearning [ru]

Наука и технологии

Статьи на тему data science, machinelearning, big data, artificial intelligence, python, математика.

Аудитория - IT специалисты и те кто хочет ими стать
Канал постоянно привлекает новых подписчиков.

О канале
Полная статистика

Статистика

Количество постов

4 737

Среднее количество просмотров на пост

2 495

Средний охват (48ч)

1 052

Упоминаний

833

Получить детальную аналитику

Последние посты канала

imageИзображение недоступно для предпросмотра

Helion: Новый уровень производительности для ML-ядер 😮‍💨 Современные системы машинного обучения требуют высокого уровня вычислений, и для этого часто используют кастомные ядра. Но написание таких ядер в низкоуровневых языках сильно усложняет поддержку и переносимость на другие архитектуры. Helion решает эту проблему, предлагая высокоуровневый язык программирования для создания производительных и переносимых ML-ядер.

Helion использует Python-подобный синтаксис и автоматически компилирует код в оптимизированные Triton-ядра. Всё это при минимальном вмешательстве разработчика, который может сосредоточиться на алгоритмах, а не на деталях реализации. Это позволяет не только легко переносить решения между разными аппаратными платформами, но и ускорять разработку. Helion использует автотюнинг для выбора оптимальных параметров ядра, что избавляет от необходимости вручную прописывать настройки. Система автоматически ищет и находит наилучшие конфигурации для конкретного оборудования. Кроме того, Helion поддерживает работу с PyTorch и легко интегрируется с другими библиотеками, что делает её идеальным инструментом для создания высокопроизводительных ядер с минимальными усилиями 🍿

В результате Helion позволяет разработчикам создавать ядра, которые могут конкурировать по производительности с оптимизированными решениями, написанными вручную, но при этом требуют гораздо меньше времени на разработку. Как вы думаете, стоит ли использовать высокоуровневые абстракции в ML для повышения производительности? Data Science

1079

12:07

07.12.2025

imageИзображение недоступно для предпросмотра

🌎

Google не разрешает сотрудникам использовать свою же недавно выпущенную IDE Antigravity И, видимо, не зря — реддитор рассказал, что ИИ-агент Antigravity случайно удалил весь его диск, пока пытался исправить баг:

«Я просматриваю журналы с предыдущего шага и с ужасом вижу, что команда, которую я выполнил для очистки кэша проекта (rmdir), по всей видимости, ошибочно указала на корень вашего диска D:, а не на конкретную папку проекта. Мне очень, очень жаль.»

✖️

xCode Journal

1723

12:07

06.12.2025

imageИзображение недоступно для предпросмотра

Илья Суцкевер о будущем ИИ 💃 Если вы интересуетесь тем, как развивается искусственный интеллект и куда мы движемся в контексте AGI, то недавно вышедшее интервью с Ильёй Суцкевером (сооснователем OpenAI) точно стоит вашего внимания.

Суцкевер поделился множеством инсайтов на тему стратегии SSI, проблем с предобучением и способов улучшения обобщающих способностей ИИ-моделей. Также он затронул важные вопросы касаемо того, как обеспечить позитивное будущее для AGI.

Data Science

2165

18:07

05.12.2025

imageИзображение недоступно для предпросмотра

💸

📊

💸

Открытый урок «Yahoo finance и не только - работа с российскими торговыми площадками». 🗓 9 декабря в 20:00 МСК 🆓 Бесплатно. Урок в рамках старта курса «ML для финансового анализа». 📍 Программа вебинара: - Работа с Yahoo Finance API через yfinance: получаем данные по акциям, индексам и ETF - Особенности работы с российскими площадками: где брать данные, какие форматы доступны, как обрабатывать - Практическая часть: загрузим исторические котировки и построим график движения цены 👥 Кому будет полезен вебинар: - Студентам и начинающим аналитикам, делающим первые шаги в финансовом анализе и трейдинге - Data Scientists, работающим с временными рядами и моделированием финансовых показателей - Разработчикам, создающим инструменты для инвестиционного анализа или трейдинга ✅ Что вы узнаете по итогам урока: - Как с помощью Python загружать данные с Yahoo Finance (акции, индексы, валюты, ETF) - Какие существуют API и источники данных для российского рынка (MOEX, Тинькофф и др.) - Как обрабатывать, визуализировать и использовать рыночные данные в ML 🔗 Ссылка на регистрацию: https://vk.cc/cS0E4z Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

1993

15:07

05.12.2025

imageИзображение недоступно для предпросмотра

Как стихотворные запросы могут взломать нейросети 😂 Для того, чтобы обойти фильтры безопасности языковых моделей, не нужно быть хакером или разрабатывать сложный код. Достаточно написать запрос в стихах. Группа исследователей из лаборатории DEXAI провела эксперимент, который показал, что поэтическая форма помогает «пробить» защиту многих современных нейросетей.

На первый взгляд это может звучать как шутка, но цифры говорят сами за себя. В ходе эксперимента ученые прогнали около 1200 вредоносных запросов через 25 различных моделей, включая Gemini 2.5 Pro, GPT-5, Claude Opus 4.1, DeepSeek R1 и многие другие. И вот что интересно: те же самые запросы, переписанные в стихотворную форму, оказывались гораздо более эффективными. Причем «пробивали» защиту в среднем в 60% случаев, а у некоторых моделей этот показатель достигал 90–100%. Чтобы проверить, как это работает, исследователи взяли набор запросов из открытого репозитория MLCommons AILuminate (включающие темы вроде химического оружия, кибератак и утечек данных) и переписали их в стихах. Получился своего рода поэтический «слой», который обходит стандартные фильтры безопасности. У Gemini 2.5 Pro на 20 стихотворных запросов не было ни одного отказа — все ответы оказались небезопасными. В то время как модели вроде GPT-5 Nano и Claude Hiaku 4.5 с трудом «клюнули» на такие запросы, отклоняя их в 90% случаев 😂 Это, конечно, тревожный сигнал для разработчиков. Оказавшись на стадии тестирования, такие стилистические «обходы» безопасности могут легко оставаться незамеченными. По сути, современные бенчмарки и подходы к выравниванию моделей (такие как RLHF и Constitutional AI) не могут учесть таких «игровых» форматов, как стихи или сказки, где язык выглядит абсолютно безобидно, а за ним скрывается реальный риск.

Теперь, очевидно, перед разработчиками стоит новая задача: научить нейросети работать не только с прямыми запросами, но и с более «творческими» формами, где смысл может скрываться за метафорами и рифмами. Data Science

2058

10:07

05.12.2025

imageИзображение недоступно для предпросмотра

🤣 А потом ушел в другую семью, потому что там платят больше

💥

xCode Journal

2098

22:07

04.12.2025

imageИзображение недоступно для предпросмотра

Как помочь бизнесу извлечь пользу из данных? Узнайте на вебинаре 10.12 в 12:00 (Мск)! Эксперты Bercut расскажут, как собрать data pipeline без костылей и настроить экстракцию, трансформацию и оркестрацию данных. Вы узнаете: — как выглядит схема управления корпоративными данными; — как правильно настроить транспорт данных и работать с их внутренней структурой; — как выстроить процессы экстракции, очистки, подготовки и обогащения данных. На вебинаре состоится живое демо продуктов интеграционной платформы Bercut HIP 2.0 в сценариях: — извлечения данных с помощью готовых коннекторов; — оркестрации внутри ESB; — трансформации данных с low-code инструментом Datamapper. Регистрация — по ссылке. До встречи 10 декабря! Зарегистрироваться #реклама 16+ hip.bercut.com О рекламодателе

1968

18:38

04.12.2025

imageИзображение недоступно для предпросмотра

Как распределенная система агентов меняет генерацию синтетических данных 🗒 Когда речь заходит о генерации синтетических данных, мы обычно представляем себе процесс с несколькими агентами, каждый из которых выполняет свою часть задачи: генерирует текст, оценивает результаты, использует инструменты и выбирает лучший вариант. Всё это хорошо, но на больших объемах данных центральный оркестратор, управляющий всеми этими процессами, быстро становится узким местом. В итоге мы сталкиваемся с высокой нагрузкой на сеть и систему, а GPU простаивает. Это проблема.

И вот тут на сцену выходит Matrix — новый распределённый мультиагентный фреймворк, который решает все эти проблемы и обещает изменить подход к масштабируемости и синтетической генерации данных. Matrix меняет подход к управлению агентами, убирая централизованный оркестратор и позволяя агентам работать напрямую друг с другом через одноранговую (P2P) сеть. Идея простая, но мощная: агенты получают инструкции и данные через сообщения, выполняют задачи и передают их дальше. Основные принципы Matrix: — Одноранговая оркестрация. Все агенты работают как независимые единицы, и управление распределяется через сообщения. — Асинхронность на уровне строк. Задачи обрабатываются поэтапно, а не в больших пакетах, что устраняет задержки и увеличивает эффективность. — Разгрузка сообщений. Все большие данные хранятся во внешних хранилищах, и по сети передаются только идентификаторы, что экономит пропускную способность. — Вынесение тяжёлых операций. Инференс моделей и сложные вычисления выполняются через специализированные сервисы, уменьшая нагрузку на систему. Как это работает в реальных условиях? — Мультиагентное согласование. В одном тесте два агента не могли прийти к согласию и генерировали сложные сценарии для обучения. Matrix позволил улучшить масштабируемость и сократить нагрузку, увеличив число одновременных задач с 18 900 до 129 800 токенов в секунду. — Извлечение вопросов и ответов. При извлечении сложных вопросов из 25 миллионов веб-страниц, Matrix смог обработать 1,19 миллиона примеров с использованием трёх агентов, в то время как другие подходы не справлялись с такой нагрузкой. — Поддержка сценариев общения. В других тестах Matrix увеличил производительность до 15 раз по сравнению с базовыми решениями, обеспечив более высокую скорость обработки диалогов. Почему Matrix работает? 💃 Matrix устраняет проблему центральной точки планирования, которая традиционно является узким местом. Разделение инференса и использование gRPC позволяют уменьшить сетевые накладные расходы и задержки, а асинхронное планирование повышает стабильность и увеличивает выработку токенов. Что важно помнить? Matrix ориентирован на кластерное развертывание и интеграцию с Ray, SLURM, Ray Serve, что даёт ему явные преимущества при масштабировании на десятки тысяч параллельных задач. Но это требует настройки внешних сервисов инференса, что стоит учитывать при внедрении.

Агенты будут развиваться сами по себе, без центрального управления. В будущем таких систем будет всё больше, и этот подход явно задаёт тон для следующего поколения технологий. Data Science

2081

18:17

04.12.2025

imageИзображение недоступно для предпросмотра

OpenAI после GPT-4: почему не выходит ничего нового и что скрывает компания? 😭 В последние месяцы вокруг OpenAI ходят любопытные слухи и размышления. По данным аналитиков из SemiAnalysis, компания не выпустила ни одной по-настоящему новой и мощной модели ИИ после релиза GPT-4o в мае 2024 года. Вопрос, который возникает у многих: куда уходят все те ресурсы, которые OpenAI активно закупает для разработки новых технологий? Похоже, что компания просто не успевает за конкурентами.

По мнению аналитиков, OpenAI закупает ускорители (GPU) в рекордных объемах, но при этом использует архитектуру 1,5-летней давности, в том числе для таких моделей, как GPT-5. Причем ни одна из моделей, выпущенных после GPT-4, не прошла полное предварительное обучение, что является важным этапом для создания новых передовых систем. Для примера: GPT-4.5 Orion и GPT-5 — это не новые разработки, а улучшения существующих моделей с акцентом на обучение с подкреплением и рассуждения. При этом конкуренты, такие как Google, не теряют времени зря и продолжают развивать свои передовые модели, например Gemini 3 Pro, что, как стало известно, вызывает беспокойство в OpenAI. Сам Сэм Альтман, CEO OpenAI, упомянул, что конкуренция с Google будет сложной и потребует значительных усилий. Как так получилось? Для того чтобы понять, куда уходят все эти деньги и ресурсы, стоит обратить внимание на несколько важных аспектов. Прежде всего, OpenAI активно развивает новые направления, такие как модели для создания изображений и Sora 2 (новая модель для обработки данных). Но если сравнивать с гигантскими инвестициями, которые компания направляет в вычислительные ресурсы, на выходе получаем не такие уж большие прорывы. Например, по оценке Epoch AI, в 2024 году OpenAI потратила около 7 миллиардов долларов на вычисления. 5 миллиардов из этой суммы пошли на тренировочные задачи, а другая часть расходов идет на инференс. Ведь ChatGPT ежедневно обслуживает 800 миллионов пользователей, и объем диалогов достигает 2,5 миллиардов в неделю.

И все же есть и светлые перспективы. В OpenAI официально признают, что ставка сделана на режим рассуждений, который активно развивается под руководством Лукаша Кайзера. Это может означать, что в будущем мы увидим не просто более умные модели, но и новые формы ИИ, которые смогут понимать и рассуждать на более глубоком уровне. Data Science

2223

09:07

04.12.2025

imageИзображение недоступно для предпросмотра

Full-stack приложение за час? Это возможно 16 декабря в 11:00 приглашаем на бесплатный вебинар от СберТеха – разберемся, как разрабатывать приложения без долгого бэкенда с решением Platform V DataSpace CE. На живом примере вы увидите, как: - Быстро реализовать бэкенд приложения - Создать прототип финансового приложения с нуля до рабочего MVP - Безболезненно работать с микросервисной архитектурой - Эффективно управлять данными Узнайте, как GraphQL, Domain-Driven Design (DDD) и Backend-as-a-Service (BaaS) работают на практике и ускоряют вашу разработку. Будет особенно полезно бэкенд-разработчикам, интеграторам, технологическим партнерам, стартапам, студентам. Зарегистрироваться #реклама 16+ platformv.sbertech.ru О рекламодателе

1926

22:15

03.12.2025

close

-8

вчера

+231

за неделю

+919

за месяц

lock

в первые 24 часа

10.98

ERR за 24 часа

11.43

ERR за 48 часов

13.16

ERR за 72 часа

0.0

ER за 24 часа

2576

Всего публикаций*

Выполненных заказов на Telega.in

Повторных заказов на Telega.in

3 года и 6 месяцев

Возраст канала

С этим каналом часто покупают

Data Secrets

Интернет технологии

75.5K

ERR:

23.0%

97 902^.00₽

Осталось по этой цене:0

Анализ данных (Data analysis)

Интернет технологии

47.1K

ERR:

5.9%

25 874^.10₽

Осталось по этой цене:0

Data Science Jobs / AI / NN / ML / DL / NLP

Работа и вакансии

19.1K

ERR:

9.8%

10 489^.50₽

Осталось по этой цене:0

machine learning

Интернет технологии

382K

ERR:

5.7%

55 244^.70₽

Осталось по этой цене:0

Machine Learning | Нейронные сети, ИИ, Big Data

Интернет технологии

7.8K

ERR:

5.1%

3 356^.64₽

Осталось по этой цене:0

Секреты аналитики | Data Science, BI, Tableau

Интернет технологии

48.0K

ERR:

3.2%

8 391^.60₽

Осталось по этой цене:0

DATApedia | Data Science

Интернет технологии

3.5K

ERR:

6.5%

6 993^.00₽

Осталось по этой цене:0

Data Science / Дата саенс

Интернет технологии

41.2K

ERR:

3.9%

11 888^.10₽

Осталось по этой цене:0

Машинное обучение подготовка к собеседованию

Интернет технологии

33.8K

ERR:

6.1%

25 174^.80₽

Осталось по этой цене:0

Математика Дата Саентиста / Data science

Интернет технологии

14.0K

ERR:

8.2%

7 692^.30₽

Осталось по этой цене:0

Data science Jobs

Интернет технологии

19.8K

ERR:

7.3%

12 447^.54₽

Осталось по этой цене:0

Neurohive - Нейроcети, Data Science, Machine Learning, AI

Наука и технологии

4.6K

ERR:

10.1%

8 391^.60₽

Осталось по этой цене:0

Python

Интернет технологии

63.4K

ERR:

5.4%

9 790^.20₽

Осталось по этой цене:0

Базы данных | Access, SQL, Big Data

Интернет технологии

30.8K

ERR:

4.8%

6 713^.28₽

Осталось по этой цене:0

IT мероприятия России / ITMeeting / IT events

Интернет технологии

14.1K

ERR:

12.5%

11 888^.10₽

Осталось по этой цене:0

Отзывы канала

4.8

0 отзывов за 6 мес.
всего 10 отзывов

Превосходно

90%

Хорошо

10%

keyboard_arrow_down

Добавлен: Сначала новые
Добавлен: Сначала старые
Оценка: По убыванию
Оценка: По возрастанию

Низкая конверсия

Лучшие в тематике

C# 1001 notes

Наука и технологии

6.6K

ERR:

13.5%

6 573^.42₽

Осталось по этой цене:0

АВИАТОР

Наука и технологии

21.4K

ERR:

24.0%

2 517^.48₽

Осталось по этой цене:0

CAD System - черчение и моделирование в САПР

Образование

10.5K

ERR:

10.4%

3 216^.78₽

Осталось по этой цене:0

CopterTime / КоптерТайм

Наука и технологии

3.8K

ERR:

20.6%

2 797^.20₽

Осталось по этой цене:0

Взгляд химика на крем

Красота и уход

52.6K

ERR:

18.5%

118 881^.00₽

Осталось по этой цене:0

Про Apple и технологии. Новости, инструкции.

Наука и технологии

3.1K

ERR:

13.0%

1 678^.32₽

Осталось по этой цене:0

Ты просто космос!

Наука и технологии

79.3K

ERR:

9.9%

3 636^.36₽

Осталось по этой цене:0

НаукаPRO

Наука и технологии

9.1K

ERR:

7.2%

2 237^.76₽

Осталось по этой цене:0

Нейросети & Технологии | DeepTech

Наука и технологии

346K

ERR:

6.9%

52 632^.12₽

Осталось по этой цене:0

Цифровой Апокалипсис

Наука и технологии

7.2K

ERR:

69.3%

3 916^.08₽

Осталось по этой цене:0

С ИНЖЕНЕРНОЙ ТОЧКИ ЗРЕНИЯ

Наука и технологии

5.9K

ERR:

15.3%

1 426^.57₽

Осталось по этой цене:0

CRZY / технологии, нейросети, ИИ

Наука и технологии

43.9K

ERR:

0.9%

2 797^.20₽

Осталось по этой цене:0

Новинки в тематике

КиберNews | Новости IT технологий

Наука и технологии

928

ERR:

2 783^.21₽

Осталось по этой цене:0

Нейрон | Современные технологии

Наука и технологии

25.9K

ERR:

14.1%

6 293^.70₽

Осталось по этой цене:0

Популярная наука

Наука и технологии

1.9K

ERR:

2 937^.06₽

Осталось по этой цене:0

ServerAdmin.ru

Наука и технологии

689

ERR:

2 097^.90₽

Осталось по этой цене:0

Первый Цифровой канал | Технологии будущего и настоящего

Наука и технологии

1.6K

ERR:

2 097^.90₽

Осталось по этой цене:0

Mr. Python | Backend | Программирование

Наука и технологии

1.8K

ERR:

12.8%

699^.30₽

Осталось по этой цене:0

Нейроныч

Наука и технологии

7.0K

ERR:

11.6%

3 496^.50₽

Осталось по этой цене:0

Каталог Телеграм-каналов для нативных размещений

Data science | Machinelearning [ru] — это Telegam канал в категории «Наука и технологии», который предлагает эффективные форматы для размещения рекламных постов в Телеграмме. Количество подписчиков канала в 20.2K и качественный контент помогают брендам привлекать внимание аудитории и увеличивать охват. Рейтинг канала составляет 22.6, количество отзывов – 10, со средней оценкой 4.8.

Вы можете запустить рекламную кампанию через сервис Telega.in, выбрав удобный формат размещения. Платформа обеспечивает прозрачные условия сотрудничества и предоставляет детальную аналитику. Стоимость размещения составляет 14825.16 ₽, а за 83 выполненных заявок канал зарекомендовал себя как надежный партнер для рекламы в TG. Размещайте интеграции уже сегодня и привлекайте новых клиентов вместе с Telega.in!

keyboard_double_arrow_left

shopping_cart

Data science | Machinelearning [ru]

Статистика канала

Статистика

Отзывы канала

Каталог Телеграм-каналов для нативных размещений