
- Главная
- Каталог
- Интернет технологии
- Библиотека data scientist’а
Библиотека data scientist’а
Полезные материалы по всему, что может быть интересно дата сайентисту.
Статистика канала
Data Science в 2026 году — это не только
scikit-learn, но и умение встроить модель в автономный цикл принятия решений.Приглашаем на курс «Углубленные AI-агенты». Старт сегодня в 19:00 МСК.
Технологический фокус:
— планирование и использование инструментов (
Tools);— интеграция
RAG в агентские цепочки;— оценка качества работы агентов (
Metrics & Evaluation);— оптимизация стоимости и скорости работы
LLM.В конце — готовая мультиагентная система в ваше портфолио.
Программа и регистрация
📍 Навигация: Вакансии • Задачи • Собесы
#буст
📍 Навигация: Вакансии • Задачи • Собесы
#буст
Реклама в ChatGPT
OpenAI официально подтвердили планы по внедрению рекламы в бесплатных тарифах и ChatGPT Go. Тесты начнутся в США, с акцентом на приватность и «ненавязчивость». Переводя с корпоративного: инфраструктура дорогая, бесплатный ИИ тоже должен как-то окупаться.
Топ-3 дата-тренда 2026
Несмотря на весь GenAI-хайп, компании снова возвращаются к базе: качеству данных, governance и безопасности.
Pandas 3.0 — релиз
21 января 2026 вышел pandas 3.0. Большой и долгожданный апдейт, который закрывает сразу несколько архитектурных хвостов.
GELU vs Tanh: стресс-тест функций активации
Практический разбор. Полезно, если вы хотите понимать, почему модель ведёт себя странно.
Ред флаги до оффера для data-специалиста
Отличный чек-лист, который стоит прочитать раньше, чем радоваться названию компании.
Weight Decay: не стирает, а фиксирует знания
Хорошее объяснение регуляризации. Помогает понять, почему weight decay — это не просто L2 с другим названием.
Почему нейросети «забывают», как писать Hello World
Про катастрофическое забывание и ограничения текущих архитектур.
«Галлюцинации LLM — не баг»
Профессор математики объясняет, почему враньё — это не временная проблема, а фундаментальное свойство текущих моделей.
Анатомия трансформеров: почему классический Self-Attention уходит
Хороший обзор того, как и почему современные архитектуры отходят от «канонического» трансформера.
📍 Навигация: Вакансии • Задачи • Собесы
#свежак
Переходите от ручной очистки данных к автономным ML-пайплайнам. Мы научим проектировать агентные системы на
CrewAI и LangGraph, способные самостоятельно обрабатывать запросы и взаимодействовать с внешними инструментами.👉 Успейте занять место до начала занятий
Это работа в забегаловке. Настоящий Шеф не тюнит веса вручную вечно — он проектирует Систему. 📊
В понедельник, 26 января, стартует интенсив по разработке ИИ-агентов. Мы научим создавать автономные ML-системы, которые закроют задачи аналитики, пока ты занимаешься архитектурой.
В программе:
— мультиагентные системы в
CrewAI: автоматизация сбора и обработки признаков;— сложная логика в
LangGraph: управление цепочками рассуждений агентов;—
tool use интеграция: обучение моделей взаимодействию с API и SQL-базами. 🧠Записаться на курс
21 января 2026 вышел pandas 3.0.
Вот что реально стоит знать 👇
✔️ Строки теперь — не
objectРаньше строки в pandas =
object.Туда можно было засунуть что угодно. Медленно. Неявно. Больно.
Теперь по умолчанию:
pd.Series(["a", "b"]).dtype
# str
Что это даёт:
— dtype только для строк
— единая семантика пропусков (`NaN`)
— лучше память и производительность
Это давно назревшее исправление архитектурной ошибки.
✔️ Copy-on-Write: конец адскому chained assignment
Главное правило pandas 3.0: любой срез — ведёт себя как копия:
df2 = df[df.a > 0]
df2["b"] = 10 # больше НИКОГДА не меняет df
Что изменилось:
—
SettingWithCopyWarning — удалён— «а тут view или copy?» — больше нет
— модифицируешь объект → модифицируй его напрямую
Под капотом pandas всё ещё оптимизирует память. Но API теперь честный.
✔️
pd.col() — выражения без лямбдБыло:
df.assign(c=lambda df: df.a + df.b)
Стало:
df.assign(c=pd.col("a") + pd.col("b"))
✔️ Arrow C Interface — zero-copy будущее
Pandas теперь:
— умеет принимать Arrow-таблицы
— умеет отдавать их без копирования
df.__arrow_c_stream__()
✔️ Новый порядок депрекейтов
Теперь всё прозрачно:
—
Pandas4Warning → сломается в 4.0—
Pandas5Warning → сломается в 5.0⚠️ Совет: обновитесь сначала до 2.3, уберите warning’и — и только потом идите в 3.0.
🔗 Ссылка на релиз
📍 Навигация: Вакансии • Задачи • Собесы
#буст
Очень сильная книга по линейной алгебре с вероятностями от Oliver Knill (Harvard).
🤩 Но самое ценное тут — домашки.
Не формальные «посчитай матрицу», а задачи, которые реально заставляют думать:
про случайные матрицы, графы, спектры, интуицию за формулами.
📍 Навигация: Вакансии • Задачи • Собесы
#буст
Отзывы канала
всего 2 отзыва
- Добавлен: Сначала новые
- Добавлен: Сначала старые
- Оценка: По убыванию
- Оценка: По возрастанию
Каталог Телеграм-каналов для нативных размещений
Библиотека data scientist’а — это Telegam канал в категории «Интернет технологии», который предлагает эффективные форматы для размещения рекламных постов в Телеграмме. Количество подписчиков канала в 18.5K и качественный контент помогают брендам привлекать внимание аудитории и увеличивать охват. Рейтинг канала составляет 9.7, количество отзывов – 2, со средней оценкой 5.0.
Вы можете запустить рекламную кампанию через сервис Telega.in, выбрав удобный формат размещения. Платформа обеспечивает прозрачные условия сотрудничества и предоставляет детальную аналитику. Стоимость размещения составляет 24475.5 ₽, а за 21 выполненных заявок канал зарекомендовал себя как надежный партнер для рекламы в TG. Размещайте интеграции уже сегодня и привлекайте новых клиентов вместе с Telega.in!
Вы снова сможете добавить каналы в корзину из каталога
Комментарий