

- Главная
- Каталог
- Наука и технологии
- Neurohive - Нейроcети, Data Science, Machine Learning, AI

Neurohive - Нейроcети, Data Science, Machine Learning, AI
Канал для data science разработчиков про нейросети. Свежие исследования, методы, приложения и новости. Авторский канал, контент уникальный.
Нейронные сети, машинное обучение (machine learning), data science, анализ данных, big data, стартапы, искусственный интеллект, AI, NLP.
ВП возможен.
Статистика канала
Полная статистикаchevron_rightКоманда Shanghai AI Lab представила MinerU2.5 — VL-модель с 1.2B параметров для высокоточного парсинга PDF документов. Вместо пайплайна моделей используется единая VL-модель и двухэтапная стратегия обработки: анализ структуры на уменьшенном изображении и детальное распознавание фрагментов в исходном разрешении. Архитектура оптимизирована для RAG систем и подготовки обучающих данных для LLM — сохраняет семантическую целостность таблиц, формул и структуры документов.
MinerU показывает лучшие результаты на бенчмарке OmniDocBench (90.67) среди всех моделей, превосходит Gemini-2.5 Pro, GPT-4o, Qwen2.5-VL-72B и специализированные модели: MonkeyOCR, dots.ocr. Скорость обработки выше конкурентов: 2337 т/с на A100 (2.12 страницы в секунду) — в 4 раза быстрее MonkeyOCR-Pro-3B и в 7 раз быстрее dots.ocr. Модель в 60 раз компактнее Qwen2.5-VL-72B при сопоставимом качестве.
Код доступен на GitHub под лицензией Apache 2.0, веса модели — на Hugging Face.
#Stateoftheart
Ищут бэкендеров со знанием Java, Go, Python или C++.
И MLщиков, с навыками в Classic ML, RecSys, NLP/LLM, CV, Speech.
Важный момент: ищут коллег с опытом коммерческой разработки от трех лет.
Совпадает? Тогда у вас есть все шансы получить приглашение на работу за 2 дня: технические собеседования 4 октября, а финалы, знакомство с командами и офер 5 октября.
Отправляйте заявку до 2 октября и станьте частью VK! Подробнее — на сайте.
А LongLive построен на базе модели Wan2.1-T2V-1.3B. При дообучении исследователи применили:
KV-recache — при смене промпта модель обновляет кэш ключей и значений, стирая семантику старой инструкции, но сохраняя визуальную непрерывность кадров.
Streaming long tuning — обучение на длинных последовательностях путём итеративной генерации 5-секундных клипов с переиспользованием KV-кэша.
Short window attention + frame sink — внимание с коротким окном (2.5 сек) плюс якорные кадры для долгосрочной визуальной связности, что даёт 28% ускорение и 17% экономию памяти.
На бенчмарке VBench (короткие видео): 84.87 Total Score при 20.7 FPS — качество на уровне лучших моделей при недосягаемой для других моделей скорости. На VBench-Long (30 сек) Longlive лидер с 83.52 Total Score.
#Stateoftheart
А LongLive построен на базе модели Wan2.1-T2V-1.3B. При дообучении исследователи применили:
KV-recache — при смене промпта модель обновляет кэш ключей и значений, стирая семантику старой инструкции, но сохраняя визуальную непрерывность кадров.
Streaming long tuning — обучение на длинных последовательностях путём итеративной генерации 5-секундных клипов с переиспользованием KV-кэша.
Short window attention + frame sink — внимание с коротким окном (2.5 сек) плюс якорные кадры для долгосрочной визуальной связности, что даёт 28% ускорение и 17% экономию памяти.
На бенчмарке VBench (короткие видео): 84.87 Total Score при 20.7 FPS — качество на уровне лучших моделей при недосягаемой для других моделей скорости. На VBench-Long (30 сек) Longlive лидер с 83.52 Total Score.
#Stateoftheart
Проверь навыки на реальных данных: разработай ПО для поиска объектов в рельефе по данным аэрофотосъёмки, спутниковых снимков и лазерного сканирования.
Почему стоит участвовать?
• Работа над социально значимой задачей – технологии, которые помогут археологам.
• Сообщество специалистов: знакомство с компаниями и экспертами CV/ML.
🔥 Призовой фонд – 5 000 000 ₽.
Кого ждем?
💻 Команды 2-5 человек уровня Middle и выше в области ML/CV.
📌 Формат: онлайн на DS-платформе Phystech.Genesis.
Участвовать могут как физические лица, так и компании.
⏳ Подай заявку до 14 октября по ссылке.
ML & Хранилища данных: От теории к практике│ 3 октября │ Санкт-Петербург
MLDataConf на Cтачке - это место, где встречаются инженеры данных, ML-инженеры.
Конференция подойдет опытным командам, которые хотят глубже погрузиться в полный цикл создания AI-продуктов и перенять практики коллег.
Ключевые треки конференции:
• ML/DS
• Инструменты и инфраструктура
• AI-продукты и инновации
Выступят спикеры:
→ Михаил Кацуба, аналитик данных в lenta.tech. Тема доклада: «Эволюция управления потоками данных в Lenta BigData»
→ Юлия Антохина, Data Scientist в Lamoda. Тема доклада: «Как заработать на определении атрибутов по фото»
→ Айдын Абиров, Computer Vision engineer в Wildberries. Тема доклада: «Решаем задачу Action Recognition»
→ Никита Венедиктов, team lead DS в Raft. Тема доклада: «Может ли AI заменить аналитика данных? Наш практический опыт»
→ Евгений Ситников, технический директор в СберМобайл. Тема доклада: «AI внутри мобильного оператора как способ предотвратить телефонные мошенничества»
→ Олег Загорулько, ведущий разработчик в Ecom.tech (ex Samokat.tech). Тема доклада: «Как повысить производительность команд разработки с помощью ИИ»
Программа и билеты на сайте
Следите за новостями в Телеграме и ВК
Реклама ООО «Стачка». ИНН 7328081691. Erid 2Vtzqv8eqyE
Инвестиционный венчурный фонд Imperious Group (научное подразделение — IG-Science) поддерживает научно-прикладные разработки, готовые к внедрению и коммерциализации. Финансирование доступно на любой стадии, без ограничений по сумме. Для разработчика это абсолютно бесплатно и безопасно — никаких вложений и рисков с вашей стороны.
🎯 Что вы получаете:
🛡 Полное юридическое сопровождение
📝 Оплату патентования в России и за рубежом, защиту прав на технологию
🤝 Прямые контакты с заказчиками и партнёрами
🌍 Поддержку при участии в международных выставках и конференциях
📊 Научно-технические и бизнес-экспертизы, помощь с бизнес-планом и выходом на
рынок
Если у вас есть научно-прикладной проект с практической значимостью — мы поможем
превратить его в рабочий бизнес.
————————————
🏛 О фонде
Подразделение IG-Science было открыто на базе венчурного фонда Imperious Group в 2018 году для поддержки научно-прикладных проектов и изобретений.
✅ Сделки возможны на любом этапе: от идеи до опытного образца.
✅ Работаем по всему миру, есть представительства в СНГ, Европе и США. Возможен выезд специалистов на место.
✅ Процесс прозрачный и безопасный: NDA, никаких вложений от разработчика,
финансирование исключительно из средств фонда.
✅ Средний объём инвестиций — $50–500 тыс., но без жёстких лимитов: всё зависит от стадии и потенциала проекта.
✅ В портфеле — более 40 реализованных проектов, получивших признание отрасли и
международных партнёров.
📩 Оставить заявку можно на сайте Imperious Group:
https://clck.ru/3NtGgj
Фреймворк состоит из планировщика и генератора контента. Планировщик (planner) работает в динамическом исследовательском цикле, итеративно чередуя сбор данных через веб-поиск с оптимизацией структуры отчета. Оптимизация структуры происходит непрерывно — планировщик расширяет секции, добавляет подразделы и реструктурирует план на основе новой информации.
Генератор контента (writer) выполняет синтез с опорой на банк памяти. Для каждой секции плана он извлекает релевантные доказательства из банка памяти по цитатам, анализирует контент через внутреннее рассуждение, затем генерирует текст. После завершения раздела материалы удаляются из контекста.
На бенчмарке DeepResearch Bench WebWeaver достигает результата 50.58 против 49.71 у Gemini-2.5-pro-deepresearch и 46.45 у openai-deepresearch. Точность цитирования — 93.37% у WebWeaver (модель Claude-sonnet-4) против 78.3% у Gemini и 75.01% у OpenAI.
Tongyi-DeepResearch-30B-A3B показывает 32.9 на Humanity's Last Exam, преводсходя как открытые, так и проприетарные модели.
#Stateoftheart #Frameworks
Фреймворк состоит из планировщика и генератора контента. Планировщик (planner) работает в динамическом исследовательском цикле, итеративно чередуя сбор данных через веб-поиск с оптимизацией структуры отчета. Оптимизация структуры происходит непрерывно — планировщик расширяет секции, добавляет подразделы и реструктурирует план на основе новой информации.
Генератор контента (writer) выполняет синтез с опорой на банк памяти. Для каждой секции плана он извлекает релевантные доказательства из банка памяти по цитатам, анализирует контент через внутреннее рассуждение, затем генерирует текст. После завершения раздела материалы удаляются из контекста.
На бенчмарке DeepResearch Bench WebWeaver достигает результата 50.58 против 49.71 у Gemini-2.5-pro-deepresearch и 46.45 у openai-deepresearch. Точность цитирования — 93.37% у WebWeaver (модель Claude-sonnet-4) против 78.3% у Gemini и 75.01% у OpenAI.
Tongyi-DeepResearch-30B-A3B показывает 32.9 на Humanity's Last Exam, преводсходя как открытые, так и проприетарные модели.
#Stateoftheart #Frameworks
- честные бенчмарки и стресс-тесты GPU;
- новости рынка и технологий;
- как встроить ИИ в продукты без боли;
- советы о том, что работает, а что пустая трата денег.
В последние недели читатели особенно оценили:
- сравнение RTX 6000 Blackwell 96 ГБ с RTX 5090, A5000 и H100 в задачах LLM и видео;
- тест RTX 5090 в задачах ИИ: как GPU ведёт себя в реальных рабочих сценариях;
- 10 приёмов работы с Open WebUI, которые экономят часы при генерации;
- простое подключение ComfyUI к Open WebUI — настройка за вечер.
🎁 Каждый месяц среди подписчиков разыгрываются Telegram Premium.
Если хотите понимать, на каком железе ваши модели будут работать быстрее и дешевле — этот канал точно для вас. Подписывайтесь!
#реклама
О рекламодателе
- честные бенчмарки и стресс-тесты GPU;
- новости рынка и технологий;
- как встроить ИИ в продукты без боли;
- советы о том, что работает, а что пустая трата денег.
В последние недели читатели особенно оценили:
- сравнение RTX 6000 Blackwell 96 ГБ с RTX 5090, A5000 и H100 в задачах LLM и видео;
- тест RTX 5090 в задачах ИИ: как GPU ведёт себя в реальных рабочих сценариях;
- 10 приёмов работы с Open WebUI, которые экономят часы при генерации;
- простое подключение ComfyUI к Open WebUI — настройка за вечер.
🎁 Каждый месяц среди подписчиков разыгрываются Telegram Premium.
Если хотите понимать, на каком железе ваши модели будут работать быстрее и дешевле — этот канал точно для вас. Подписывайтесь!
#реклама
О рекламодателе
Практикум для разработчиков и ML-инженеров, которые устали от «экспериментов в Jupyter» и хотят переходить к реальным решениям! 16 сентября в 19:00 приглашаем на встречу по интеграции моделей с внешним миром и написанию API вместе с экспертом Игорем Стурейко — разработчиком модели прогнозирования технического состояния газотранспортной системы ПАО Газпром.
На практикуме вы:
👨💻перенесёте модель из Jupyter notebook в полноценный Python-класс
👨💻создадите API и подготовите эндпоинты
👨💻напишете валидатор для входящих параметров
👨💻протестируете работу модели как отдельного сервиса.
Все участники получают 7% скидку на любой курс OTUS + бонус: карьерные треки для ML-специалистов
Записывайся на практикум: https://tglink.io/e6788d8741b4
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: 2W5zFJJ4Fyr
Статистика
Отзывы канала
всего 11 отзывов
- Добавлен: Сначала новые
- Добавлен: Сначала старые
- Оценка: По убыванию
- Оценка: По возрастанию
Каталог Телеграм-каналов для нативных размещений
Neurohive - Нейроcети, Data Science, Machine Learning, AI — это Telegam канал в категории «Наука и технологии», который предлагает эффективные форматы для размещения рекламных постов в Телеграмме. Количество подписчиков канала в 4.7K и качественный контент помогают брендам привлекать внимание аудитории и увеличивать охват. Рейтинг канала составляет 20.2, количество отзывов – 11, со средней оценкой 5.0.
Вы можете запустить рекламную кампанию через сервис Telega.in, выбрав удобный формат размещения. Платформа обеспечивает прозрачные условия сотрудничества и предоставляет детальную аналитику. Стоимость размещения составляет 7692.3 ₽, а за 58 выполненных заявок канал зарекомендовал себя как надежный партнер для рекламы в TG. Размещайте интеграции уже сегодня и привлекайте новых клиентов вместе с Telega.in!
Вы снова сможете добавить каналы в корзину из каталога
Комментарий