

- Главная
- Каталог
- Наука и технологии
- Data science | Machinelearning [ru]
Data science | Machinelearning [ru]
Статьи на тему data science, machinelearning, big data, artificial intelligence, python, математика.
Аудитория - IT специалисты и те кто хочет ими стать
Канал постоянно привлекает новых подписчиков.
Статистика канала
Полная статистикаchevron_rightВо-первых, Kimi K2 Thinking может делать цепочки рассуждений, искать, писать код и вообще — выполнять задачи, которые раньше считались сложными для ИИ. За счет увеличения количества «токенов размышления» и улучшения числа шагов при вызове инструментов модель буквально может «думать» дольше и точнее, обеспечивая более глубокое понимание контекста. На практике эта модель превзошла ожидания. Вот несколько крутых достижений: — Humanity’s Last Exam (HLE): Бенчмарк, который оценивает логическое мышление на экспертном уровне по 100+ дисциплинам. K2 Thinking набрала 44,9% — отличный результат для задачи, где каждое слово на счету. — SWE-Multilingual и SWE-Bench Verified: Рейтинг по задачам на кодинг и разработку ПО. Тут K2 Thinking показала 61,1% и 71,3% соответственно, что намекает на хорошие перспективы для работы с кодом на разных языках программирования. — Terminal-Bench: И снова — 47,1% в задачах, связанных с командной строкой и терминалом. Модель находит решение и там. — BrowseComp: Самый интересный момент! На бенчмарке по поиску и навигации в интернете K2 Thinking набрала 60,2%, что в два раза больше, чем средний человеческий результат (29,2%). Модель умеет эффективно искать, анализировать и работать с интернет-данными, что делает её уникальной для работы в динамичных, насыщенных информацией средах. Основная фишка — Kimi K2 Thinking может создавать сложные интерактивные приложения с нуля. Например, она генерирует код для популярных библиотек визуализации, и результат просто впечатляющий. Конечно, для повседневной работы разработчиков такие примеры пока не идеально подходят, но качество и уровень проделанной работы на данный момент — на высоте.Если вы работаете в ИТ-сфере, наверняка будете следить за этим релизом. Особенно интересно, как модель будет справляться с более сложными и динамичными задачами, выходящими за пределы лабораторных тестов. Data Science
Гипотеза Какея — это задача из области геометрии, которая изучает минимальные размеры множеств, внутри которых можно провести отрезки в любых направлениях, не выходя за пределы множества. Вроде бы всё просто, но задача не решена до сих пор, и именно в этом её привлекательность для математиков. Задача заключается в том, чтобы найти такие множества, которые имеют минимальные размеры, но при этом позволяют создавать отрезки во всех возможных направлениях. Теперь представьте, что у вас есть мощный ИИ, который может сгенерировать новые примеры таких множеств и помочь с доказательством. И вот тут на сцену выходят инструменты от DeepMind: Gemini Deep Thinking, AlphaEvolve и AlphaProof. Для того чтобы подойти к решению гипотезы Какея, нужно не просто понять теорию, но и создать реальный пример множества. Тут-то и вмешались ИИ-системы. • AlphaEvolve взял на себя роль генератора идей, создав новую конструкцию множества Какея в конечных полях • Gemini Deep Thinking взял на себя проверку: он доказал корректность этой конструкции. То есть, можно было не только увидеть, что идея работала, но и подтвердить её правильность • AlphaProof завершил работу, формализовав доказательство в системе Lean и полностью верифицировав его Почему это важно? Этот случай сильно отличается от того, как мы привыкли видеть «магические» заявления от ИИ, как это делает OpenAI, когда говорит, что GPT-5 открыла «новую математику». Всё-таки важно не просто заявить о каком-то открытии, а показать процесс. Здесь мы видим полноценный цикл: от гипотезы до формализованного доказательства.Когда ИИ помогает не только генерировать идеи, но и проверять их, а затем формализовывать доказательства, мы находимся на пороге новых научных открытий. Data Science
Для сравнения: самый мощный космический компьютер до этого был Spaceborne Computer-2 от HPE на МКС, который работал со скоростью около 2 терафлопс, используя старенькую Nvidia T4. А вот H100 способна выдать целых 2000 терафлопс — представляете? Это как если бы вы использовали ноутбук из будущего, и при этом этот ноутбук работает прямо в космосе! Размер спутника с этой видеокартой — как небольшой холодильник, что тоже звучит невероятно, учитывая все условия, в которых работает оборудование. На борту спутника планируют донастроить Gemma от Google — системы, которые смогут использовать все мощности H100. Стартап Starcloud планирует к 2026 году запустить полноценный датацентр прямо на орбиту, а к 2030 году они хотят вывезти в космос около 100 тонн ускорителей.Представьте, если датацентры в космосе станут нормой. Это откроет новые горизонты для вычислений, сделает доступ к суперкомпьютерам более демократичным и дешёвым. А ещё, это даст уникальные возможности для исследований и тестирования новых технологий, о которых мы сейчас даже не мечтаем. Data Science
Игры — это не просто развлечение. Они предоставляют отличную модель реального мира, где можно проверить, как ИИ решает задачи с четкими правилами и обратной связью. Причем, игры с такими параметрами, как реакция на интерфейс, возможность планировать действия и выполнять многошаговые задачи, дают нам много полезной информации о возможностях ИИ. Эксперимент был прост: ChatGPT Atlas запускали с настройками, имитирующими реальную работу агента в браузере, без памяти и дополнительных подсказок. Он просто получал страницу с игрой и начинал действовать, как мог. И каждый раз результат был сравнивался с типичными человеческими бейзлайнами — чтобы понять, насколько ИИ близок к человеку. — Судоку: Atlas решал задачи за 2 минуты 28 секунд с точностью 100%. Для сравнения, человек бы потратил около 10-12 минут на то же самое. Это прямо впечатляет! — 2048: В этой игре агент стабильно набирал около 2242 очков, но до рекордов человека (3463 очка с первого раза) ему было далеко. Проблема? Он не выстраивал долгосрочные стратегии и часто застревал на одинаковых уровнях. — T-Rex Runner: Когда мы говорим о реальном времени, тут начались проблемы. Атлас набрал всего 45,5 очка, по сравнению с 388,9 у человека. И 9 из 10 раз он не мог даже пройти первое препятствие. — Flappy Bird: Здесь Atlas вообще не набрал ни одного очка. А люди в среднем делали около 3. Агент не мог быстро повторить нажатие одной клавиши — и результат нулевой. — Stein.world: В этой игре, требующей долгосрочной стратегии и разнообразных действий, Atlas не мог пройти начальную комнату. Однако, после некоторых подсказок, он справился и выполнил задание. Что можно сказать в итоге? ChatGPT Atlas отлично справляется с задачами, которые требуют анализа и пошагового подхода, такими как решение судоку или понимание логики в играх вроде 2048. Но как только дело доходит до быстрого реагирования, например в Flappy Bird или T-Rex Runner, ему явно не хватает скорости. Это просто особенность архитектуры: модели вроде Atlas заточены на рассуждения, а не на мгновенную реакцию.Этот эксперимент подчеркивает важную границу между когнитивными способностями ИИ и его действиями в реальном времени. В будущем такие способности, скорее всего, будут разделены: один агент будет заниматься анализом и пониманием контекста, а другой — исполнять команды в реальном времени. Вот так и появится идеальная команда «мыслителей» и «исполнителей»
Отзывы канала
всего 10 отзывов
- Добавлен: Сначала новые
- Добавлен: Сначала старые
- Оценка: По убыванию
- Оценка: По возрастанию
Каталог Телеграм-каналов для нативных размещений
Data science | Machinelearning [ru] — это Telegam канал в категории «Наука и технологии», который предлагает эффективные форматы для размещения рекламных постов в Телеграмме. Количество подписчиков канала в 19.2K и качественный контент помогают брендам привлекать внимание аудитории и увеличивать охват. Рейтинг канала составляет 24.0, количество отзывов – 10, со средней оценкой 4.8.
Вы можете запустить рекламную кампанию через сервис Telega.in, выбрав удобный формат размещения. Платформа обеспечивает прозрачные условия сотрудничества и предоставляет детальную аналитику. Стоимость размещения составляет 14825.16 ₽, а за 83 выполненных заявок канал зарекомендовал себя как надежный партнер для рекламы в TG. Размещайте интеграции уже сегодня и привлекайте новых клиентов вместе с Telega.in!
Вы снова сможете добавить каналы в корзину из каталога
Комментарий