
- Главная
- Каталог
- Интернет технологии
- 👾 НЕЙРО-СОФТ ● РЕПАКИ И ПОРТАТИВКИ
👾 НЕЙРО-СОФТ ● РЕПАКИ И ПОРТАТИВКИ
Делаем нейросети удобными и доступными. Made by
Статистика канала
VoxCPM2 Portable — это портативная сборка open-source модели VoxCPM2 от OpenBMB (2 миллиарда параметров, 2 миллиона часов обучающей речи) с русскоязычной Gradio-студией. Делает три вещи: синтез речи на 30 языках с автоопределением, Voice Design (новый голос из текстового описания без референса) и клонирование голоса по короткому референсу. Выход — студийные 48 kHz через AudioVAE V2 super-resolution. Есть live-стриминг — аудио начинает играть во время генерации, не надо ждать окончания синтеза. И вот что главное — это очень мощная система для клонирования голоса, работает быстро, качество отличное. Как киллер-фича — можно обучить LoRA на любом голосе. Я решил развить эту идею и сделал автоматический пайплайн для подготовки датасета. Всё что вам надо — закинуть видео или аудио, а дальше умный пайплайн сам нарежет его на голосовые клипы, скачает ASR-модель, сделает транскрипцию и подготовит клипы для обучения LoRA. Вам буквально надо нажать одну кнопку, чуть подождать — и вот лучшее из open-source качество синтеза голоса уже у вас.
🟣 Синтез речи на 30 языках с автоопределением, 48 kHz студийное качество через AudioVAE V2🟣 Voice Design — создание голосов из текстового описания (пол, возраст, эмоция, акцент), zero-shot🟣 Voice Cloning — клонирование по 5-50 секундам референса, с опциональным Ultimate-режимом🟣 Живое стриминг-воспроизведение: аудио начинает играть во время генерации, не надо ждать🟣 Пак из 100+ готовых голосов + 743 русских голоса по запросу из Slait/russia_voices🟣 Контроль стиля: «чуть быстрее, бодрым тоном», «шёпотом, интимно», «медленно и драматично»🟣 Форматы вывода MP3 / WAV / FLAC / OGG🟣 Авто-обучение LoRA из видео: ffmpeg → Parakeet TDT 0.6B v3 INT8 (NVIDIA NeMo, 25 европейских языков) + Silero VAD → нарезка по предложениям → авто-подбор параметров → запуск тренировки. Одна кнопка🟣 Ручной режим тренировки LoRA для заранее подготовленных датасетов🟣 Hot-swap LoRA — переключение между моделями без перезапуска приложения🟣 ZipEnhancer денойзер для шумных референсов🟣 Все параметры модели в UI: CFG, Inference Steps, Min/Max длина, Retry, Seed🟣 Flash Attention 2 из коробки (RTX 40xx / 50xx), xformers, Triton, bfloat16🟣 i18n RU/EN с переключением в шапке, тёмная тема, FFmpeg в комплекте
⁍ Скачайте архив с установщиком или клонируйте репозиторий
⁍ Запустите install.bat — выберите поколение вашей видеокарты
⁍ Установщик сам скачает Python 3.12, PyTorch, voxcpm, Flash Attention 2, FFmpeg
⁍ Запустите run.bat — приложение откроется в браузере
⁍ Модели подтянутся при первом запуске (VoxCPM2 ~4-5 ГБ; Parakeet ASR ~670 МБ — лениво при первом клике на авто-подготовку)
⁍ Используйте update.bat для обновлений{}
Друзья, это самый масштабный проект с открытым кодом, который я когда-либо делал! ACE-Step Studio — это полноценная локальная AI-студия для создания музыки. Песни с вокалом, каверы, ремиксы, музыкальные клипы — 100% локально, без облака, без подписок, без интернета. Suno у вас дома — и это не шутка. В основе — модель ACE-Step 1.5 XL на 4 миллиарда параметров. Но я не просто запаковал её в портативку — я форкнул и переработал целую студию в стиле суно: фронтенд на React, бэкенд на Express + Python, видеоредактор, систему каверов, генератор клипов.
🟣 Песни с вокалом до 8 минут — любой язык, любой жанр🟣 3 XL модели — Turbo (быстро), SFT (макс. качество), BF16 (компактная, 7.5 ГБ)🟣 AI-генерация текстов и стиля через встроенную LLM🟣 Каверы — превращайте любой трек в новый стиль, сохраняя мелодию🟣 Repaint — перегенерируйте отдельные участки песни🟣 Видео Студия — генератор клипов с 10 пресетами, караоке-субтитры, 12 эффектов (глитч, VHS, CCTV и др.), форматы для YouTube/TikTok/Instagram🟣 Разделение дорожек — вокал, ударные, бас, остальное (Demucs)🟣 Аудио-редактор — обрезка, фейды, эффекты прямо в студии🟣 Поддержка LoRA, пакетная генерация, 10 сэмплеров, ID3-теги🟣 Мерджер моделей, BF16-конвертер, Bake LoRA🟣 5 языков, доступ по LAN, мониторинг GPU, тёмная/светлая тема
⁍ Скачайте архив с установщиком или клонируйте репозиторий
⁍ Запустите install.bat — сам скачает Python, PyTorch, Node.js
⁍ Запустите run.bat — студия откроется в браузере
⁍ Модели подтянутся при первом запуске
⁍ Используйте update.bat для получения обновлений{}
Отзывы канала
всего 3 отзыва
- Добавлен: Сначала новые
- Добавлен: Сначала старые
- Оценка: По убыванию
- Оценка: По возрастанию
Каталог Телеграм-каналов для нативных размещений
👾 НЕЙРО-СОФТ ● РЕПАКИ И ПОРТАТИВКИ — это Telegam канал в категории «Интернет технологии», который предлагает эффективные форматы для размещения рекламных постов в Телеграмме. Количество подписчиков канала в 13.5K и качественный контент помогают брендам привлекать внимание аудитории и увеличивать охват. Рейтинг канала составляет 7.7, количество отзывов – 3, со средней оценкой 5.0.
Вы можете запустить рекламную кампанию через сервис Telega.in, выбрав удобный формат размещения. Платформа обеспечивает прозрачные условия сотрудничества и предоставляет детальную аналитику. Стоимость размещения составляет 4545.45 ₽, а за 7 выполненных заявок канал зарекомендовал себя как надежный партнер для рекламы в TG. Размещайте интеграции уже сегодня и привлекайте новых клиентов вместе с Telega.in!
Вы снова сможете добавить каналы в корзину из каталога
Комментарий