Медиа-группа «Азия-Плюс» и стартап Re-skill объявляют о начале партнёрства в области обучению нейросети таджикской речи.
В рамках сотрудничества «Азия-Плюс» передаст аудиоархив новостных программ и передач на таджикском языке для обучения открытой нейросети по озвучке текста (TTS) и распознаванию речи (ASR) на таджикском языке, которая разрабатывается со стороны команды Re-skill.
В результате сотрудничества сотни часов живой речи на таджикском - новости, интервью, шоу-программы, аналитика - станут основой для обучения разрабатываемой модели.
В свою очередь, медиагруппа получит официальный партнёрский статус, доступ ко всем версиям инструмента, возможность участвовать в развитии проекта. Также «Азия-Плюс» будет освещать ход работы, использовать в подготовке контента и делиться результатами на своих медиаплатформах.
Re-Skill TTS это первая открытая системой распознавания и озвучки таджикской речи. Ранняя версия модели уже доступна на платформе HuggingFace. Несмотря на ограниченное количество обучающих данных всего около 35 часов нейросеть уже воспроизводит таджикскую речь с естественной интонацией и ритмом.

Для «Азия-Плюс» участие в этом проекте - это не только технологический вклад, но и отражение ее культурной и общественной миссии.
«Это не просто технологическое партнёрство, а вклад в продвижение нашего национального языка в цифровой мир, - подчёркивает генеральный директор «Азия-Плюс» Умед Бабаханов. - Сегодня особенно важно создавать такие решения на таджикском, чтобы наш язык звучал в современных сервисах и был доступен в формате голосовых помощников и образовательных приложений. Мы рады поддержать команду Re-skill на этом пути и готовы поддерживать подобные инициативы и в будущем».
Фаррух Умаров, основатель проекта Re-skill, уверен, что партнёрство с медиа-группой станет ключевым этапом в развитии TTS:
«Мы верим, что таджикский язык заслуживает такого же качественного технологического представления, как и любые мировые языки. Наша цель сделать доступным инструмент, который поможет каждому интегрировать таджикский в свои сервисы и приложения.
Мы открыли эту модель для сообщества, чтобы стимулировать совместное развитие и сбор большего количества данных. Сотрудничество с «Азия-Плюс» даёт нам уникальный и ценный источник аудиоматериалов и помогает заложить технологический фундамент для следующих поколений голосовых ассистентов и образовательных продуктов на таджикском языке».

Как работает система
Нейросеть построена на архитектуре больших языковых моделей, интегрированных с современными аудиокодеками. Система распознаёт речь, генерирует ответ с помощью LLM, а затем озвучивает его на таджикском языке. Такой каскадный подход позволяет создавать не просто синтезированный звук, а диалоговую, выразительную речь.
Модель может быть запущена локально например, прямо на вашем MacBook.
Также Re-Skill выпустили собственную модель для распознавания речи Whisper, которая обеспечивает высокую точность транскрипции и поддержку множества языков.
Сегодня таджикский язык почти не представлен на глобальных цифровых платформах. Этот проект закладывает основу для его полноценного присутствия в голосовых интерфейсах, образовательных продуктах, медиа и сервисах.
Этим летом оставайтесь с нами в Telegram, Facebook, Instagram, Яндекс.Дзен, OK и ВК



