Медиа-группа «Азия-Плюс» и стартап Re-skill объявляют о начале партнёрства в области обучению нейросети таджикской речи.

В рамках сотрудничества «Азия-Плюс» передаст аудиоархив новостных программ и передач на таджикском языке для обучения открытой нейросети по озвучке текста (TTS) и распознаванию речи (ASR) на таджикском языке, которая разрабатывается со стороны команды Re-skill.

В результате сотрудничества сотни часов живой речи на таджикском - новости, интервью, шоу-программы, аналитика - станут основой для обучения разрабатываемой модели.

В свою очередь, медиагруппа получит официальный партнёрский статус, доступ ко всем версиям инструмента, возможность участвовать в развитии проекта. Также «Азия-Плюс» будет освещать ход работы, использовать в подготовке контента и делиться результатами на своих медиаплатформах.

Re-Skill TTS это первая открытая системой распознавания и озвучки таджикской речи. Ранняя версия модели уже доступна на платформе HuggingFace. Несмотря на ограниченное количество обучающих данных  всего около 35 часов  нейросеть уже воспроизводит таджикскую речь с естественной интонацией и ритмом.

Для «Азия-Плюс» участие в этом проекте  - это не только технологический вклад, но и отражение ее культурной и общественной миссии.

«Это не просто технологическое партнёрство, а вклад в продвижение нашего национального языка в цифровой мир, - подчёркивает генеральный директор «Азия-Плюс» Умед Бабаханов. - Сегодня особенно важно создавать такие решения на таджикском, чтобы наш язык звучал в современных сервисах и был доступен в формате голосовых помощников и образовательных приложений. Мы рады поддержать команду Re-skill на этом пути и готовы поддерживать подобные инициативы и в будущем».

Фаррух Умаров, основатель проекта Re-skill, уверен, что партнёрство с медиа-группой станет ключевым этапом в развитии TTS:

«Мы верим, что таджикский язык заслуживает такого же качественного технологического представления, как и любые мировые языки. Наша цель  сделать доступным инструмент, который поможет каждому интегрировать таджикский в свои сервисы и приложения.

Мы открыли эту модель для сообщества, чтобы стимулировать совместное развитие и сбор большего количества данных. Сотрудничество с «Азия-Плюс» даёт нам уникальный и ценный источник аудиоматериалов и помогает заложить технологический фундамент для следующих поколений голосовых ассистентов и образовательных продуктов на таджикском языке».
Фарруха Умаров - основатель стартапа Re-skill, Бахманер Надиров - редакционный директор «Азия-Плюс», Манижа Анвари - исполнительный директор «Азия-Плюс»
Asia-Plus

 

Как работает система

Нейросеть построена на архитектуре больших языковых моделей, интегрированных с современными аудиокодеками. Система распознаёт речь, генерирует ответ с помощью LLM, а затем озвучивает его на таджикском языке. Такой каскадный подход позволяет создавать не просто синтезированный звук, а диалоговую, выразительную речь.

Модель может быть запущена локально  например, прямо на вашем MacBook.

Также Re-Skill выпустили собственную модель для распознавания речи Whisper, которая обеспечивает высокую точность транскрипции и поддержку множества языков.

Сегодня таджикский язык почти не представлен на глобальных цифровых платформах. Этот проект закладывает основу для его полноценного присутствия  в голосовых интерфейсах, образовательных продуктах, медиа и сервисах.

Этим летом оставайтесь с нами в TelegramFacebookInstagramЯндекс.ДзенOK и ВК