В начале 2019 года в интернете появился первый толковый онлайн-словарь таджикского языка. Авторы назвали его «Вожаджу», что на таджикском означает «словоискатель».

Asia-Plus обратился к основателю словаря - Искандару Рафиеву.

- Что подтолкнуло вас взяться за разработку словаря, который требует долгого кропотливого труда? 

- В 2005 году я перевелся на учебу в Московский технический университет связи и информатики. Я русскоязычный человек, практически полностью выросший в русской среде. Наблюдая за тем, в каком состоянии находятся в России таджики, я «заболел» национализмом. Мне стал интересен таджикский язык и культура. В этот период я подружился со студентом нашего университета, владеющего персидской вязью, общение с которым помогло мне начать изучать персидский язык.

При помощи нескольких интернет-сайтов я научился писать и читать на фарси. В интернете очень много персидских словарей и мне не представлялось сложным находить необходимые переводы с русского.

Искандар Рафиев

Проблемой стало изучение таджикского языка, т.к. те слова, что использовались в фарси, не всегда использовались в таджикской речи, хотя и существовали в наших словарях.

Единственный на то время таджикский словарь, имеющий как написания на кириллице, так и на фарси был «Фарҳанги забони тоҷикӣ» («Словарь таджикского языка»). Этот словарь был издан еще в 1969 году. Дефицит копий словаря сделал его очень дорогостоящим, и каждый владелец бережно хранил двухтомник.

Я хотел их приобрести для личного пользования, но не смог найти ни одной копии, или находил сильно использованные книги по очень высоким ценам. Представьте, что сейчас одна книга стоит порядка 700 сомони, при средней зарплате в 1000 сомони! Кто сможет себе такое позволить?

Вот так у меня и зародилась идея создать доступный бесплатный толковый словарь.

- Как осуществляли свою идею? Какие были трудности и как их преодолели?

- Я долгое время не брался за реализацию словаря. Я работал, был занят личной жизнью. Только в 2015 году я принялся за работу. Попробовал несколько технологий разработки интернет-сайтов. В итоге, определившись, я написал первую версию, которая только проводила поиск по данным и отображала результаты пользователю.

Практически сразу же после написания первой версии программы я столкнулся с главной проблемой, у меня не было самих данных. За основу словаря я выбрал "Фарҳанги тафсирии забони тоҷикӣ" («Толковый словарь таджикского языка»). Электронную версию в формате ПДФ я нашел в интернете.

Я провел целую ночь в попытке распознать текст одной страницы словаря, при этом сохранив текст на кириллице и на фарси. Этот подход сразу же отпал, так как в словаре несколько тысяч страниц и с такой скоростью я бы никогда не завершил работу. 

Мы начали вводить данные вручную. Моя супруга нашла группу учителей в Исфаре, которые согласились за небольшую сумму вводить для нас слова. Но работа шла все же очень медленно. 

Через некоторое время я совершенно случайно нашел ряд групп в Facebook, занимающихся вопросами таджикского языка и обратился в одну из них. Один из членов этой группы, Дустмурод Саид, любезно предоставил мне файлы Word "Фарҳанги тафсирии забони тоҷикӣ". Я был безумно рад тому, что у меня появились данные, которые я мог ввести в автоматическом режиме.

Я провел один месяц практически без сна, обрабатывая эти файлы, и написал программу для загрузки данных в свою базу. Так в декабре 2017 года появилась первая версия словаря.

-  Какие образцы словарей таджикского языка были взяты вами за основу проекта?


- Мы использовали словарь "Фарҳанги тафсирии забони тоҷикӣ", который я упомянул выше. Его было недостаточно, т.к. в нем было допущено немалое количество ошибок и отсутствовали примеры.

Я договорился с группой ребят вводить "Фарҳанги забони тоҷикӣ", изданный в 1969 году, и в течение года мы его полностью ввели в наш словарь.

Сейчас мы вводим слова из классических персидских словарей для того, чтобы наши пользователи также могли найти слова, использованные в современной и классической персидской литературе.

 

«На образование и будущее народа люди тратиться не хотят»

- Расскажите подробно об авторах словаря? Сколько их и чем они занимаются в жизни?

- Основателем, дизайнером и разработчиком словаря являюсь я. Я живу в Нью-Йорке уже 9 лет, занимаюсь разработкой программного обеспечения. Успел поработать в сферах рассылки факсов и email, производства одежды, языковых переводов, интернет-рекламы, сейчас я в сфере недвижимости.

В реализации словаря приняли участие несколько десятков человек, одни помогли придумать название, другие дали денег, кто-то разработал логотип, помогли защитить права в области интеллектуальной собственности. А еще люди постоянно пополняли и продолжают дополнять словарь новым данными.

- Какие расходы вы понесли?

- Основные финансовые расходы ушли на оплату работы редакторов, на данный момент мы потратили около 6 тысяч долларов. Я зарегистрировал товарные знаки «Вожаҷӯ» в Республике Таджикистан и в Российской Федерации, на что ушло порядка 3 тысяч долларов.

Основные расходы несет моя семья. Часть суммы мы собрали через платформу краудфандинга GoFundMe, но и там нам пожертвовали деньги, в основном, мои друзья и родственники.

К сожалению, наше общество недостаточно поддерживает такие проекты. Я написал нескольким успешным таджикам в США, от которых не получил никакого ответа. Также я обращался в таджикскую диаспору в Штатах с просьбой пожертвовать по 5-10 долларов и также не получил ответа. Парадоксально, что на чьи-то мероприятия люди собирают по 15 000 долларов за несколько дней, а на образование и на будущее своего народа они этого делать не хотят.

-  Как пользоваться словарем?

- Интерфейс очень прост и представляет собой одно поле поиска, похожее на сайт Google. Вам достаточно ввести слово на таджикском или персидском языках и нажать кнопку поиск. Мы также добавили мини клавиатуру с таджикскими символами для тех, у кого нет таджикской клавиатуры.

Наш словарь обладает рядом преимуществ. Мы полностью сохраняем оригинальное форматирование текста, приводим примеры использования слов из классической таджикско-персидской литературы, и ряд устоявшихся выражений и фразеологизмов с примерами их использования.

Более того, мы добавили ряд инструментов, для облегчения пользования словарем:

Это - Telegram Bot, который дает возможность поиска слов и фраз из Телеграмма с мобильных устройств и настольных компьютеров. Также мы разработали расширение для Google Chrome, которое позволяет выделить любое слово или фразу на таджикском или персидском сайте и показать определение из нашего словаря прямо на месте. В дополнение к этому я добавил стандартную клавиатуру для MacOS и фонетические клавиатуры для Windows и Macintosh.

-  Может ли ваша программа автоматически указать на ошибки в правописании слов?

- Пока этой функции в словаре нет, но мы понимаем, что это очень востребованная функция, которую в ближайший год планируем добавить.

-  Как быть с терминами, которые авторы используют в своих трудах, но официально не признаны?

- Да, это, как правило, слова, заимствованные из персидского языка и люди их просто не знают. Их необходимо ввести в оборот и внести в школьную программу.

Есть еще момент, наша интеллигенция разделена на два лагеря, одни поддерживают персидскую литературу и заимствование терминов из нее, другие поддерживают заимствование и использование русских терминов. Поэтому мы не придерживаемся ни той ни другой стороны и вводим в наш словарь и те и другие слова, для того чтобы пользователи могли найти определения, используя те версии слов, которые они знают.

- Как известно, двухтомник «Фарханги забони точики» до сих пор является настольной книгой для многих. Вы свой словарь дополняете новыми понятиями и терминами, которые не встречаются в этой книге?

- Мы их дополняем там, где слова не полностью отображают их современное значение. Те значения, которые были в оригинале, остаются и к ним добавляются новые.

 

Планы на развитие

Есть ли возможность на базе «Вожаджу» создать двуязычные словари, например, таджикско-арабский, русский, английский и др.? 

- Да. Мы уже начали ввод перевода с таджикского языка на русский. Я начал переговоры с рядом ученых, знающих таджикский, персидский и английский языки для ввода таджикско-английского перевода. Мы также хотим добавить арабский и китайский языки, для того, чтобы дать нашему обществу возможность изучать основные языки мира и получить доступ к информационным пространствам на этих языках.

Также мы планируем добавить в наш словарь транслитератор с персидского на таджикский, чтобы можно было зайти на любой персидский образовательный ресурс и, нажав кнопку в браузере, перевести его на кириллицу с учетом особенностей таджикского языка, и суметь прочитать его.

Мы также понимаем заинтересованность других персоязычных народов в изучении таджикского языка, и мы считаем, что таким образом наш словарь может привлечь большее количество студентов и бизнесменов в нашу страну.

Также, наш словарь поможет изучать родной язык огромному количеству таджиков и их детям, живущим вне Таджикистана.

- Какие отзывы о вашей работе уже есть? Обсуждают словарь в соцсетях или нет? 

- Я замечаю, что пользователи не редко ссылаются на наш словарь. Я также был очень удивлен, что писатели, журналисты и другие профессионалы регулярно пользуются нашим словарем и даже ссылаются на него в своих работах. В целом отзывы положительные, но пользователи не всегда находят необходимые слова. Мы вводим около 4500 слов каждый месяц и с появлением дополнительных финансовых и человеческих ресурсов количество новых слов будет увеличиваться еще быстрее.

В настоящее время в словаре присутствует порядка 75000 слов.

- Есть ли мобильная версия словаря?

- Пока нет. Мы начали ее разрабатывать, и в течение последующих нескольких месяцев выпустим версию для платформы Android и очень надеюсь для iOS. Тем не менее, веб версия словаря разработана для мобильных устройств, также можно использовать Telegram Bot.

-  Кем и как проверяются новые фразы, которые могут предлагать пользователи вашего сайта?
- Запросы на изменение или добавление новых статей от пользователей идут в специальный раздел нашей системы, откуда редакторы вручную вводят запрошенные статьи в словарь.

Мы осуществляем проверку ввода каждой статьи, используя процесс обзора. Любая статья, прежде чем быть опубликованной проходит обзор другого редактора. Наши редакторы прекрасно владеют таджикским языком, при этом, мы ведем переговоры с профессиональными переводчиками, которые будут заниматься только редакцией и обзором вводимых статей.

Осенью нас модно читать в TelegramFacebookInstagram, Viber, Яндекс.Дзен и OK.