Ученые Института прикладной семиотики разрабатывают русско-татарский голосовой онлайн-переводчик. Об этом пишет ИА «Татар-информ».
Сервис будет работать на основе онлайн-переводчика Tatsoft. Сейчас разработчики занимаются автоматизацией перевода. Распознавать устную речь на татарском или русском языке будет искусственный интеллект, затем он будет переводить ее и озвучивать результат.
Чтобы научить искусственный интеллект переводить устную речь, разработчикам необходимо собрать как минимум 200 часов речевой базы. Это ученые планируют сделать с помощью Telegram-бота «Татар тавышы». Носителям языка предлагают прочитать вслух присланную ботом фразу и отправить ее в виде голосового сообщения.
«Нетрудно построить модель, понимающий речь одного человека, но если будем учитывать большую аудиторию, где люди говорят по-разному, то необходимо записать больше голосов», — объяснил директор Института прикладной семиотики АН РТ Ринат Гильмуллин.
За три недели со старта к проекту присоединились 467 человек, которые записали 16 000 аудиозаписей. Всего было собрано 24 часа речи. Самыми активными участниками стали девушки 16-24 лет и мужчины 60-70 лет. Но чтобы искусственный интеллект правильно воспринимал татарскую речь, необходимо участие и представителей других категорий.
все новости