Фото: chukotka-priroda
Лингвисты и носители языка собрали и проверили первые 100 тысяч словоформ, выполнив минимальный порог для участия в федеральном проекте поддержки языков народов России. Команда Чукотского арктического научного центра вместе с носителями языка вручную верифицирует каждую пару «чукотский – русский», чтобы цифровой переводчик опирался на язык бытового общения коренных малочисленных народов.
Работа существенно ускорилась после приобретения при поддержке Сбера специализированного книжного сканера. С его помощью в цифровой формат были переведены более 30 редких книг, газет и брошюр на чукотском языке, изданных в 1940–1980-е годы. Эти материалы легли в основу Национального корпуса чукотского языка, который продолжат пополнять, параллельно развивая одноименный сайт с полными текстами и аудиозаписями.
После передачи первой базы данных начнется формирование следующей сотни тысяч словоформ и создание аудиосервиса, который позволит автоматически переводить устную речь с русского на чукотский и обратно, а в перспективе — и на другие языки, включая английский.