Специалисты из СФУ и ЛЭТИ
В современном мире для быстрой обработки текста часто необходимо иметь его цифровой вариант. Существуют приложения, переводящие печатный текст с листа в компьютер. Однако с написанным от руки дело обстоит сложнее. Даже человек иногда не может разобрать чей-то почерк. Особенно сложно бывает расшифровать написанное врачами, и у этого, кстати, есть логичное объяснение.
Российские исследователи задались целью научить искусственный интеллект читать подобные «иероглифы» на русском языке. Для этого разработали нейросеть с архитектурой сверхточных сетей, которые используются для распознавания образов с помощью технологий глубокого обучения.
Ученые предварительно обработали и загрузили в нейросеть образцы прописей на кириллице из обширной базы данных CoMNIST: фотографии 33 букв русского алфавита были помечены специальным образом. Всего использовали 13 299 изображений с прописными, печатными и написанными курсивом символами. На 85 процентах этих снимков нейронная сеть (CNN) училась распознавать буквы русского алфавита, а остальные использовали для проверки усвоенных знаний.

«Мы сравнили разработанную нами модель с наиболее мощными моделями CNN. Оказалось, что точность нашей модели во время обучения составляла до 99%, все обучение заняло три часа».
Авторы зарегистрировали уникальную программу, аналогов которой нет в мире. Теперь права на нее принадлежат Сибирскому федеральному университету.
Специалисты продолжат обучение нейросети: теперь ей предстоит освоить не только буквы, но и распознавание целых слов и предложений. В будущем ИИ, по словам авторов, сможет также разбираться в стилях письма.