Разберет даже почерк врача: нейросеть научили распознавать рукописные тексты кириллицей
Фото
archidoc / Alamy

Специалисты из СФУ и ЛЭТИ создали сверхточную нейронную сеть, которая способна делать то, что зачастую сложно даже человеку. Она распознает рукописные буквы кириллического алфавита с точностью 99%. Ученые также разработали приложение, работающее без интернета и защищенное от утечки личных данных.

В современном мире для быстрой обработки текста часто необходимо иметь его цифровой вариант. Существуют приложения, переводящие печатный текст с листа в компьютер. Однако с написанным от руки дело обстоит сложнее. Даже человек иногда не может разобрать чей-то почерк. Особенно сложно бывает расшифровать написанное врачами, и у этого, кстати, есть логичное объяснение.

Российские исследователи задались целью научить искусственный интеллект читать подобные «иероглифы» на русском языке. Для этого разработали нейросеть с архитектурой сверхточных сетей, которые используются для распознавания образов с помощью технологий глубокого обучения.

Ученые предварительно обработали и загрузили в нейросеть образцы прописей на кириллице из обширной базы данных CoMNIST: фотографии 33 букв русского алфавита были помечены специальным образом. Всего использовали 13 299 изображений с прописными, печатными и написанными курсивом символами. На 85 процентах этих снимков нейронная сеть (CNN) училась распознавать буквы русского алфавита, а остальные использовали для проверки усвоенных знаний.

Анастасия Сафонова

Авторы зарегистрировали уникальную программу, аналогов которой нет в мире. Теперь права на нее принадлежат Сибирскому федеральному университету.

Специалисты продолжат обучение нейросети: теперь ей предстоит освоить не только буквы, но и распознавание целых слов и предложений. В будущем ИИ, по словам авторов, сможет также разбираться в стилях письма.