Разберет даже почерк врача: нейросеть научили распознавать рукописные тексты кириллицей

Искусственный интеллект читает рукописи с точностью 99%

Специалисты из СФУ и ЛЭТИ создали сверхточную нейронную сеть, которая способна делать то, что зачастую сложно даже человеку. Она распознает рукописные буквы кириллического алфавита с точностью 99%. Ученые также разработали приложение, работающее без интернета и защищенное от утечки личных данных.

В современном мире для быстрой обработки текста часто необходимо иметь его цифровой вариант. Существуют приложения, переводящие печатный текст с листа в компьютер. Однако с написанным от руки дело обстоит сложнее. Даже человек иногда не может разобрать чей-то почерк. Особенно сложно бывает расшифровать написанное врачами, и у этого, кстати, есть логичное объяснение.

Российские исследователи задались целью научить искусственный интеллект читать подобные «иероглифы» на русском языке. Для этого разработали нейросеть с архитектурой сверхточных сетей, которые используются для распознавания образов с помощью технологий глубокого обучения.

Ученые предварительно обработали и загрузили в нейросеть образцы прописей на кириллице из обширной базы данных CoMNIST: фотографии 33 букв русского алфавита были помечены специальным образом. Всего использовали 13 299 изображений с прописными, печатными и написанными курсивом символами. На 85 процентах этих снимков нейронная сеть (CNN) училась распознавать буквы русского алфавита, а остальные использовали для проверки усвоенных знаний.

«Мы сравнили разработанную нами модель с наиболее мощными моделями CNN. Оказалось, что точность нашей модели во время обучения составляла до 99%, все обучение заняло три часа».

Анастасия Сафонова

руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ

Авторы зарегистрировали уникальную программу, аналогов которой нет в мире. Теперь права на нее принадлежат Сибирскому федеральному университету.

Специалисты продолжат обучение нейросети: теперь ей предстоит освоить не только буквы, но и распознавание целых слов и предложений. В будущем ИИ, по словам авторов, сможет также разбираться в стилях письма.