«Яндекс» научился искать текст на изображениях
У пользователей «Яндекс.Диска» появилась возможность искать текст на изображениях форматов JPEG, GIF и PNG. Достаточно ввести в поисковую строку нужное слово, и система найдет картинки, на которых оно встретится. Также пользователи увидят файлы и папки, в названиях и описаниях которых есть это слово, и документы, в тексте которых оно содержится.
Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст, будь то объявление на двери подъезда или любопытный рекламный плакат в метро.
В основе поиска текстов на изображениях лежит технология оптического распознавания символов. Однако ее точность зависит от типа изображения, его четкости, фона, на котором находится текст, и многих других факторов. Поэтому для разных видов изображений она разная. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями — 63,2%, а для скриншотов приближается к 100%. Помимо русского языка, система также распознает английский, украинский и турецкий.