ФЦГП / Новости / Главная

Нейросети Яндекса расшифруют архивные рукописи

Центр гуманитарных практик
Яндекс научил нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Сервис «Поиск по архивам» открывает доступ к более чем 2,5 миллионам страниц исторических документов XVIII – начала XX веков. Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнаёт утратившие актуальность буквы и понимает особую структуру архивных документов, рассказывает сайт «АртМосковия».

«Поиск по архивам» повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье. Первым представленным в сервисе фондом стал Главархив Москвы — именно на его материалах разработчики обучали нейросеть. Теперь база пополнилась документами из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться.

Поиск можно вести по метрическим книги, исповедным ведомостям и ревизским сказкам с результатами переписи населения. Документы можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями Яндекса. Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.