USD
87.74
-0.25
EUR
95.76
+0.08
Категория: AI и робототехникаAI и робототехника
12 июня 2023 г. в 16:45

Нейросеть помогла расшифровать более девяти миллионов страниц архивных записей

Нейросеть помогла расшифровать более девяти миллионов страниц архивных записей
www.thefifthcolumn.co.uk
На базе Главного архива Москвы и архивов ряда регионов России начат эксперимент по внедрению нейросетей в архивное дело, сообщает официальный сайт Мэра Москвы.
В начале года была запущена платформа «Поиск по архивам». В комфортной виртуальной рабочей среде при помощи нейросети сотрудники архивов и сторонние исследователи получили возможность расшифровывать архивные записи. Все они рукописные, большая часть имеет сложную орфографию, принятую в период с XVIII по начало XX века. Обычными средствами подобные документы расшифровать и перевести в удобную электронную форму не представляется возможным. Для человека это слишком трудоемкая задача, объемы хранящихся в столичном архиве документов измеряются миллионами экземпляров. Расшифровка производится с использованием технологии машинного зрения.
«В распоряжении комплекса социального развития Москвы уже была современная цифровая техника и огромный архив оцифрованных документов по историям семей — именно эти материалы послужили основой для обучения искусственного интеллекта. Сейчас в базе сервиса представлено 4,5 миллиона образов архивных документов, а это более девяти миллионов страниц метрических книг, исповедных ведомостей, ревизских сказок», — сообщила заместитель Мэра Москвы по вопросам социального развития Анастасия Ракова.
За прошедшие месяцы текущего года архивисты и исследователи смогли подробно изучить более 5 миллионов оцифрованных страниц архивных документов, снабженных текстовыми расшифровками. Это примерно половина фонда хранения архива.
Бесплатно могут воспользоваться ресурсами платформы и обычные пользователи. Поиск по оцифрованным документам осуществляет прошедшая несколько этапов машинного обучения специализированная нейросеть. Поиск можно вести по документам, фамилиям, именам, географическим названиям и другим параметрам. Поиск занимает секунды.
Поиск по документам снабжен набором поисковых фильтров. Документы можно искать по годам, фондам и описям. Информация представляется в виде двух документов: изображения оригинального документа и его точно построчной расшифровки, которую производит ИИ. Интерфейс системы имеет развитые удобные функции.
В настоящее время кроме Москвы специализированная нейросеть уже запущена в некоторых архивных учреждениях Московской, Оренбургской, Новгородской областей. Архивная нейросеть уже расшифровала более полутора миллионов электронных документов.
0 комментариев