Недавно я делала подборку ИИ-технологий, которые помогают учёным лучше изучать историю. Но туда поместилось не всё, поэтому ловите продолжение.



— Международная организация «Машина времени» готовит необычную карту Европы. Крутота в том, что пользователи смогут рассматривать детализированные изображения крупных городов разных времён. Например, Париж XVI и XX веков.



🗺 В этом поможет нейросеть, которой «скормят» все данные о городских планировках Европы. В прошлом году организации уже выделили целый миллион евро на этот алгоритм — так что, любители древности, затаили дыхание и ждём результатов.



— Итальянские исследователи нашли интересный способ работать с запечатанными старинными документами. Они протестировали его на завещании, которое пролежало в Государственном архиве Венеции почти 700 лет. За всё это время его так и не открыли.



🩻 Физики тоже не стали: они направили на него рентгеновские лучи, чтобы сделать фото. С помощью алгоритмов ИИ учёные разделили содержимое на шесть частей и начали расшифровывать текст. Такой метод поможет историкам изучать древние документы, не повреждая их.



— У российского исторического общества есть совместный со Сбером проект «Digital Пётр». Он помогает расшифровать документы Петра Великого с помощью ИИ. Как известно, у первого императора России был неразборчивый почерк.



👑 На пальцах процесс выглядит так. Алгоритм задействует сеть нейронок, где каждая отвечает за своё направление. Первая определяет правильную ориентацию (фотографии) страницы, вторая ищет строки на этой странице, третья распознаёт (или транскрибирует) каждую строку отдельно, а четвёртая исправляет ошибки распознавания.



Самая интересная нейросеть, которая как раз и учится распознавать почерк Петра Великого, — третья. Она извлекает из фотографии каждой строки полезные для распознавания признаки и пытается восстановить исходную последовательность символов. В самом конце создают итоговый текст (удаляют пустые символы и исправляют ошибки распознавания).



Почему вообще важно расшифровывать рукописи? Чтобы не приписывать великому правителю слов, которые он никогда не говорил. Потому что такое в истории сплошь и рядом.



— Проект In Codice Ratio оцифровывает и расшифровывает архивные документы Ватикана с помощью ПО для оптического распознавания символов и алгоритмов ИИ.



🪶 Многие тексты оттуда писали таким почерком, что стандартные методы распознавания для них бессильны. Но новый алгоритм разбивает слова не на буквы, а на отдельные росчерки пера. В итоге получается что-то вроде мозаики, которую объединяют в буквы.