Ненастоящий интеллект расшифровал неразборчивый почерк императораВ ходе проекта “Digital Пётр”, проводимого Российским историческим обществом (РИО) совместно со СберБанком, бывальщины расшифрованы трудно читаемые из-за плохого почерка рукописи Петра I. Это петровское наследие за 26 лет. Впереди у специалистов по разбору данных и искусственному интеллекту еще сто миллионов страниц документов. Но это, как выяснилось на “круглом столе”, посвященном 350-летию со дня рождения Петра I, труд нескольких дней.

Ненастоящий интеллект расшифровал неразборчивый почерк императора

Ненастоящий интеллект расшифровал неразборчивый почерк императора

Нерасшифрованными остаются более ста миллионов страниц рукописного текста. Фото: Российское историческое общество

“В течение немало лет изучение выдающейся личности Петра I сдерживалось медленными темпами публикации его рукописного наследия, – начал совещание глава РИО Сергей Нарышкин. – Первоначальный сборник из серии “Письма и бумаги Петра Великого” вышел из печати еще в 1887 году, однако сегодня эта работа по-прежнему дальня от своего завершения. Одной из причин ее огромной трудоемкости является неразборчивый почерк императора. Чтобы ускорить введение петровских манускриптов в научный и общественный оборот, РИО и СберБанк инициировали проект “Digital Пётр”, направленный на расшифровку автографов правителя при помощи новейших информационных технологий”.

Как рассказал первоначальный зампред правления СберБанка Александр Ведяхин, удалось получить очень высокую точность: более 98 процентов расшифровки. Европейские же интернациональные аналоги дают для схожих задач 50-60 процентов точности распознавания. “Мы работали вместе с историками и не только применили впервые компьютерное зрение, какое умеет понимать этот сложный текст, но и подгружали знания контекста, о котором писал Петр, – сообщил он. – Получилось дешифровать материалы за 26 лет. Это большой шаг вперед не только с точки зрения исторических знаний, но и с точки зрения математической мысли в России. Можно произнести, мировой рекорд”.

Скоропись Петра I прочитали с 98-процентной точностью

Впереди у специалистов по искусственному интеллекту огромная работа: нерасшифрованными остаются немало ста миллионов страниц рукописного текста. Однако это только звучит страшно, убежден Александр Ведяхин: “Тот алгоритм, который мы сделали совместно, позволит расшифровать это за короткий промежуток времени. Для примера рукописная книга в 800 страниц может быть расшифрована за 20 минут”.

Когда 100 миллионов страниц будут отсканированы, а для этой труды собираются привлечь студентов, перед айтишниками встанет задача сбора “кусков” текста по тематикам. “Такое количество страниц одному человеку невозможно прочесть даже за всю свою жизнь, поэтому искусственный интеллект должен подсказывать, как сгруппированы документы, и выделить в них главное”, – объяснил специалист и пообещал, что в России покажется специальная платформа для расшифровки русской скорописи. Она будет открытой: историки и любители смогут загружать туда документы и получать расшифровку.

Общество История Роботы: сегодняшнее и будущее

Вам также может понравиться