Вестник Digital Humanities, выпуск 12: скелеты в цифровом шкафу

Привет, с вами снова «Вестник DH». Недавно мы съездили в Утрехт на главное ежегодное событие в мире Digital Humanities — конференцию ADHO. В этом выпуске мы собрали для вас самые яркие моменты конференции.

На конференции DH 2019

Рассказ о DH-2019 для Вестника подготовила международная команда из Стэнфорда, Принстона, колледжа Хаверфорд, Центрально-Европейского университета, Высшей школы экономики (НИУ ВШЭ) и Пермского государственного университета.

Тизер: это Dr. Cheese Bones — постер -победитель  с постерной секции на DH 2019 (правда, здесь она не в своем победном облачении)

Перед конференцией: воркшоп по spaСy

Как обычно, перед началом конференции проводились практические воркшопы. Они были посвящены освоению компьютерных инструментов, работе со сложными, неоднозначными гуманитарными данными в цифровой среде, а также управлению DH-проектами ( вот тут  есть полный список воркшопов DH 2019). Мы расскажем подробнее о воркшопе по работе с библиотекой spaCy, который провели Сет Бернстейн (Seth Bernstein) из НИУ ВШЭ, Дэвид Ласснер (David Lassner) из Технического университета Берлина Эндрю Янко (Andrew Janco) из Колледжа Хаверфорд.

Семинар начался со вступительной сессии, в которой Сет Бернстейн рассказал о возможностях инструмента. SpaCy — это библиотека для автоматической обработки языка (NLP) с открытым исходным кодом. Как и другие NLP-библиотеки (например, NLTK или Stanford NLP), SpaCy умеет делить тексты на слова, определять части речи, находить синтаксические связи, выделять в тексте упоминания людей, названия мест и организации. Ценное отличие spaCy — возможность легко дообучить модели на своих данных (например, чтобы программа сама научилась понимать архаичные топонимы вроде Себерского царства или Лифляндии) и сравнительно простая интеграция с современными системами глубинного обучения типа TensorFlow/Keras/PyTorch.

Подробный отчет о воркшопе от Эндрю Янко доступен тут . Специально для «Вестника DH» Эндрю перевел свой отчет на русский язык и дополнил его ссылкой на модель spaCy для русского языка (спасибо, Эндрю!) — перевод можно почитать тут .

На конференции: 1000 участников, 260 докладов, 123 постера, один скелет

На саму конференцию в этом году съехалось свыше 1000 участников — абсолютный рекорд. Доклады (всего около 260) шли параллельно в 8 секциях в течение четырех дней. Еще 123 исследования были представлены в виде постеров.

Немного статистики от организаторов DH 2019. Всего на конференцию было отобрано 450 ‘contributions’ — то есть докладов, постеров и воркшопов вместе взятых

Естественно, что дать исчерпывающий обзор всей этой массы исследований невозможно. Поэтому мы ограничимся субъективной выборкой составителей «Вестника».

Русские заголовки — наши, они отражают суть исследования.

Эволюция поэзии и тематическое моделирование

Diachronic Topics in New High German Poetry  
Thomas Nikolaus Haider, Max Planck Institute for Empirical Aesthetics, Frankfurt, Germany

Очередной пример «distant reading» художественной литературы: на корпусе из 51 тыс. немецких стихотворений исследователь с помощью метода тематического моделирования (LDA) выделил 100 топиков (квази-тем). Затем он разбил весь корпус по периодам по 25 лет и с помощью машинного обучения проверил, можно ли классифицировать по топикам как признакам периоды и авторов. Оказалось, что для периодов это работает лучше, чем для авторов, а ещё лучше работает, если строить модели не на стихотворениях целиком, а на строфах.

История с географией: кейс французской Энциклопедии

Spatial History between Maps and Texts: Lessons from the Eighteenth Century
Katie McDonough, Ludovic Moncla, Matje van de Camp

Проект, совмещающий в себе геокодирование и текстовый анализ. Отталкиваясь от текста знаменитой французской Энциклопедии Д’Аламбера и Дидро, исследователи создали анализатор географических наименований, главная цель которого — не жесткая привязка к карте, а сохранение связи с текстом и сохранение возможности неоднозначных толкований, допустимость множественных систем топонимики. В докладе много говорилось о трудностях, связанных с изменившимися представлениями о мире, изменениями границ, ситуациях, когда есть много географических названий библейского и мифологического характера и вообще о том, как справиться с неоднозначностью (uncertainty) и сложностью (complexity) исторических и культурных данных.

Разметка топонимов в Энциклопедии Д’Аламбера и Дидро

Цифровое издание в стиле канбан

Continuous Integration Systems for Critical Edition: The Chronicle of Matthew of Edessa
Tara Lee Andrews, Anahit Safaryan, Tatevik Atayan

Доклад о цифровом издании многочисленных версий одного и того же средневекового текста — «Хронографии» Матфея Эдесского. Авторы исследования потратили много сил на то, чтобы реализовать в своем пайплайне для сборки цифрового издания возможность постоянного обновления и дополнения (continuous integration).

Тара Ли Эндрюс рассказывает о цифровом издании Матфея Эдесского

Как проехать в Мекку: электронная картография исламского мира

Al-Ṯurayyā, the Gazetteer and the Geospatial Model of the Early Islamic World
Masoumeh Seydi, Maxim Romanov

Al-Ṯurayyā  — большой проект по картографированию средневековых мусульманских цивилизаций. 2000 локаций: от Кордовы до Самарканда, от Мекки до Булгара. А также исторические пути между всеми ними и возможность рассчитать маршрут.

Средневековый путь из Багдада в Мекку (38 дней пути)

Дополненный цифровой гуманитарий

Панель про дополненную реальность и доклад «XR in DH: Extended Reality in the Digital Humanities»  на ней


 

Обсуждение инструментов дополненной реальности на DH 2019 было интересным, но спорным. С одной стороны, участники панели убедительно говорили об использовании VR/XR/AR в сохранении и визуализации нематериального культурного наследия (на примере аборигенов Австралии) и обучении.

VR для погружения в культуру аборигенов Австралии

С другой стороны, польза от дополненной реальности в изучении книг и манускриптов по-прежнему вызывает сомнения (как минимум у части редакции «Вестника»). Представленные на конференции работы, такие как эта ,  убедили не всех.

Хорошие художники  архитекторы воруют!

Simulating Historical Flows And Connection. The Artistic Transfer During The 15th To 16th Century In The Iberian Peninsula
Patricia Ferreira-Lopes

В этом исследовании цифровые методы помогают изучить работу архитекторов (и строителей разных специальностей) над сооружениями XV-XVI вв. Взаимные влияния мастеров изучаются по отдельным фрагментам зданий. У исследования очень интересный источник — точная как бухгалтерская книга база данных того, какой мастер сколько за какую работу получил и что конкретно построил. Данные есть по отдельным фрагментам каждой постройки.

Галочка, ты сейчас умрешь : постер-скелет на DH 2019

Gender and Intersectional Identities in the Digital Humanities
Rachel Hendery, Katie McDonough, Quinn Dombrowski, Tassie Gniady

Этот постер в виде скелета вы уже видели выше. С большим отрывом он (точнее, она) выиграла голосование в конкурсе постеров в номинации «Out of the box», т.е. самый нешаблонный, нестандартный постер. Но тема у постера вполне серьезная — гендерная идентичность и гендерное неравенство. Вот что рассказывает соавтор постера, Куинн Домбровски из Стэнфорда:

«Ее зовут Чиз Бонз (т.е. Cheese Bones, сыр и кости; мой сын придумал такое имя, когда ему было 2 года.) Я привезла Чиз с собой в чемодане из Калифорнии, а потом мы вместе шли по Утрехту на конференцию. Чиз представляла группу
DH-WoGeM  (женщины и гендерные меньшинства в цифровых гуманитарных науках) в конкурсе постеров и выиграла приз. Многие на конференции хотели сфотографироваться с Чиз, а один из участников даже посвятил ей стихотворение  в стиле поэзии эпохи Тан. Возможно, Чиз приедет на будущие конференции, чтобы больше людей узнало о гендерных проблемах в цифровых гуманитарных науках».

Dr Cheese Bones и другие участники DH 2019 (Вестник DH благодарит Куинн Домбровски за прекрасные фотографии)

Искусство выживания в сложном мире DH

«Complexities of/and Sustainability»
Johanna Drucker

З аключительная пленарная лекция Джоанны Друкер «Сложность выживания/Сложность и живучесть» — мы склонны именно так переводить оригинальное «Complexities of/and Sustainability». Центральной темой лекции была проблема живучести цифровых проектов в условиях, когда мир — и гуманитарные науки — становятся все более сложно организованными.  

Джоанна Друкер — профессор UCLA, автор учебника, который мы вам рекламировали в пятом выпуске вестника , одна из ключевых фигур в Digital Humanities.

В первой части лекции Джоанна Друкер говорила о сложностях выживания на примере своих собственных проектов. «Зависимость от обновлений» («Upgrade addiction») приводит к тому, что DH-проекты, сделанные всего несколько лет назад, перестают работать — они опирались на системы, которые были обновлены. Еще бывает так, что ваш университет отказался от подписки на какой-то ресурс. Или открытая цифровая библиотека, на которую вы опирались, вдруг исчезла — ее сервер недоступен. Или даже внезапно та концепция или методологическая рамка, которую вы использовали, выходит из научной моды!

В некоторых случаях проекты заслуживают того, чтобы потратить силы и иные ресурсы на их восстановление: переход на новую систему, идейное переосмысление. Но так бывает не всегда. В этом смысле «живучесть проекта» — это не только о том, как построить изначально живучий проект, но и о целесообразности: сколько мы готовы потратить на поддержку живучести проекта в каждом конкретном случае.

Вторая тема лекции Друкер — конфликт между сложностью идей и теми ограничениями, которые накладывает формальное машиночитаемое представление данных. Гуманитарии подвергают критическому анализу те концепции и нарративы, которые обычно воспринимаются как должное, некритически. Задача гуманитариев — интерпретировать неоднозначные источники, которые допускают противоречивые интерпретации. В то же время компьютерный анализ нуждается в устранении неоднозначностей. И чем сложнее цифровой проект — то есть чем больше переменных и точек зрения он в себя включает — тем сложнее его поддерживать. Но по мнению Друкер, дело не в том, что у Digital Humanities проблемы  с целеполаганием, а в том, что Digital Humanities  нуждаются в постоянном переосмыслении и развитии через критический анализ цифровых проектов.  

Наша выборка с DH 2019 неполна, но она отражает некоторые важные доминанты современных Digital Humanities:

За всем остальным отсылаем вас к программе конференции и перечню абстрактов.

«It’s about Russia»: исследователи из России и исследователи России на DH 2019

В последние годы присутствие России на главном мировом DH форуме стало заметным. В этом году среди участников конференции были Инна Кижнер (СФУ, член правления ассоциации DH Russia), Анастасия Бонч-Осмоловская (НИУ ВШЭ в Москве, член правления ассоциации DH Russia), Антонина Пучковская (ИТМО), Надежда Поврозник (ПГНИУ, Пермь), Кирилл Маслинский (НИУ ВШЭ в Санкт-Петербурге), Франк Фишер, Борис Орехов, Даниил Скоринкин (все — НИУ ВШЭ в Москве). Также один из воркшопов проводился при участии Екатерины Лапиной-Кратасюк (НИУ ВШЭ в Москве). Простите, если мы еще кого-то забыли:) Но если так, это тоже показатель — еще пару лет назад для пересчета хватало пальцев одной руки.

Доклад Инны Кижнер на DH 2019

Одновременно интерес к Digital Humanities становится все заметнее среди зарубежных славистов. В этом году две группы — исследователи из России и слависты из западных университетов — впервые организовали несколько встреч, чтобы обсудить сотрудничество.  

Одна встреча имела формальный статус — это была панельная дискуссия «Methodology as Community: Fostering Collaboration Beyond Scholarly Societies». На ней обсуждалось, как цифровые методы создают почву для международного сотрудничества исследователей. Участники панели — ученые и сотрудники библиотек — представили собственные проекты, а затем обсудили проблемы изучения русского языка, истории и культуры.

Панельная дискуссия «Methodology as Community: Fostering Collaboration Beyond Scholarly Societies» на DH 2019

Участники панельной дискуссии представляли университеты России и США. Несмотря на существование ассоциации ASEEES, cегодня в США славистов немного, а тех, кто применяет цифровые методы, среди них совсем мало. Практически нет профессоров, способных оценить работу в области Digital Humanities на материале русского или других славянских языков. Поэтому американским славистам важно установить больше связей с коллегами в России, создать сообщество ученых, способных дать квалифицированный отзыв о работе друг друга.

Кэтрин Рэшл (Katherine Hill Reischl) представляет рабочую группу «Slavic DH» Принстонского университета

Также на конференции было несколько неформальных встреч между русскими и американскими исследователями. На них обсуждалось:

Неформальная встреча русских цифровых гуманитариев и западных «цифровых славистов/русистов» на DH 2019

Итогом встречи стал список задач. Главная из них — создание совместной площадки, «хаба» для всех исследователей в области «русских DH». Когда такой хаб появится появится — или когда в него начнет трансформироваться какая-то существующая площадка — мы вас обязательно оповестим! Stay tuned & love DH :)

P.S. За пределами  DH 2019

Напоследок отметим еще два июльских события из мира Digital Humanities.

Во-первых, свой день рождения  отметил « Системный Блокъ » — первое русское массовое издание с фокусом на цифровых исследованиях в гуманитарной и социальной сфере. Запустившись в июле 2018-го, «Системный Блокъ» на сегодня имеет 55,8 тыс. читателей в Вк, 2,7 тыс. в Телеграме и 4,4 тыс. в Facebook. Редакция подготовила более 230 статей и переводов, 4 интервью и несколько обучающих тьюториалов. Команда издания выросла с 2 до более 50 человек, и к ней все еще можно присоединиться .

Во-вторых, открылась запись на участие в IV Московско-тартуской школе по цифровым гуманитарным исследованиям . До 4 августа еще можно запрыгнуть на подножку и подать заявку . Не упустите шанс затусить в октябре с толпой других DH-нутых людей в прекрасном Воронове.

Ваш,
Центр цифровых гуманитарных исследований НИУ ВШЭ

Подписаться на «Вестник Digital Humanities» по-прежнему можно на сайте  «Вестника»!