В гуманитарных науках развивается новое направление — Digital Humanities. Что это вообще такое?
Научный ландшафт меняется на наших глазах. Науки переплетаются друг с другом, образуя иногда очень неожиданные сочетания — например, Digital Humanities, цифровые гуманитарные науки. Направление бурно развивается: проводятся конференции, летние школы, а в Вышке недавно прошла целая неделя Digital Humanities. Что это за направление? Рассказываем.
На вопросы отвечают аспирант школы по филологическим наукам Даниил Скоринкин и доцент факультета гуманитарных наук Анастасия Бонч-Осмоловская.
Судя по названию, это какой-то гибрид «гуманитариев» с «технарями». Я прав?
Да. Но не в том смысле, что гуманитарии вдруг решили заняться физикой. Главное слово тут все равно humanities, то есть классические гуманитарные науки — филология, история, философия, культурология. Только изучать их предлагается по-новому — перестав игнорировать тот факт, что мир переходит в цифру.
Раньше у исследователей были под рукой десятки, сотни, в лучшем случае тысячи книг — сегодня речь идет о миллионах. Как изучать их, если на прочтение не хватит и тысячи лет? Раньше десятки тысяч рукописей пылились в архивах и были доступны лишь избранным — теперь они оцифровываются, снабжаются «умной» разметкой и инструментами интеллектуального поиска. Как анализировать и делать выводы из этого богатства данных? Раньше картография была уделом избранных — теперь расставить свои координаты на интерактивном глобусе может каждый. Как с помощью Google Maps узнать новое о торговле в античном мире, распространении чумы в средневековой Европе или авиаперевозках в послевоенном СССР? Все эти вопросы заставили гуманитарных исследователей освоить совершенно нехарактерные для них навыки и знания — анализ данных, data science, автоматическую обработку текста (text mining), теорию сетей, геоинформатику. Так и появились «цифровые гуманитарии».
А дать исчерпывающее определение Digital Humanities почти невозможно. На сайте whatisdigitalhumanities.com есть 817 разных вариантов — можете просто обновлять страницу в браузере и читайте один за другим:) Кстати, наше любимое определение звучит так: «DH is taking tools built by warmongers, oil companies, spy agencies & investment bankers and using them to study literature, philosophy, culture and the classics».
На самом деле формальные исследования гуманитарных объектов имеют богатую историю в XX веке — это и стиховедение, и исторические базы данных, и стилометрия. Для лингвистов же работа с корпусами текстов и статистическими данными давно стало мейнстримом. Фактически новый расцвет интереса к точными методам в гуманитарных областях связан с появлением новых возможностей — доступностью электронных текстов, развитием методов их автоматического анализа, новыми мощностями хранения и обработки, новыми инструментами работы с данными.
«Цифровые гуманитарии» создают интерактивные карты переписки французских просветителей, строят по письмам и дневникам социальные сети великих поэтов, конструируют 3D-модели Древнего Рима и автоматически превращают в изображения тексты голливудских сценариев.
Социальные сети поэтов? Это еще зачем?
Анализ сетей (и в первую очередь социальных) — развитая область науки с богатой историей и довольно сложной математикой под капотом. Представив объект исследования в виде сети, можно понять про него много нового и неочевидного, потому что сеть (в том числе и ваша личная сеть контактов в Facebook, например) — это строгая математическая абстракция, для которой придуман ворох разных формальных метрик, алгоритмов выделения сообществ, параметров значимости каждого конкретного узла и т.д. Всё это применяется в диапазоне от физики до социологии, и литературоведы тоже не остались в стороне. Хотя, конечно, в Digital Humanities есть элемент «we did it for fun», особенно когда речь идет о визуализациях сетей.
Получается, теперь каждый филолог или историк должен быть еще и программистом?
Не обязательно, хотя такие случаи встречаются всё чаще: например, доцент школы лингвистики Борис Орехов защищал диссертацию по лирике Тютчева, а теперь одновременно преподает программирование на Python и анализ текстов Шекспира. Но можно быть классическим филологом или историком и участвовать в Digital Humanities.
Как и всякая междисциплинарная область исследований, цифровые гуманитарные науки располагают к командной и проектной работе. Здесь мало исследователей-одиночек, зато много небольших research groups и research projects с разделением труда. Например, в составе Центра цифровых гуманитарных исследований НИУ ВШЭ есть и компьютерщики, и лингвисты, специалисты по text mining, и филологи, и историки с философами. То же можно сказать и о научно-учебной группе «Цифровые исследования литературы».
А какие-нибудь открытия в этой области уже были?
Их довольно много. Например, именно цифровые гуманитарии с помощью статистики раскрыли Джоан Роулинг, когда та выпустила книжку под мужским псевдонимом. Оказалось, что атрибуция (определение авторства) художественного текста на основе частотностей слов работает удивительно хорошо. Писатель может подписаться чужим именем, но изменить свой стиль так, чтобы обмануть компьютер, оказывается не так-то просто.
А исследуя социальные сети персонажей, удалось установить, что плотность сети в комедии, например, устойчиво выше, чем в трагедии. И это хорошо согласуется с догадками литературоведов о том, что комическое больше нуждается в речевом выражении, чем трагическое (убивать, страдать и умирать можно и молча; а вот смеяться и высмеивать — едва ли).
Как становятся «цифровыми гуманитариями»?
Очень разными путями, и об этом как раз говорил наш коллега Франк Фишер в недавнем интервью. Среди «цифровых гуманитариев» можно встретить кого угодно: программистов и филологов, лингвистов и философов, математиков и историков, педагогов и журналистов. Главное, что все в какой-то момент осознали потенциал компьютерных методов в гуманитарных областях. Сам Франк просто не мог выбрать между computer science и литературой, в итоге изучал в университете и то, и другое. И только потом узнал, что он, оказывается, «цифровой гуманитарий».
Я терпеть не могу математику и программирование. Что мне делать?
Знание математики всегда полезно, но серьезная математика в Digital Humanities нужна далеко не везде. А что касается программирования — конечно, некоторый навык иметь желательно, но прелесть жизни в XXI веке заключается в том, что очень многое уже сделано за нас и остается только нажимать кнопочки. Например, для определения авторства и стилеметрии создан прекрасный инструмент под названием Stylo. Это программный пакет для языка R, но благодаря графическому интерфейсу его могут использовать и непрограммисты. Ну и не стоит забывать о возможностях стандартных всем известных инструментов анализа и обработки данных. До появления Stylo те же самые методы определения авторства успешно применяли в Excel.
Хорошо, а в Вышке этому учат?
Да. Курс по Digital Humanities читается на магистерской программе «Компьютерная лингвистика» с самого начала. С этого года идет майнор «Современные методы в гуманитарных науках» для студентов факультета гуманитарных наук. А группа студентов (из разных школ и факультетов, в том числе и с матфака) работает в научно-учебной группе «Цифровые исследования литературы».
Бонч-Осмоловская Анастасия Александровна
Доцент Школы лингвистики
Орехов Борис Валерьевич
Доцент Школы лингвистики
Скоринкин Даниил Андреевич
Преподаватель Школы лингвистики
Фишер Франк
Доцент Школы лингвистики
Вам также может быть интересно:
В Музее Набокова открылась выставка картин, созданных нейросетью в соавторстве с учеными ВШЭ
В Музее Владимира Набокова в Санкт-Петербурге открылась выставка Nabokov Clip Art. В экспозиции представлены визуализированные с помощью нейросети CLIP от OpenAI цитаты из произведений писателя. Авторами концепции выступили доцент школы лингвистики московской Вышки, исследователь Центра цифровых гуманитарных исследований НИУ ВШЭ Борис Орехов и лингвист, эксперт по творчеству Набокова Любовь Каракуц-Бородина.
Новая магистерская программа ВШЭ даст гуманитариям цифровые инструменты
В этом году в НИУ ВШЭ пройдет первый набор на магистерскую программу «Цифровые методы в гуманитарных науках». Руководитель программы Даниил Скоринкин рассказывает, как цифровые методы расширяют возможности исследователей, чему будут учить студентов и почему на программе ждут как гуманитариев, так и технарей.
«Именно эти люди будут формировать повестку гуманитарной науки»
В музее-усадьбе Л.Н. Толстого в Ясной Поляне прошла первая московско-тартуская школа по цифровым гуманитарным наукам. Целью школы было создание общей междисциплинарной научной среды для исследования текстов с помощью современных компьютерных методов. Организаторы школы — Школа лингвистики НИУ ВШЭ, музей-усадьба Л.Н.Толстого «Ясная поляна» и лаборатория «СПЖК» при кафедре русской литературы Тартуского университета.