Что не входит в задачи ассоциаций по digital humanities

В гуманитарных науках формируется новое направление исследований

10:00, 7 августа 2019

Анна Плотникова рассказала о цифровой гуманитаристике

Что не входит в задачи ассоциаций по digital humanities. Смотреть фото Что не входит в задачи ассоциаций по digital humanities. Смотреть картинку Что не входит в задачи ассоциаций по digital humanities. Картинка про Что не входит в задачи ассоциаций по digital humanities. Фото Что не входит в задачи ассоциаций по digital humanities

Цифровая гуманитаристика (Digital Humanities) – это новая динамично развивающаяся междисциплинарная отрасль на стыке гуманитарных и компьютерных наук. О том, что это такое и где этому учат, мы поговорили с директором департамента «Филологический факультет» Анной Плотниковой.

Чем именно занимается «цифровая гуманитаристика»?

В последние десятилетия в гуманитарных науках появилось множество прикладных задач, для реализации которых необходимы те или иные компетенции в области точных и компьютерных наук. Можно сказать, что развитие компьютерных технологий за последние два десятилетия сильно изменило научное пространство. Стали появляться исследовательские ресурсы, которые раньше просто технически не могли быть реализованы: это лингвистические корпусы и конкордансы, исторические и текстовые базы данных, электронные библиотеки, предлагающие доступ к редким или уникальным изданиям и памятникам, снабженные разметкой и поисковыми возможностями, геоинформационные системы, позволяющие визуализировать географическое распределение тех или иных данных и многое другое. Создание подобных ресурсов, которыми каждый день пользуются тысячи гуманитариев, является одной из задач Digital Humanities.

Компьютер позволяет хранить и обрабатывать огромные массивы данных, сортировать эти данные по различным параметрам и алгоритмам, наглядно представлять результаты такого анализа. Без использования компьютерных аналитических инструментов были бы невозможны тысячи интереснейших научных проектов – от визуализации социальных сетей писателей через анализ их писем и установления авторства текстов до картографирования торговых путей в античности и создания виртуальных музеев. В некоторых отраслях гуманитарного знания подобные проекты производят настоящую революцию. Например, прямо на наших глазах такая радикальная трансформация происходит в литературоведении, где не просто проявляются новые задачи и приемы анализа, но меняется сам характер взаимодействия исследователя с изучаемым им текстом.

Что должны уметь «цифровые гуманитарии»?

Прежде всего, это междисциплинарная сфера, поэтому базовое образование может быть разным. В среде специалистов в области Digital Humanities есть философы, литературоведы, социологи, историки, педагоги, журналисты, психологи. Пожалуй, нет такой отрасли гуманитаристики, куда бы не проникли компьютерные технологии. На втором этапе к этим базовым знаниям добавляются компетенции в области компьютерных наук. Конечно, такой специалист должен иметь навыки программирования, веб-дизайна, создания баз данных. В некоторых случаях полезными являются знания в области статистики, теории вероятностей. В то же время надо сказать, что глубокие знания в сфере IT нужны далеко не всегда. Сегодня существует множество готовых программных продуктов, которые позволяют реализовывать собственные аналитические задачи и при этом не погружаться слишком глубоко в математические основы работы подобных инструментов. Очевидно, что со временем таких вспомогательных программ будет становиться все больше.

Могут ли эти знания пригодиться за пределами академической науки?

Название «цифровая гуманитаристика» или «цифровые гуманитарные науки» апеллирует прежде всего к решению научных задач, но реально сфера приложения навыков в области Digital Humanities значительно шире. По сути, «цифровой гуманитарий» – это человек, который умеет формализовывать различные виды данных и анализировать их по тем или иным параметрам с помощью различных компьютерных программ. На самом деле, нет принципиальной разницы между работой исследователя, строящего базу данных, чтобы изучать эволюцию рынка готового платья в Париже конца XIX века, и работой маркетолога, отслеживающего динамику спроса на электрические самокаты в сегодняшнем Екатеринбурге. В этих двух случаях будут разными источники данных и полнота сведений, но принципы работы – одни и те же. Специалист в области Digital Humanities – это не столько ученый, сколько аналитик, владеющий определенным набором компьютерных инструментов, в то же время анализируемые данные могут быть самими разными.

Источник

В гуманитарных науках развивается новое направление — Digital Humanities. Что это вообще такое?

Что не входит в задачи ассоциаций по digital humanities. Смотреть фото Что не входит в задачи ассоциаций по digital humanities. Смотреть картинку Что не входит в задачи ассоциаций по digital humanities. Картинка про Что не входит в задачи ассоциаций по digital humanities. Фото Что не входит в задачи ассоциаций по digital humanities

Научный ландшафт меняется на наших глазах. Науки переплетаются друг с другом, образуя иногда очень неожиданные сочетания — например, Digital Humanities, цифровые гуманитарные науки. Направление бурно развивается: проводятся конференции, летние школы, а в Вышке недавно прошла целая неделя Digital Humanities. Что это за направление? Рассказываем.

Судя по названию, это какой-то гибрид «гуманитариев» с «технарями». Я прав?

Да. Но не в том смысле, что гуманитарии вдруг решили заняться физикой. Главное слово тут все равно humanities, то есть классические гуманитарные науки — филология, история, философия, культурология. Только изучать их предлагается по-новому — перестав игнорировать тот факт, что мир переходит в цифру.

Раньше у исследователей были под рукой десятки, сотни, в лучшем случае тысячи книг — сегодня речь идет о миллионах. Как изучать их, если на прочтение не хватит и тысячи лет? Раньше десятки тысяч рукописей пылились в архивах и были доступны лишь избранным — теперь они оцифровываются, снабжаются «умной» разметкой и инструментами интеллектуального поиска. Как анализировать и делать выводы из этого богатства данных? Раньше картография была уделом избранных — теперь расставить свои координаты на интерактивном глобусе может каждый. Как с помощью Google Maps узнать новое о торговле в античном мире, распространении чумы в средневековой Европе или авиаперевозках в послевоенном СССР? Все эти вопросы заставили гуманитарных исследователей освоить совершенно нехарактерные для них навыки и знания — анализ данных, data science, автоматическую обработку текста (text mining), теорию сетей, геоинформатику. Так и появились «цифровые гуманитарии».

А дать исчерпывающее определение Digital Humanities почти невозможно. На сайте whatisdigitalhumanities.com есть 817 разных вариантов — можете просто обновлять страницу в браузере и читайте один за другим:) Кстати, наше любимое определение звучит так: «DH is taking tools built by warmongers, oil companies, spy agencies & investment bankers and using them to study literature, philosophy, culture and the classics».

На самом деле формальные исследования гуманитарных объектов имеют богатую историю в XX веке — это и стиховедение, и исторические базы данных, и стилометрия. Для лингвистов же работа с корпусами текстов и статистическими данными давно стало мейнстримом. Фактически новый расцвет интереса к точными методам в гуманитарных областях связан с появлением новых возможностей — доступностью электронных текстов, развитием методов их автоматического анализа, новыми мощностями хранения и обработки, новыми инструментами работы с данными.

«Цифровые гуманитарии» создают интерактивные карты переписки французских просветителей, строят по письмам и дневникам социальные сети великих поэтов, конструируют 3D-модели Древнего Рима и автоматически превращают в изображения тексты голливудских сценариев.

Социальные сети поэтов? Это еще зачем?

Анализ сетей (и в первую очередь социальных) — развитая область науки с богатой историей и довольно сложной математикой под капотом. Представив объект исследования в виде сети, можно понять про него много нового и неочевидного, потому что сеть (в том числе и ваша личная сеть контактов в Facebook, например) — это строгая математическая абстракция, для которой придуман ворох разных формальных метрик, алгоритмов выделения сообществ, параметров значимости каждого конкретного узла и т.д. Всё это применяется в диапазоне от физики до социологии, и литературоведы тоже не остались в стороне. Хотя, конечно, в Digital Humanities есть элемент «we did it for fun», особенно когда речь идет о визуализациях сетей.

Получается, теперь каждый филолог или историк должен быть еще и программистом?

Не обязательно, хотя такие случаи встречаются всё чаще: например, доцент школы лингвистики Борис Орехов защищал диссертацию по лирике Тютчева, а теперь одновременно преподает программирование на Python и анализ текстов Шекспира. Но можно быть классическим филологом или историком и участвовать в Digital Humanities.

Как и всякая междисциплинарная область исследований, цифровые гуманитарные науки располагают к командной и проектной работе. Здесь мало исследователей-одиночек, зато много небольших research groups и research projects с разделением труда. Например, в составе Центра цифровых гуманитарных исследований НИУ ВШЭ есть и компьютерщики, и лингвисты, специалисты по text mining, и филологи, и историки с философами. То же можно сказать и о научно-учебной группе «Цифровые исследования литературы».

А какие-нибудь открытия в этой области уже были?

Их довольно много. Например, именно цифровые гуманитарии с помощью статистики раскрыли Джоан Роулинг, когда та выпустила книжку под мужским псевдонимом. Оказалось, что атрибуция (определение авторства) художественного текста на основе частотностей слов работает удивительно хорошо. Писатель может подписаться чужим именем, но изменить свой стиль так, чтобы обмануть компьютер, оказывается не так-то просто.

А исследуя социальные сети персонажей, удалось установить, что плотность сети в комедии, например, устойчиво выше, чем в трагедии. И это хорошо согласуется с догадками литературоведов о том, что комическое больше нуждается в речевом выражении, чем трагическое (убивать, страдать и умирать можно и молча; а вот смеяться и высмеивать — едва ли).

Как становятся «цифровыми гуманитариями»?

Очень разными путями, и об этом как раз говорил наш коллега Франк Фишер в недавнем интервью. Среди «цифровых гуманитариев» можно встретить кого угодно: программистов и филологов, лингвистов и философов, математиков и историков, педагогов и журналистов. Главное, что все в какой-то момент осознали потенциал компьютерных методов в гуманитарных областях. Сам Франк просто не мог выбрать между computer science и литературой, в итоге изучал в университете и то, и другое. И только потом узнал, что он, оказывается, «цифровой гуманитарий».

Я терпеть не могу математику и программирование. Что мне делать?

Знание математики всегда полезно, но серьезная математика в Digital Humanities нужна далеко не везде. А что касается программирования — конечно, некоторый навык иметь желательно, но прелесть жизни в XXI веке заключается в том, что очень многое уже сделано за нас и остается только нажимать кнопочки. Например, для определения авторства и стилеметрии создан прекрасный инструмент под названием Stylo. Это программный пакет для языка R, но благодаря графическому интерфейсу его могут использовать и непрограммисты. Ну и не стоит забывать о возможностях стандартных всем известных инструментов анализа и обработки данных. До появления Stylo те же самые методы определения авторства успешно применяли в Excel.

Хорошо, а в Вышке этому учат?

Да. Курс по Digital Humanities читается на магистерской программе «Компьютерная лингвистика» с самого начала. С этого года идет майнор «Современные методы в гуманитарных науках» для студентов факультета гуманитарных наук. А группа студентов (из разных школ и факультетов, в том числе и с матфака) работает в научно-учебной группе «Цифровые исследования литературы».

Источник

Обсуждаем Digital Humanities — направление для исследований на стыке компьютерных и гуманитарных наук

Антонина Пучковская, кандидат культурологии и директор международного центра цифровых гуманитарных исследований, рассказывает о развитии нового направления — digital humanities — в Университете ИТМО и тематической магистратуре.

Что не входит в задачи ассоциаций по digital humanities. Смотреть фото Что не входит в задачи ассоциаций по digital humanities. Смотреть картинку Что не входит в задачи ассоциаций по digital humanities. Картинка про Что не входит в задачи ассоциаций по digital humanities. Фото Что не входит в задачи ассоциаций по digital humanitiesФотография: Masaru Suzuki. Источник: Unsplash.com

@dmitrykabanov: В первую очередь хотел бы отметить ваш сегмент в ролике «Девочка, смелее!» на YouTube-канале Университета ИТМО. В его записи приняла участие и Екатерина Скорб, с которой мы ранее общались и готовили интервью.

А вы в этом видео рассказали, что в какой-то момент решили перестать быть исключительно гуманитарием и погрузились в сферу digital humanities. Расскажите, пожалуйста, чем вас привлекла эта тема, и как вы к ней подступились?

Антонина: Спасибо за вопрос. Думаю, что у многих «цифровых гуманитариев» есть похожая история, которую можно было бы рассказать. В моем случае все выглядит достаточно просто. Через некоторое время после того, как я начала работать в Университете ИТМО — еще в качестве преподавателя английского, а потом и культуролога и кандидата в этой области — я задумалась о том, как могла бы применять свой опыт в более интересном ключе. Для этого решила посмотреть, что есть на стыке технологий и гуманитарного знания, культурной памяти и презентации культурного наследия, а по мере изучения темы — дошла до профильного мероприятия — недели цифровых гуманитарных исследований в Нью-Йорке.

Это — открытый эвент без жестких ограничений для участников с семинарами и воркшопами по той или иной тематике из области digital humanities. После проработки того, как я могла бы применить там свое культурологическое образование, я подала заявку на участие. К счастью, ее приняли, а еще меня поддержал Университет ИТМО и командировка в Нью-Йорк действительно состоялась. Там я познакомилась с представителями экспертного сообщества в этой сфере — например, профессором Кимоном Керамидасом, одним из организаторов. Кстати, сейчас он преподает и у нас на программе для магистров и участвует в нашем формате DH Week в ИТМО.

Стоит сказать, что само направление, конечно, относительно новое.

Дмитрий: Что-то вроде computer science, но для гуманитариев?

Антонина: Ранее его назвали humanities computing, а сейчас иногда используют minimal computing, но digital humanities — наиболее частое и актуальное наименование для этого направления. Его принадлежность к гуманитариям понятна, однако сейчас мы видим, что и ребята с техническим бэкграундом интересуются данной темой. Они стремятся использовать свои знания и опыт для работы в командах, которые готовят комплексные решения на базе культурных институций. Так они могут поучаствовать в реализации того или иного проекта с возможностью влиять на общую цель и способы ее достижения, а не замыкаться на узкоспециализированных задачах, которые сегодня готов предложить среднестатистический работодатель.

У нас нужно «переизобретать» задачи. Это — итеративный процесс, поэтому он достаточно понятен и интересен тем, кто обладает ИТ-бэкграундом.

Дмитрий: Чтобы наши читатели и слушатели могли лучше себе представить, как выглядят такие проекты, могли бы вы, пожалуйста, рассказать о паре примеров? По большей части над ними работают в команде или бывает и личный формат?

Антонина: История с запуском digital humanities и институциализацией этого направления у нас началась с проекта St. Retrospect. Как раз после участия в нью-йоркской тематическом мероприятиия подготовила заявку на конкурсный отбор интердисциплинарных научных проектов в ИТМО. Победить здесь получилось как раз с идеей нестандартной визуализации городских локаций. Она подразумевала вывод так называемой истории ассоциаций того или иного места с известными личностями, которые могли останавливаться, жить или отдыхать там. Ретроспективный подход позволил сформировать такую историю на определенном временном отрезке — собрать данные о локациях, персонах и их связях между собой, а далее — визуализировать все это на карте. Сейчас этот проект мы задействуем для проведения практических занятий со студентами первого курса магистратуры. Они работают с ним в зависимости от собственных интересов с точки зрения известных личностей и определенной эпохи: занимаются подготовкой данных, строят тематические маршруты и применяют навыки цифрового сторителлинга.

В таких возможностях заинтересованы музеи, библиотеки и другие институции. Они готовы сотрудничать и делиться контентом, а наши ребята — обрабатывать его, продумывать пользовательские сценарии и доводить до состояния готового цифрового продукта. Так, наши ученики выпустили приложение Que.st с игровыми экскурсиями — можно гулять по Петербургу и интересоваться окружением.

Дмитрий: Как вы можете описать ход развития этого направления? Расскажите, пожалуйста, как вам удалось добиться доверия со стороны институций?

Антонина: Вместе с коллегами, которые изначально подключились к нашему первому проекту, мы успешно защитили его на каждом из этапов конкурсного отбора, а после этого Козлова Дарья Константиновна, первый проректор, предложила мне стать руководителем образовательной программы для будущих магистров. Она называется интеллектуальные системы в гуманитарной среде. В ходе запуска магистратуры еще в 2019-м мы начали сотрудничать с представителями культурных институций, а позже они вошли в состав комиссии и участвовали в оценке работ наших учеников.

Далее мы попробовали себя в истории с грантами, потом у нас появились различные внешние заказчики. Сегодня мы занимаемся и исследованиями, и адаптацией готовых решений и алгоритмов для прикладных задач. Например, для работы с материалами на русском, выпущенными до реформы орфографии 1917 года.

Еще сейчас мы переходим от «проектной» к «продуктовой» магистратуре и считаем, что нужно демонстрировать результат работы в понятном виде — как для широкой общественности, так и для сообществ специалистов в области культуры. Последние в наибольшей степени заинтересованы в таком подходе. Для них он означает привлечение дополнительного внимания и выход на новую аудиторию за счет интересных цифровых продуктов. Поэтому культурные институции готовы сотрудничать с нами. А другие структуры видят пул наших работ, и чем больше их становится, тем большее число людей о нас узнает и быстрее идет развитие.

Чем эффективнее мы применяем методы нарративного дизайна и цифрового сторителлинга, тем лучше нам удается «реанимировать» накопленный нашими коллегами контент и преподносить его аудитории в том виде, который она ожидает увидеть и находит удобным здесь и сейчас.

Дмитрий: Как вы видите эволюцию наполнения технологического и методологического стека образовательной программы? Используете ли вы зарубежный опыт или опираетесь на локальные особенности?

Антонина: Когда мы начинали работу над визуализацией культурной памяти Петербурга, конечно же, сразу понимали, что база примечательных локаций никогда не будет завершенной. Перед нами огромный корпус краеведческих данных, который требует обработки и подготовки, поэтому это — продолжающийся проект. Его тему мы определяли сами и делали это достаточно свободно, потому что тогда у нас не было такого количества партнеров, да и магистратуру только запускали.

Сегодня наши студенты могут предложить свои темы выпускных работ. Так поступили многие из первого потока — например, одна из наших учениц занималась эстонскими писателями, попавшими в ГУЛАГ, прошедшими его и продолжившими свое дело. Она проанализировала изменения в стиле их письма под воздействием столь травмирующего опыта, однако осуществила это без инструментов для автоматизированного анализа текста, плюс — сделала упор на визуализацию. С помощью такого продукта можно посмотреть цитаты, пояснения, сравнения и отследить изменения.

Еще один пример — анализ истории памятников конфедератов. Решения, использованные в этом проекте, мы предложили перенести на памятники, расположенные в Петербурге, — сделать side-проект по мотивам St. Retrospect, о котором мы говорили выше. Это получилось осуществить, поработать над визуализицией с помощью Tableau и запустить сайт.

У нас индивидуальней подход к каждой теме. Так, на определенной итерации мы можем понять, что нашей экспертизы мало, и привлекаем сторонних экспертов из ИТМО с опытом в computer science, машинного обучения или из культурных институций. От этого во многом и зависит наполнение и фокус для определенного студента. Однако не все могут предложить что-то свое, самостоятельно выбрать тему и мотивировать себя на ее проработку. Поэтому сейчас мы делаем чуть больший упор на предварительную подготовку тем вместе с культурными институциями. Они предлагают направления, задачи, предоставляют дата-сеты и стараются помочь нашим студентам довести ту или иную тему до успешного завершения. Один из таких проектов направлен на аудиторию Музея истории религии. По задумке автора он поможет отслеживать «эмоциональный след» по мере продвижения по экспозиции. И — помимо личных оценок — позволит познакомиться с тем, как тот или иной объект интерпретировали ранее — в исследованиях и иных культурных контекстах. Сейчас мы думаем над тем, как представить все это в удобном интерфейсе.

Что не входит в задачи ассоциаций по digital humanities. Смотреть фото Что не входит в задачи ассоциаций по digital humanities. Смотреть картинку Что не входит в задачи ассоциаций по digital humanities. Картинка про Что не входит в задачи ассоциаций по digital humanities. Фото Что не входит в задачи ассоциаций по digital humanitiesАнтонина Пучковская, кандидат культурологии и директор DH-центра в ИТМО

Еще у нас развивается направление нарративного дизайна, где мы задействуем Twine и другие похожие решения. Такие инструменты, конечно же, мы осваиваем по мере того, как у нас появляются данные, с которыми можно работать.

Дмитрий: Получается, что у вас есть гибкий подход к тематике личных проектов, но при этом есть и требования к результату. На выходе должен быть продукт, и зачастую готовить его нужно в сотрудничестве с внешними организациями. Есть ли все-таки какие-то рекомендации или пререквизиты для поступающих к вам?

Антонина: На самом деле таких пререквизитов нет. Для нас главное — заинтересованность. Вместе с учениками мы сможем разобраться с тем, как подступиться к теме. Поэтому к нам свободно идут люди с опытом в разработке, аналитике и сферах, которые не так и связаны с ИТ. На этапе собеседования мы продумываем их образовательную траекторию и помогаем определиться с ролями в командах, когда они начинают работать над крупными проектами. Например, для ИТ-специалистов это может быть ведущая роль, а для гуманитария наша программа даст хорошую базу в области computer science и аналитических инструментов. Поэтому в ходе образовательного процесса преподаватели продумывают кейсы, иллюстрирующие теорию, в зависимости от уровня компетенций студентов.

В целом наша программа сфокусирована больше на коммуникации с аудиторией — на том, как можно обработать и представить информацию. А в процессе этого — взаимодействовать с людьми, обладающими различным опытом и взглядами.

Дмитрий: Какие вы могли бы порекомендовать источники для тех, кто хотел бы познакомиться с мировым опытом в этой области? Где можно посмотреть, чем занимаются зарубежные эксперты по направлению digital humanities?

Антонина: С академической точки зрения — можно почитать статьи. Есть такие издания, как Digital Humanities Quarterly, Debates in DH, A Companion to DH и другие. Стоит обратить внимание и на профильные репозитории различных университетов на GitHub, плюс — их информационные ресурсы и онлайн-курсы по теме.

Стоит изучить возможности для участия в тематических конференциях и понять, какие сейчас есть варианты для знакомства и общения с представителями DH-сообщества. Обычно это очень открытые люди, если говорить о других странах, но в частности и у нас атмосфера достаточно дружелюбная — мы готовы обсуждать идеи и находить задачи для наших студентов вместе с институциональными партнерами.

Дополнительные материалы и другие выпуски нашего подкаста:

Другие хабрапосты в нашем блоге:

Источник

Цифровое шарлатанство, стихи о Крыме и китайские единороги. Как Московско-тартуская школа по digital humanities готовит «вычислительных гуманитариев»

Можно ли научить компьютер понимать поэзию? Как вычислить различия между бульварной прозой и высокой? Какие эмоции испытывали авторы дневников времен Большого террора? Всеми этими вопросами занимаются специалисты в области digital humanities. Корреспондентка «Ножа» посетила ежегодную Московско-тартускую школу по цифровым гуманитарным исследованиям и попыталась разобраться, появятся ли у наук о культуре принципиально новые возможности благодаря современным вычислительным методам.

Что такое digital humanities?

Словосочетанию digital humanities, которое можно неформально понимать как «обработка гуманитарных данных вычислительными методами», исследователи пытались дать строгое определение уже 817 раз — особого успеха, впрочем, в этом не добились. Это одна из четырех проблем молодой науки, и организатор центра digital humanities ГУ ВШЭ Анастасия Бонч-Осмоловская начинает с нее открывающую лекцию школы.

Ситуация предсказуема: соединить оцифровку текстов, создание баз данных в самых разных гуманитарных областях, а также многообразие методов data science (от корпусной лингвистики до распознавания эмоций по видео и автоматического сбора биографических данных) в какую-либо единую область с внятным предметом исследования почти невозможно.

Попытка применять точные методы в гуманитарных науках отнюдь не нова — этой традиции, восходящей по крайней мере к русским формалистам, уже более ста лет. Но лишь в последние 15 лет развитие вычислительной техники позволило перейти от ручного изучения отдельных примеров к вычислительному исследованию огромных массивов текстов, насчитывающих многие миллионы слов. При ближайшем рассмотрении цифровые гуманитарные науки немедленно распадаются на разработку тех или иных методов или программных систем, которой занимаются специалисты, связанные с computer science, и на применение этих методов и систем в конкретных задачах, чем занимаются овладевшие новыми техниками специалисты в соответствующих гуманитарных областях.

Может быть интересно:

Впрочем, пока область молода — число гуманитариев, применяющих современные вычислительные методы, невелико, а сами они довольно разносторонни. Так что digital humanities на поверку оказывается не отдельной дисциплиной, но сообществом заинтересованных людей, которые смогли организовать свои исследовательские центры в университетах по всему миру. Именно на этой точке зрения и остановилась Анастасия Бонч-Осмоловская.

Другая проблема — засилье шарлатанских вау-эффектов : за обилием ярких картинок и красивых видео в «продающих презентациях» суть работы оказывается почти невозможно уловить. Это тоже обычная ситуация в прикладных (да и не только!) науках. Попытка получше упаковать и поярче продать тривиальность — неизменный спутник любой современной дисциплины, вынужденной «торговать своей необходимостью» с грантодателями, представителями индустрии и широкой общественностью.

Красивая обертка лучше работает на краткосрочное привлечение внимания, чем на глубокое содержание, а значит, и те, кто перераспределяют собственные интеллектуальные ресурсы в ее пользу, нередко оказываются лучшими научными «спринтерами». Когда хайп спадет, карьера будет уже сделана, а при некоторой сноровке можно оседлать и следующую волну.

«Теория систем», «нечеткая логика», «теория хаоса» — самые громкие из великого множества подобных рекламных пузырей, накрывавших прикладные науки второй половины прошлого столетия.

Надо сказать, упоминания «шарлатанских вау-эффектов» задели слушателей, и едва ли не каждый последующий выступающий стеснительно говорил и о своем собственном возможном «шарлатанстве».

Последний поднятый Анастасией Бонч-Осмоловской вопрос, связанный с качеством и уровнем исследований и результатов в современном цифровом литературоведении — той области digital humanities, которой была посвящена большая часть школы, — оказывается куда более глубоким. Американская исследовательница Нан Зет Да недавно разобрала 15 работ в области цифрового литературоведения и выявила в них глубочайшие проблемы не только на уровне постановки задач или нетривиальности выводов, но даже в корректности обработки статистических данных.

Нан Зет Да утверждает следующее:

Противоположная сторона оправдывается: частотный анализ является лишь базовой техникой, первым шагом в исследовании корпусов литературных текстов, никак не претендующим на окончательность. Современные компьютерные методы могут обрабатывать гораздо бо́льшие массивы текстов, чем человек, но умеют производить с ними лишь простейшие операции.

Digital humanities на практике

В качестве контрпримера, показывающего потенциал эволюции цифрового литературоведения, Бонч-Осмоловская напомнила о классическом исследовании В. Я. Проппа «Морфология сказки» (1928) и работе Венди Ленерт Plot Units and Narrative Summarization (1981), которые описывают сюжет художественного произведения через формализованные последовательности действий персонажей.

Что не входит в задачи ассоциаций по digital humanities. Смотреть фото Что не входит в задачи ассоциаций по digital humanities. Смотреть картинку Что не входит в задачи ассоциаций по digital humanities. Картинка про Что не входит в задачи ассоциаций по digital humanities. Фото Что не входит в задачи ассоциаций по digital humanitiesСхема В. Я. Проппа, описывающая функции дарителя в сказке. Источник Что не входит в задачи ассоциаций по digital humanities. Смотреть фото Что не входит в задачи ассоциаций по digital humanities. Смотреть картинку Что не входит в задачи ассоциаций по digital humanities. Картинка про Что не входит в задачи ассоциаций по digital humanities. Фото Что не входит в задачи ассоциаций по digital humanitiesСхема новеллы О’Генри «Дары волхвов» из статьи Венди Ленерт Plot Units and Narrative Summarization. Источник

В качестве примера развития метода Бонч-Осмоловская привела доклад исследователей из Университета Беркли, посвященный автоматическому детектированию событий в литературных произведениях.

Авторы доклада вручную разметили начальные 2000 слов 100 англоязычных романов, пометив в них «триггеры событий» (то есть отдельные глаголы, существительные и прилагательные, выражающие конкретные, совершенные в прошлом или настоящем действия). При помощи нейросети, обученной на этой выборке, исследователи определяли в дальнейшем события романов, оказывавшиеся «реальными» — то есть те, что приводили героев изменению их состояния или к выражению сильных эмоций либо являлись следствием некой причины, которую можно найти внутри того же самого предложения.

Исследователи сделали вывод, что авторы бульварных романов наполняют произведение множеством событий, в то же время создатели высокой литературы могут этого и не делать.

Утверждение это, на наш взгляд, довольно ожидаемо и скорее подтверждает аргументы Нан Зет Да.

Во время лекции Анастасия Бонч-Осмоловская допустила досадную (и принципиальную!) неточность, заявив, что большее число событий наблюдается не в бульварных, а в малоизвестных романах, что являлось бы куда более неожиданным и нетривиальным результатом. Однако в самой работе показано как раз обратное: известность романа не имеет ровно никакого отношения к количеству событий в нем.

Остужающее излишний энтузиазм выступление не повлияло на общее настроение участников школы — все они разбежались по самым разнообразным практикумам и тьюториалам в диапазоне от анализа эмоциональной нагруженности дневников проекта «Прожито» до структуры домашних страничек городской сети Томска и попыток анализа эмоций по видео. Результаты наиболее успешных из них будут представлены в партнерском тексте проекта «Системный Блокъ».

Общим вопросам современных вычислительных технологий была посвящена лекция аспиранта Университета Осло Андрея Кутузова. Он рассказал о современных нейросетевых методах, используемых для моделирования смысла слова, которые в последний год сменяют еще недавно общепринятый word2vec: они не только сопоставляют слову наборы «ассоциаций», но и «замечают» его различные значения.

Проведенная в рамках школы мини-конференция, к сожалению, содержательностью не отличалась и представляла собой набор случайных студенческо-аспирантских докладов. Из них лишь первые два (о семантике слова «поэзия» в русской поэзии и анализ 9-й кантаты Антиоха Кантемира на предмет реального авторства) можно назвать вполне содержательными — да и они современные цифровые техники, в общем-то, не использовали. Желание организаторов предоставить площадку для высказывания студентам, заинтересованным в изучении новых вычислительных методов, конечно, понятно — однако полное отсутствие как отбора, так и попыток разбавить доклады начинающих чуть более «продвинутыми» работами кажется довольно противоречивым решением.

Полноценные же исследования в области digital humanities были представлены на школе двумя выступлениями: видеолекцией Романа Лейбова (Тарту) об образе Крыма в современной русскоязычной «народной» поэзии (на базе текстов с портала «Стихи.ру») и исследованием образов животных в раннесредневековой поэзии Китая.

Совместный проект Романа Лейбова и Бориса Орехова (ГУ ВШЭ) состоит в сравнении и выделении основных тем, связанных с Крымом, в поэтическом национальном корпусе русского языка и в текстах с сайта «Стихи.ру» различных периодов: до начала конфликта вокруг Крыма, в период его острой фазы (февраль 2014-го — февраль 2015-го) и в последние полтора года.

Основной вывод следующий: если для профессиональных поэтов XIX–XX столетий «военно-патриотический» компонент восприятия Крыма был значим всегда (более того, с ним было связано 4 из 5 основных выделенных тематик), то в поэзии народной он стал заметен лишь в связи с появлением крымского конфликта в медиа и оказался полностью синхронизирован с медийной же повесткой.

Если в 2014 году «народные» поэты писали про войну между братскими народами, западных захватчиков и воссоединение с Россией, то с начала 2018 года их больше интересовала война на Донбассе, строительство Крымского моста и, конечно, юбилеи аннексии.

Исследование, по мнению его авторов, указывает на тот факт, что авторы сетевой поэзии мало ориентированы на поэзию профессиональную — даже в виде советского официоза и русской классики, которые доминируют в национальном корпусе, но реагируют скорее на представленные в их непосредственном окружении элементы массовой культуры (от телевизионных новостей до популярных эстрадных песен).

Коты и верблюды в средневековом Китае

Аспирантка Цюрихского университета Мариана Зорькина рассказала о своем цифровом исследовании «поэзии о вещах» времен китайской династии Тан (618–907 годы н. э.).

Из классической литературной критики известно, что средневековые китайцы мало интересовались котами, однако ели их и использовали их шкуры для пошива одежды. Домашние коты считались ленивыми, а приход кота был плохой приметой — к бедности.

Зато они любили тигров, которых считали отгоняющими злых духов «царями зверей», и почитали мифических единорогов (помесей коня, оленя, быка и рыбы с несколькими рогами) — символов кротости и добродетели. Мыши же, по мнению поэтов, приносили счастье и всегда возвращали долги.

При помощи системы word2vec, а также тематического моделирования Мариана изучила корпусы текстов эпохи, состоящие из более чем 40 тысяч стихотворений, и выделила основные характеристики животных, свойственных поэзии тех времен. Вычислительное исследование всего корпуса поэзии подтвердило известные результаты, а также позволило установить некоторые другие.

Например, она измерила относительную близость разных животных к понятиям «дорогой» и «дешевый» (ценными оказались единороги, слоны и верблюды, а дешевыми — обезьяны, лисы и ослы) и выяснила, кого из животных система word2vec выделяет в качестве источников зловония (свиньи, собаки, тигры и зайцы) и приятных ароматов (обезьяны и верблюды).

При помощи тематического моделирования Мариана Зорькина классифицировала животных по типу стихотворений, в которых они встречаются: так, верблюды оказались связаны с международными отношениями, гиббоны — с грустью их ночных криков, а олени, бараны и единороги — с бессмертными.

К сожалению, культурологическая интерпретация полученного материала в докладе была ограниченной, и он во многом был перечислением конкретных вычислительных результатов. Впрочем, рассказ был посвящен непосредственно проводимой работе, часть данных была получена прямо на школе и, очевидно, многое исследовательнице сделать еще предстоит.

Выводы и перспективы

Школа в целом вызывает противоречивое впечатление. Конечно, крайнее уважение вызывает высокий энтузиазм ее участников, до глубокой ночи осваивавших новые вычислительные методики и работавших над своими групповыми проектами совместно с тьюторами.

Однако амбиции школы выше, чем у обычного образовательного мероприятия одной из исследовательских групп. Она претендует на то, чтобы стать наследницей знаменитых летних школ по вторичным моделирующим системам, которые проводились Ю.М. Лотманом в эстонском Кяэрику, c перерывами в период с 1964-го по 1975 год и были «точкой сборки» Московско-тартуской семиотической школы — одного из центральных феноменов позднесоветских гуманитарных наук. Эту высокую планку (тем более в ее современном, глобализированном варианте), к сожалению, мероприятие пока взять не может.

Международное участие ограничивается докладами дружественных русскоязычных аспирантов и выступлением Романа Лейбова — «второй», тартуской стороны в «московско-тартуском» проекте.

Лекции носят глубоко частный характер отчета о конкретных вычислительных работах, в которых, безусловно, важные и интересные экспериментальные результаты не сопровождаются равными по значимости попытками концептуализации и контекстуализации.

Не является ли эта ситуация отражением общей проблемы цифрового литературоведения, которое производит всё новые методики и конгломераты важнейших экспериментальных данных, но провисает в их теоретическом осмыслении? Ведь любая естественная наука, по образцу которых адепты digital humanities пытаются выстроить гуманитарные области, обладает не только набором экспериментальных методик, но и серьезнейшей теоретической базой, которая определяет то, какие эксперименты и в каких условиях разумно проводить, как именно их результаты имеет смысл интерпретировать, а также то, как из этих разрозненных результатов собрать общую картину изучаемого явления.

Быть может, именно появление новых «больших теоретических подходов» (которые, кстати, деятели исходной тартуской школы активно пытались создавать) позволит научиться глубже понимать полученные экспериментальные данные и придаст им характер важного нового знания.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *