#НЕПОЛИТОЛОГ

Продвинутый уровень QCA

Обновление политологического инструментария
Как наука, находящаяся на стыке различных сфер, политология обладает широким инструментарием. Ученый должен не только разбираться в нём, но и уметь каждый раз формировать методологию, подходящую под цели и задачи отдельного исследования.

При этом методологическое поле находится в постоянном развитии – новые инструменты активно дополняют, а иногда заменяют старые.

Как политологи исследуют мир и общество на практике, и чем одни методы превосходят другие? Рассмотрим на примерах популярного в среде социальных наук качественного сравнительного анализа (QCA) и его современной количественной альтернативы – байесовской комбинации условий (BRS).
Chiu, A., & Xu, Y. (2023) The Journal of Politics, 85(1)
Bayesian Rule Set: A Quantitative Alternative to Qualitative Comparative Analysis
Как качественно сравнивать и анализировать
В конце 1980-х годов, социолог Чарльз Рэгин предложил использование QCA (qualitative comparative analysis – качественный сравнительный анализ) в социальных исследованиях.

Оптимальное количество наблюдений для классического QCA – от 10 до 50. Этот факт, в частности, обуславливал преимущество метода относительно других инструментов – так, подобное количество наблюдений (10-50) было бы слишком большим для cross-case study, но недостаточным для регрессионного анализа.
Как и в случае остальных методов, задача QCA состоит в том, чтобы определить, как факторы влияют на различные исходы (и влияют ли в принципе). Например, интересующий нас исход – демократизация государств. Вопрос состоит в том, что и как влияет на становление демократических институтов.

QCA предполагает использование теории множеств. Каждое наблюдение – это множество, комбинация потенциальных условий.
Представим, что мы пытаемся выяснить, как такие факторы как благосостояние населения (wealth), урбанизация (urbanization), образование (education) и индустриализация (industrialization) в совокупности влияют на демократизацию. Каждому из факторов соответствует значение, равное либо 0 (низкий уровень), либо 1 (высокий уровень). В случае уровня благосостояния, возможных значений три – 0 (низкий), 1 (средний) и 2 (высокий).

Таким образом, перед нами разные наблюдения, т.е. комбинации условий. Например, первая строка представляет случай государства, в котором уровень развития всех факторов низкий, у всех значения равны 0.

Каждая комбинация имеет 3 характеристики:
  • 1
    outcome
    какой исход порождается совокупностью подобных условий (в нашем случае изучением влиянием различных комбинаций на тип режима, 0 – недемократический , 1 – демократический, ? – нет таких наблюдений в реальном мире)
  • 2
    n
    сколько в нашей выборке присутствует наблюдений, соответствующих конкретной комбинации (например, для первого наблюдения, у которого все факторы плохо развиты, в реальном мире найдено 5 кейсов)
  • 3
    consistency
    насколько исходы для каждой конфигурации противоречивы, т.е. как часто для одной и той же комбинации условий можно встретить противоположные исходы (например, для 16-го наблюдения, у которого значения всех факторов равны 1, половина исходов – демократический режим, другая половина - недемократический).
Имея подобную таблицу и наблюдая различия исходов между комбинациями, исследователь, используя законы логики и теорию множеств, сокращает количество условий и длину комбинации до минимально возможных. В нашем случае, потенциальный ответ на вопрос, какие факторы обуславливают демократизацию, был бы:

(высокий уровень благосостояния населения) ИЛИ (средний уровень благосостояния населения И низкий уровень индустриализации).

Больше примеров использования QCA можно найти в нашем материале "Качественный сравнительный анализ: области применения".
В чем проблемы QCA и как их решает байесовский подход
Впрочем, научное сообщество признаёт ряд ограничений QCA:
  • 1
    Что делать с противоречивыми исходами?
    Возвращаясь к consistency, какой порог следует устанавливать, чтобы признавать тот или иной исход? В случае таблицы с условиями демократизации, противоречивым оказалось 16-е наблюдение – половина кейсов с подобной конфигурацией имела демократическое устройство, вторая половина – нет. В данном случае, всей комбинации условий было предписано недемократическое устройство. Но что если, например, consistency этого наблюдения была бы равна 60% - достаточно ли этого, чтобы рассматривать комбинацию как обусловливающую положительный исход?
  • 2
    Сложные ответы
    Один из принципов науки – парсимония, т.е. предпочтительность решений с наименьшим количеством элементов. QCA даёт ответ в виде комплексного решения, которое, впрочем, может быть релевантно только для нашей выборки, но не сможет объяснить кейсы вне выборки – для них было бы предпочтительно более простое решение.

    Например, правило "(условие a И условие b) ИЛИ условие c" успешно объясняет, какие факторы (a, b и c) и как обуславливают демократизацию в странах, которые мы рассматриваем, но если мы применим это правило на тех странах, которые изначально были вне поля нашего внимания – оно может повести себя некорректно. Более того, возможно, лучше бы работала его упрощенная версия (условие a И условие b) - условие c оказалось бы лишним.
  • 3
    Проблематичность вычислений на больших выборках
    Оптимальное количество наблюдений для QCA – до 50. На больших выборках (large-N) метод также используется, но это уже 1) технически проблематично, 2) больше вероятность попадания в выборку противоречивых исходов (см. проблему QCA №1)
Байесовский подход предполагает следующее: настоящая оценка вероятности некоего события должна быть получена с учётом предполагаемой вероятности этого события. Другими словами, в исследовании задействованы не только имеющиеся эмпирические данные, но и наши ожидания от результатов их анализа.
Сам анализ уже основывается не на законах логики, как в случае QCA, – оптимальные комбинации условий в рамках BRS выбираются специальным алгоритмом, использующим статистические (вероятностные) техники. Выбор комбинаций происходит с учётом гиперпараметров, заданных исследователем, т.е. параметров, позволяющих контролировать работу алгоритма - грубо говоря, с учётом 'пожеланий' исследователя.
Например, исследователь устанавливает желаемый максимум длины комбинации, т.е. сколько факторов в крайнем случае может быть включено в оптимальные конфигурации условий. Алгоритм предоставляет некоторое количество комбинаций, обусловливающих положительный исход (например, демократизацию), но количество значимых факторов в каждой из них не будет превышать 3.

Использование вероятностного подхода и возможность настройки гиперпараметров позволяет обойти все 3 ограничения QCA:
  • 1
    Решена проблема противоречивых исходов
    алгоритм BRS фокусируется не на том, как наблюдения представлены в выборке, а на вероятности их генерирования из распределения, заданного гиперпараметрами. Таким образом, вероятностный подход помогает работать с разнородными данными, не ограничивая вывод 'жёсткими' рамками логики.
  • 2
    "Лаконичность" результатов
    настройка гиперпараметров позволяет влиять как на количество предлагаемых алгоритмом оптимальных конфигураций, так и на их длину. Как отмечают авторы статьи, подбор гиперпараметров не требует специальных умений – настройка преимущественно осуществляется путём 'проб и ошибок'
  • 3
    Работа с большими выборками
    использование вероятностного подхода и решение проблемы разнородных данных (т.е. предполагающих противоречивые исходы) позволяют BRS работать на large-N выборках с большей точностью, нежели QCA
Широкий горизонт развития
Оригинальный QCA был предложен профессором социологии, сферы смежной с политологией. BRS как количественная альтернатива QCA был описан профессором департамента бизнес-аналитики и по совместительству доктором компьютерных наук (впоследствии, в контексте политологического исследования метод уже затронули авторы обозреваемой статьи).

На этом примере становится очевидно проникновение в политологию инструментов широкого ряда различных наук и прикладных сфер. Чем больше сама политическая наука развивается, тем большим арсеналом должен обладать специалист этого направления – в противном случае, современные и актуальные методы исследования, даже с учётом факта их использования, могут стать для учёного 'черным ящиком'.
Made on
Tilda