Фото: img.freepik.com

Представленная статья отражает личную точку зрения колумниста. Позиция автора не всегда совпадает с точкой зрения редакции «Педсовета».

Известно, что для решения задач, связанных с применением формулы полной вероятности, можно использовать не только саму формулу, но и построить дерево вероятностей, отражающее ход случайного эксперимента. Этот метод особенно эффективен для школьников, у которых преобладает образное, наглядное мышление, а не абстрактное.

Задачи, связанные с формулой Байеса (которая является следствием формулы полной вероятности), решаются существенно иначе. Использование дерева вероятностей для подобных задач не всегда эффективно и требует применения формул, а полученные решения оказываются громоздкими. Гораздо продуктивнее решать эти задания с помощью формул полной вероятности и Байеса, чем пытаться искусственно адаптировать дерево случайного опыта или «подгонять» к нему формулу Байеса. В результате получающиеся решения оказываются сложными для понимания учащимися, предпочитающими образное мышление, а учащиеся, ориентированные на логику, справедливо задаются вопросом о целесообразности построения и заполнения дерева, если искомое значение можно вычислить непосредственно с помощью формул. Необходимо придерживаться последовательного подхода: либо использовать только формулы, либо постараться применять исключительно деревья, полностью отказавшись от формул и ограничившись правилами умножения (для вычисления вероятностей совместных событий) и сложения (для расчёта вероятностей простых событий).

В настоящей работе представлен способ решения аналогичных задач, который учитывает выдвинутые замечания и предполагает построение специфического дерева вероятностей. Это дерево визуализируется и заполняется числовыми значениями, основываясь на первоначальных данных и простых вычислениях, которые в любом случае необходимы для определения общей вероятности. Следовательно, для продолжения работы потребуется только визуализация второго дерева, другие дополнительные действия не потребуются.

Для иллюстрации метода дополнительного дерева рассмотрим решение одного из прототипов пятого задания профильного экзамена по математике.

Задача

Анализ крови проводится для всех пациентов, у которых есть подозрение на наличие заболевания. В случае заболевания анализ дает положительный результат с вероятностью 0,95, а у здоровых людей – с вероятностью 0,02. Согласно имеющимся данным, у 6% пациентов, обратившихся с подозрением на болезнь, действительно диагностировано заболевание. Необходимо определить вероятность того, что пациент, у которого анализ показал положительный результат, на самом деле болен.

Решение

Предположим: Н1 – пациент страдает заболеванием, Н2 – пациент здоров. Событие А, полную вероятность которого мы будем определять, означает «анализ показал положительный результат». Необходимо вычислить вероятность Р(Н1|А).

Согласно условиям задачи, вероятность события Н1 равна 0,06, вероятность события Н2 – 0,94, вероятность события А при условии Н1 составляет 0,95, а вероятность события А при условии Н2 – 0,02. Полученные данные будут использованы при построении и заполнении дерева вероятностей, на котором рядом с ветвями будут указаны соответствующие условные вероятности (см. рис. 1).

Рис. 1

Вероятность события А (Р(А)) определяется как сумма вероятностей последних строк, в которых при записи используется А (вместо A): Р(А) = Р (Н1А) + Р (Н2А) = 0,057 + 0,0188 = 0,0758. В дальнейшем, при классическом подходе, вероятность Р (Н1|А) вычисляется с использованием формулы Байеса.

Мы используем другой подход. Будет создано и заполнено специальное дерево вероятностей, которое мы будем называть дополнительным (см. рис. 2). Это также дерево вероятностей, которое заполняется с использованием правил сложения (включая правила вычисления вероятности противоположного события на основе вероятности исходного события) и умножения. Однако в дополнительном дереве в качестве гипотез будут выступать уже не Н1 и Н2, а А и A (после определения Р(А), которое было выполнено ранее, можно без проблем использовать такие гипотезы, поскольку теперь мы знаем их вероятности). Искомую вероятность Р(Н1|А) будем обозначать х.

Рис. 2

Согласно проведенному нами анализу при построении «основного» дерева, вероятность Р(Н1А) составила 0,057. В то же время, расчеты, выполненные на основе дополнительного дерева, показали значение 0,0758 х. Отсюда х = 0,057: 0,0758 = 0,751978… ≈ 0,7520.

Полагаю, что приведённого выше примера достаточно, чтобы разъяснить принцип работы метода дополнительного дерева. Однако, для полноты картины, приведём общий план решения задач, использующих формулу Байеса, с применением упомянутого метода.

В первую очередь следует подчеркнуть, что формула Байеса уместна в задачах, где присутствует чётко определённая полная совокупность гипотез Нi, которые попарно несовместимы (не обязательно это простейшая группа, состоящая из гипотезы и её отрицания, как показано в предыдущем примере). Также необходимо, чтобы вероятности этих гипотез были известны, и рассматривалось событие А, для которого предоставлены его условные вероятности при условии справедливости каждой гипотезы. Цель состоит в том, чтобы определить вероятность справедливости одной из гипотез (без ограничения общности можно предположить, что это гипотеза Н1) при условии наступления события А. Другими словами, требуется вычислить Р (Н1|А).

Сначала, согласно методу дополнительного дерева, вычисляется полная вероятность Р(А). Для этого создается основное дерево вероятностей, и рассчитываются все обычные и условные вероятности, используя правила произведения и суммы (см. пример). Этот этап не будет описан подробно, поскольку он хорошо известен всем, кто заинтересован в данной методике. Далее, суммируя вероятности событий последнего уровня, представленных в виде НiА, определяется Р(А).

Теперь создадим дополнительное дерево. На практике оно всегда имеет структуру, показанную на рис. 2 (и его можно даже упростить, как указано в примечании ниже). В качестве новых гипотез рассмотрим события А и A. Вероятность первого события мы только что определили, вероятность второго нам, в сущности, не потребуется (хотя её можно вычислить как 1 – Р(А)). Искомую вероятность Р(Н1|А) обозначим как неизвестную (предположим, х) и внесем полученные числовые данные в дерево, указав значения Р(А) и Р(Н1А), а также х в качестве значения Р(Н1|А). Осталось применить правило умножения для нахождения х: Р(А)∙х = Р(Н1А). В реальных условиях формальные обозначения в этом равенстве заменяются числовыми значениями, что упрощает работу для учащихся, испытывающих неприязнь к сложным математическим символам.

При детальном рассмотрении видно, что в дополнительном дереве необходимы лишь две ветви: одна – от корня к вершине первого слоя, обозначенной Р(А), а вторая – от этой вершины к вершине второго слоя, обозначенной Р(Н1А). Аналогичная ситуация возникает и в «обычном» дереве: для решения задачи требуются не все ветви, а только те, которые ведут к вершинам, в названиях которых присутствует А (не A). Все остальные ветви отображаются исключительно для визуальной привлекательности. Подобный подход актуален и при использовании дополнительного дерева.

Безусловно, метод дополнительного дерева – это всего лишь один из приёмов, однако, я надеюсь, он окажется полезен как специалистам при работе с учениками, испытывающими трудности с восприятием сложных формул (а таких ребят немало; более того, по моему опыту, многие, при возможности выбора между использованием формул и построением дерева, предпочитают последнее), так и самим школьникам при решении задач, основанных на формуле Байеса. В сущности, мы можем отобразить лишь основное и дополнительное деревья, разместить на соответствующих ветвях и вершинах числа, используя только простые и доступные для понимания правила умножения и сложения – и найти х. Благодаря визуализации и применению двух простых правил, большинство школьников смогут успешно решать задачу, которая при использовании традиционных методов вызывает у них серьезные затруднения.

Данный метод, благодаря своей доступности, может оказаться полезным для многих учащихся, помогая им справиться с психологическими и интеллектуальными трудностями, возникающими при решении задач, основанных на формуле Байеса.