Применение Байесовых сетей

Автор работы: Пользователь скрыл имя, 17 Февраля 2011 в 01:15, курсовая работа

Описание

Байесовы сети представляют собой графовые модели вероятностных и причинно-следственных отношений между переменными в статистическом информационном моделировании. В байесовых сетях могут органически сочетаться эмпирические частоты появления различных значений переменных, субъективные оценки «ожиданий» и теоретические представления о математических вероятностях тех или иных следствий из априорной информации.

Содержание

Введение 3
Основные понятия и определения 5
Законы теории вероятностей. 5
Законы сложения вероятностей. 6
Условные вероятности. 6
Формула Байеса. 7
Введение в байесовские сети доверия. 7
Моделирование в условиях неопределенности 8
Экспертные системы и формальная логика 8
Особенности вывода суждений в условиях неопределенности 9
Определение d-разделимости 11
Использование Байесовых сетей. 13
Вероятности прогнозируемых значений отдельных переменных 13
Пример построения простейшей байесовской сети доверия. 13
Расчет в байесовской сети. 15
Байесовские сети доверия как одно из направлений современных экспертных систем. 16
Представление знаний с использованием байесовской сети доверия и условная независимость событий. 16
Замечание о субъективных вероятностях и ожидания. 17
Синтез сети на основе априорной информации. 18
Пример использования Байесовых сетей 19
Медицина 19
Космические и военные применения 19
Компьютеры и системное программное обеспечение 19
Обработка изображений и видео 19
Финансы и экономика 20
Описание прикладных программ 21
AUAI — Ассоциация анализа неопределенности в искусственном интеллекте 21
NETICA 21
Knowledge Industries 22
Data Digest Corporation 22
BayesWare, Ltd 22
HUGIN Expert 22
Выводы 24
Список используемой литературы. 25

Работа состоит из  1 файл

Применение Байесовых сетей.doc

— 268.00 Кб (Скачать документ)

   Все четыре переменные принимают булевы значения 0 — ложь, (f) или 1 — истина (t). Совместная вероятность P(R, S, C, W), таким  образом, дается совокупной таблицей из 16 чисел. Таблица вероятностей нормирована, так что

   

   Зная  совместное распределение, легко найти  любые интересующие нас условные и частичные распределения. Например, вероятность того, что ночью не было дождя при условии, что трава  у дома Ватсона — влажная, дается простым вычислением:

    

   Из  теоремы об умножении вероятностей полная вероятность представляется цепочкой условных вероятностей:

   P(R, S, C, W) = P(R) * P(S | R) * P(C |R,S)*P(W | R, S, C).

   В описанной ранее байесовой сети ориентированные ребра графа  отражают суть вероятностей, которые реально имеют место в задаче. Поэтому формула для полной вероятности существенно упрощается:

   P(R, S, C, W) = P(R) *P(S) * P(C |R,S)*P(W | R).

   Порядок следования переменных в соотношении  для полной вероятности, вообще говоря, может быть любым. Однако на практике целесообразно выбирать такой порядок, при котором условные вероятности максимально редуцируются. Это происходит, если начинать с переменных-«причин», постепенно переходя к «следствиям». При этом полезно представлять себе некоторую «историю», согласно которой причины влияют на следствия. 
 

Пример  построения простейшей байесовской сети доверия.

 

Рассматриваем небольшую яблочную плантацию «яблочного Джека». Однажды Джек обнаружил, что  его прекрасное яблочное дерево лишилось листвы. Теперь он хочет выяснить, почему это случилось. Он знает, что листва часто опадает, если:

дерево  засыхает в результате недостатка влаги; или дерево болеет.

Данная  ситуация может быть смоделирована  байесовской сетью доверия, содержащей 3 вершины: «Болеет», «Засохло» и «Облетело». 

 

Рис.1. Пример байесовской сети доверия  с тремя событиями. 
 

В данном простейшем случае рассмотрим ситуацию, при которой каждая вершина  может принимать всего лишь два  возможных состояний и, как следствие  находится в одном из них, а именно:  

Вершина (событие) БСД  Состояние 1 Состояние 2
“Болеет” «болеет» «нет»
“Засохло” «засохло» «нет»
“Облетело” «да» «нет»
 
 

Вершина “Болеет” говорит о том, что дерево заболело, будучи в состоянии «болеет», в противном случае она находится  в состоянии «нет». Аналогично для других двух вершин. Рассматриваемая байесовская сеть доверия, моделирует тот факт, что имеется причинно-следственная зависимость от события “Болеет” к событию “Облетело” и от события “Засохло” к событию “Облетело”. Это отображено стрелками на байесовской сети доверия.

Когда есть причинно-следственная зависимость  от вершины А к другой вершине B, то мы ожидаем, что когда A находится  в некотором определённом состоянии, это оказывает влияние на состояние B. Следует быть внимательным, когда моделируется зависимость в байесовских сетях доверия. Иногда совсем не очевидно, какое направление должна иметь стрелка.

Например, в рассматриваемом примере, мы говорим, что имеется зависимость от “Болеет” к “Облетело”, так как когда  дерево болеет, это может вызывать опадание его листвы. Опадание листвы является следствием болезни, а не болезнь – следствием опадания листвы.

На  приведенном выше рисунке дано графическое  представление байесовской сети доверия. Однако, это только качественное представление байесовской сети доверия. Перед тем, как назвать это полностью байесовской сетью доверия необходимо определить количественное представление, то есть множество таблиц условных вероятностей: 

Априорная вероятность p(“Болеет”)   Априорная вероятность p(“Засохло”)
Болеет = «болеет» Болеет = «нет»   Засохло = «засохло» Засохло = «нет»
0,1 0,9   0,1 0,9
 
 
Таблица условных вероятностей p(“Облетело” | ”Болеет”, ”Засохло”)
  Засохло = «засохло» Засохло = «нет»
  Болеет = «болеет» Болеет = «нет» Болеет = «болеет» Болеет = «нет»
Облетело = «да» 0,95 0,85 0,90 0,02
Облетело = «нет» 0,05 0,15 0,10 0,98
 
 

Приведенные таблицы иллюстрируют ТУВ для  трёх вершин байесовской сети доверия. Заметим, что все три таблицы  показывают вероятность пребывания некоторой вершины в определённом состоянии, обусловленным состоянием её родительских вершин. Но так как вершины Болеет и Засохло не имеют родительских вершин, то их вероятности являются маргинальными, т.е. не зависят (не обусловлены) ни от чего.

На  данном примере мы рассмотрели, что и как описывается очень простой байесовской сетью доверия. Современные программные средства (такие как MSBN, Hugin и др.) обеспечивают инструментарий для построения таких сетей, а также возможность использования байесовских сетей доверия  для введения новых свидетельств и получения решения (вывода) за счёт пересчёта новых вероятностей во всех вершинах, соответствующих вновь введенным свидетельствам.

В нашем примере пусть известно, что дерево сбросило листву. Это  свидетельство вводится выбором  состояния «да» в вершине “Облетело”. После этого можно узнать вероятности того, что дерево засохло. Для приведенных выше исходных данных, результаты вывода путем распространения вероятностей по БСД будут:

p( “Болеет” = «болеет» | “Облетело” = «да») = 0,47;  p( “Засохло” = «засохло» |  “Облетело” = «да») = 0,49. 

Расчет  в байесовской  сети.

 

Следует отметить, что следствием байесовской  теоремы является то, что она поддерживает оценку графа в обоих направлениях. Процесс рассуждения в ЭС сопровождается распространением по сети вновь поступивших свидетельств.

Введение  в байесовские сети доверия новых  данных приводит к возникновению  переходного процесса распространения  по байесовской сети доверия вновь  поступившего свидетельства. После  завершения переходного процесса каждому высказыванию, ассоциированному с вершинами графа, приписывается апостериорная вероятность, которая определяет степень доверия к этому высказыванию ( believe – доверять(англ.) ):

,

где D  –  объединения всех поступивших в систему данных;

Vji –  композиционные высказывания, составленные из элементарных, то есть множество значений Xi  составляют Vji ;

Xi – пропозиционные переменные (то  есть переменные, значениями которых  являются высказывания), определяющие  состояние вершин БСД.

При этом процесс распространения вероятностей в БСД основывается на  механизме пересчёта,  в основе функционирования которого лежит следующая последовательность действий:

С каждой вершиной сети ассоциирован вычислительный процесс (процессор), который получает сообщения от соседних (связанных с ним дугами) процессоров.

Этот  процессор осуществляет пересчёт апостериорных  вероятностей Bel(Vji) для всех возможных  значений Vji данной переменной Xi и посылает соседим вершинам ответные сообщения.

Деятельность  процессора инициируется нарушением условий согласованности с состояниями соседних процессоров и продолжается до восстановления этих условий.

В некоторых системах, реализующих  байесовские сети доверия используется метод noisy or gate, позволяющий существенно  упростить вычислительный процесс. Суть его заключается в том, что в ряде примеров вершина «y» может быть условно независима от целого ряда вершин «xr» , где r = 1,2,..., n. Для того, чтобы сократить оценку 2n вероятностей, которые необходимы при использовании таблиц условных вероятностей, и используется данный метод. Согласно ему вероятность «y» в зависимости от n вершин «xr» оценивается как

,

что позволяет оценить только p(y | x 1), p(y | x 2) ... p(y | x n), и на их основании  определить оценку p( y | x1 x2 ... xn). 

Байесовские сети доверия как одно из направлений современных экспертных систем.

 

Выбор байесовских сетей доверия  в  качестве ЭС по сравнению с другими  направлениями их построения обусловлен рядом причин.

  1. Логический вывод в байесовских сетях доверия  является трактуемым с вычислительной точки зрения, так как теория, лежащая в его основе, имеет аксиоматическое обоснование, отработанное в течение последних десятилетий. В то время, как системы, основанные на теории нечётких множеств, на теории функций доверия, теории Демпстера - Шефера не имеет строгого математического обоснования и в большинстве случаев используют эвристические процедуры ( ЭС типа MYCIN, EMYCIN и т.д.).
  2. Показано, что психологически проще выполнять субъективное вероятностное оценивание причинно-следственных связей.
  3. Метод noisy or gate обеспечивает эффективное вычисление условных вероятностей.
  4. Несмотря на то, что теорию вероятности зачастую критикуют с точки зрения её использования в «знаниях», она не нарушает общих представлений о «замкнутом мире» объектов.

Представление знаний с использованием байесовской сети доверия и условная независимость событий.

 

Рассмотрим  фрагмент представления медицинской  БЗ, в которой можно выделить заболевания, симптомы их проявления, а также  факторы риска, влияющие на возникновение  заболеваний. Пусть некоторая упрощённая модель качественного описания БЗ имеет  вид, приведенный на рис.2. Эта модель соответствует следующему набору медицинских знаний:

Одышка [o] может быть вследствие туберкулёза [t], рака лёгких [r] или бронхита [b], а  также вследствие ни одного из перечисленных  заболеваний или более, чем одного.

Визит в Азию [a] повышает шансы туберкулёза [t].

Курение [k] – фактор риска, как для рака [r], так и бронхита [b].

Результаты  рентгена, определяя затемнённость  в лёгких не позволяют различить  рак [r] и туберкулёз [t], так же как  не определяет факт наличия или отсутствия одышки [o].

Последний факт представляется в графе промежуточной  переменной (событием) [tr]. Эта переменная соответствует логической функции  «или» для двух родителей ([t] и [r]) и она означает наличие либо одной, либо двух болезней или их отсутствие. 

Информация о работе Применение Байесовых сетей