АНАЛИЗ ДИСКРИМИНАНТНЫЙ
— аппарат для решения задач классификации.
В общем виде задача классификации ставится следующим образом.
Имеется k совокупностей π1 π2,
. . .,
πk с функциями распределения F1(x),
F2(x),
. . .,
Fk(x), которые определены полностью или с точностью до значений параметров.
Наблюдение х,
о котором заранее известно,
что оно принадлежит к одной из этих совокупностей,
должно быть отнесено к одной из совокупностей π1 π2,
. . .,
πk с минимальной ошибкой. Обычно классификация происходит по нескольким признакам,
т. е. рассматривается векторная случайная величина .
Функция наблюдений,
которая применяется для классификации наблюдений,
называется дискриминантной функцией. Дискриминантную функцию естественно выбирать так,
чтобы ошибка классификации была минимальной. Если заданы две нормальные совокупности N(Аi,
Λ),
N (A2,
Λ),
γде Ai — вектор математических ожиданий
(i=l,2),
Λ — матрица ковариационная
,
то дискриминантная функция Z имеет вид
Z = ХτΛ-1(Ai-A2).
Здесь Хτ— матрица транспонированная
,
Λ-1 — обратная матрица. В случае различных ковариационных матриц Λi ≠ Λ2 у распределений дискриминантная функция имеет вид
Z = (X-Ai)τΛi-1 (X-Ai)-(X-A2)τ Λ2-1 (X-A2).
Если параметры распределений неизвестны,
вместо них обычно подставляют соответствующие оценки
по выборке
.
При классификации важно указать границу между совокупностями,
называемую порогом. На практике ее часто устанавливают визуально.
При реальных вычислениях А. д. применим во всех задачах,
когда необходимо разделить наблюдения на два или несколько классов.
Особенно широко распространен А. д. в петрологии,
литологии и геохимии.
|