Математическое ожидание непрерывной случайной величины. Функция распределения

Функция распределения является наиболее общей формой задания закона распределения. Она используется для задания как дискретных, так и непрерывных случайных величин. Обычно ее обозначают .Функция распределения определяет вероятность того, что случайная величина принимает значения, меньшие фиксированного действительного числа, т. е.. Функция распределения полностью характеризует случайную величину с вероятностной точки зрения. Ее еще называют интегральной функцией распределения.

Геометрическая интерпретация функции распределения очень проста. Если случайную величину рассматривать как случайную точку оси(рис. 6), которая в результате испытания может занять то или иное положение на этой оси, то функция распределенияесть вероятность того, что случайная точкав результате испытания попадет левее точки.

Для дискретной случайной величины , которая может принимать значения,, … ,, функция распределения имеет вид

,

где неравенство под знаком суммы означает, что суммирование распространяется на все те значения, которые по своей величине меньше. Из этой формулы следует, что функция распределения дискретной случайной величиныразрывна и возрастает скачками при переходе через точки,, … ,, причем величина скачка равна вероятности соответствующего значения (рис. 7). Сумма всех скачков функции распределения равна единице.

Непрерывная случайная величина имеет непрерывную функцию распределения, график этой функции имеет форму плавной кривой (рис. 8).

Рис. 7. Рис. 8.

Рассмотрим общие свойства функций распределения.

Свойство 1. Функция распределения есть неотрицательная функция, заключенная между нулем и единицей:

Справедливость этого свойства вытекает из того, что функция распределения определена как вероятность случайного события, состоящего в том, что.

Свойство 2. Вероятность попадания случайной величины в интервал равна разности значений функции распределения на концах этого интервала, т. е.

Отсюда следует, что вероятность любого отдельного значения непрерывной случайной величины равна нулю.

Свойство 3. Функция распределения случайной величины есть неубывающая функция, т. е. при .

Свойство 4. На минус бесконечности функция распределения рана нулю, а на плюс бесконечности функция распределения рана единице, т. е. ,.

Пример 1. Функция распределения непрерывной случайной величины задана выражением

Найти коэффициент и построить график. Определить вероятность того, что случайная величинав результате опыта примет значение на интервале.

Решение. Так как функция распределения непрерывной случайной величины непрерывна, то приполучим:. Отсюда. График функцииизображен на рис. 9.

Исходя из второго свойства функции распределения, имеем:

.

4. Плотность распределения вероятности и ее свойства.

Функция распределения непрерывной случайной величины является ее вероятностной характеристикой. Но она имеет недостаток, заключающийся в том, что по ней трудно судить о характере распределения случайной величины в небольшой окрестности той или другой точки числовой оси. Более наглядное представление о характере распределения непрерывной случайной величины дает функция, которая называется плотностью распределения вероятности или дифференциальной функцией распределения случайной величины.

Плотность распределения равна производной от функции распределения, т. е.

.

Смысл плотности распределения состоит в том, что она указывает на то, как часто появляется случайная величинав некоторой окрестности точкипри повторении опытов. Кривая, изображающая плотность распределенияслучайной величины, называетсякривой распределения .

Рассмотрим свойства плотности распределения.

Свойство 1. Плотность распределения неотрицательна, т. е.

Свойство 2. Функция распределения случайной величины равна интегралу от плотности в интервале от до, т. е.

Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL .

Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.

Генеральная совокупность и случайная величина

Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.

Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.

Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.

В нашем примере, ГС - это просто числовой массив значений весов деталей. Х – вес одной из деталей.

Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной . По определению, любая случайная величина имеет функцию распределения , которая обычно обозначается F(x).

Функция распределения

Функцией распределения вероятностей случайной величины Х называют функцию F(x), значение которой в точке х равно вероятности события X

F(x) = P(X

Поясним на примере нашего станка. Хотя предполагается, что наш станок производит только один тип деталей, но, очевидно, что вес изготовленных деталей будет слегка отличаться друг от друга. Это возможно из-за того, что при изготовлении мог быть использован разный материал, а условия обработки также могли слегка различаться и пр. Пусть самая тяжелая деталь, произведенная станком, весит 200 г, а самая легкая - 190 г. Вероятность того, что случайно выбранная деталь Х будет весить меньше 200 г равна 1. Вероятность того, что будет весить меньше 190 г равна 0. Промежуточные значения определяются формой Функции распределения. Например, если процесс настроен на изготовление деталей весом 195 г, то разумно предположить, что вероятность выбрать деталь легче 195 г равна 0,5.

Типичный график Функции распределения для непрерывной случайной величины приведен на картинке ниже (фиолетовая кривая, см. файл примера ):

В справке MS EXCEL Функцию распределения называют Интегральной функцией распределения (Cumulative Distribution Function , CDF ).

Приведем некоторые свойства Функции распределения:

  • Функция распределения F(x) изменяется в интервале , т.к. ее значения равны вероятностям соответствующих событий (по определению вероятность может быть в пределах от 0 до 1);
  • Функция распределения – неубывающая функция;
  • Вероятность того, что случайная величина приняла значение из некоторого диапазона плотность вероятности равна 1/(0,5-0)=2. А для с параметром лямбда =5, значение плотности вероятности в точке х=0,05 равно 3,894. Но, при этом можно убедиться, что вероятность на любом интервале будет, как обычно, от 0 до 1.

    Напомним, что плотность распределения является производной от функции распределения , т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения >1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере ).

    Примечание : Площадь, целиком заключенная под всей кривой, изображающей плотность распределения , равна 1.

    Примечание : Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения . Этот термин присутствует в параметрах функций, например в НОРМ.РАСП (x; среднее; стандартное_откл; интегральная ). Если функция MS EXCEL должна вернуть Функцию распределения, то параметр интегральная , д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности , то параметр интегральная , д.б. ЛОЖЬ.

    Примечание : Для дискретного распределения вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности может называть даже "функция вероятностной меры" (см. функцию БИНОМ.РАСП() ).

    Вычисление плотности вероятности с использованием функций MS EXCEL

    Понятно, что чтобы вычислить плотность вероятности для определенного значения случайной величины, нужно знать ее распределение.

    Найдем плотность вероятности для N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ) =0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ) .

    Напомним, что вероятность того, что непрерывная случайная величина примет конкретное значение x равна 0. Для непрерывной случайной величины Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b).

    Вычисление вероятностей с использованием функций MS EXCEL

    1) Найдем вероятность, что случайная величина, распределенная по (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения вероятность равна F(+∞)-F(0)=1-0,5=0,5.

    НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА) =1-0,5.
    Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).

    2) Найдем вероятность, что случайная величина, распределенная по , приняла отрицательное значение. Согласно определения Функции распределения, вероятность равна F(0)=0,5.

    В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА) =0,5.

    3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению , примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) - НОРМ.СТ.РАСП(0;ИСТИНА) .

    Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье найти точку, для которой F(х)=0,5, а затем найти абсциссу этой точки. Абсцисса точки =0, т.е. вероятность, того что случайная величина Х примет значение <0, равна 0,5.

    В MS EXCEL используйте формулу =НОРМ.СТ.ОБР(0,5) =0.

    Однозначно вычислить значение случайной величины позволяет свойство монотонности функции распределения.

    Обратная функция распределения вычисляет , которые используются, например, при . Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения . В файле примера можно вычислить и другой квантиль этого распределения. Например, 0,8-квантиль равен 0,84.

    В англоязычной литературе обратная функция распределения часто называется как Percent Point Function (PPF).

    Примечание : При вычислении квантилей в MS EXCEL используются функции: НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье .

    Тема №11

    На практике для задания случайных величин общего вида обычно используется функция распределения.

    Вероятность того, что случайная величина х примет определенное значение х 0 , выражается через функцию распределения по формуле

    р (х = х 0) = F(x 0 +0) – F(x 0). (3)

    В частности, если в точке х = х 0 функция F(x) непрерывна, то

    р (х = х 0) =0.

    Случайная величина х с распределением р(А) называется дискретной, если на числовой прямой существует конечное или счетное множество W, такое, что р (W,) = 1.

    Пусть W = {x 1 , x 2 ,…} и p i = p ({x i }) = p (x = x i ), i = 1,2,….Тогда для любого борелевского множества А вероятность р(А) определяется однозначно формулой

    Положив в этой формуле А = {x i / x i < x}, x Î R , получим формулу для функции распределения F(x) дискретной случайной величины х :

    F(x) = p (x < x ) =. (5)

    График функции F(x) представляет собой ступенчатую линию. Скачки функции F(x) в точках х = х 1 , х 2 …(x 1 равны соответствующим вероятностям р 1 , p 2 , … .

    Пример 1. Найдите функцию распределения

    дискретной случайной величины х из примера 1§ 13.

    Используя функцию распределения, вычислите

    вероятности событий: х < 3, 1 £ x < 4, 1 £ x £ 3.

    F(x)
    0 х 1 х 2 х 3 х 4 х
    Решение. Используя данные из таблицы,

    полученной в § 13, и формулу (5), получим

    функцию распределения:

    По формуле (1) Р(x < 3) = F(3) = 0,1808; по формуле (2)

    р(1 £ x < 4) = F (4) – F(1) = 0,5904 – 0,0016 = 0,5888;

    p (1 £ x £ 3) = p (1 £ x <3) + p(x = 3) = F(3) – F(1) + F(3+0) – F(3) =

    F(3+0) – F(1) = 0,5904 – 0,0016 = 0,5888.

    Пример 2. Дана функция

    Является ли функция F(x) функцией распределения некоторой случайной величины? В случае положительного ответа найдите . Построить график функции F(x).

    Решение. Для того чтобы наперед заданная функция F(x) являлась функцией распределения некоторой случайной величины х, необходимо и достаточно выполнение следующих условий (характеристических свойств функции распределения):

    1. F(x) – неубывающая функция.

    3. При любом х Î R F(x – 0) = F(x ).

    Для заданной функции F(x) выполнение

    этих условий очевидно. Значит,

    F(x) – функция распределения.

    Вероятность вычисляем по

    формуле (2):

    График функции F(x ) представлен на рисунке 13.

    Пример 3. Пусть F 1 (x ) и F 2 (x ) – функции распределения случайных величин х 1 и х 2 соответственно, а 1 и а 2 – неотрицательные числа, сумма которых равна 1.

    Доказать, что F(x ) = a 1 F 1 (x ) + a 2 F 2 (x ) является функцией распределения некоторой случайной величины х .



    Решение. 1) Так как F 1 (x ) и F 2 (x ) – неубывающие функции и а 1 ³ 0, а 2 ³ 0, то a 1 F 1 (x ) и a 2 F 2 (x ) - неубывающие, следовательно, их сумма F(x ) тоже неубывающая.

    3) При любом х Î R F(x - 0) = a 1 F 1 (x - 0) + a 2 F 2 (x - 0)= a 1 F 1 (x ) + a 2 F 2 (x ) = F(x ).

    Пример 4. Дана функция

    Является ли F(x) функцией распределения случайной величины?

    Решение. Легко заметить, что F(1) = 0,2 > 0,11 = F(1,1). Следовательно, F(x ) не является неубывающей, а значит, не является функцией распределения случайной величины. Заметим, что остальные два свойства для данной функции справедливы.

    Контрольное задание №11

    1. Дискретная случайная величина х

    x ) и, используя ее, найдите вероятности событий: а) –2 £ х < 1; б) ½х ½£ 2. Постройте график функции распределения.

    3. Дискретная случайная величина х задана таблицей распределения:

    x i
    p i 0,05 0,2 0,3 0,35 0,1

    Найдите функцию распределения F(x ) и найдите вероятности следующих событий: а) x < 2; б) 1 £ х < 4; в) 1 £ х £ 4; г) 1 < x £ 4; д) х = 2,5.

    4. Найдите функцию распределения дискретной случайной величины х , равной числу выпавших очков при одном бросании игральной кости. Используя функцию распределения, найдите вероятность того, что выпадет не менее 5 очков.

    5. Производятся последовательные испытания 5 приборов на надежность. Каждый следующий прибор испытывается только в том случае, если предыдущий оказался надежным. Составьте таблицу распределения и найдите функцию распределения случайного числа испытаний приборов, если вероятность выдержать испытания для каждого прибора 0,9.

    6. Задана функция распределения дискретной случайной величины х :

    а) Найдите вероятность события 1 £ х £ 3.

    б) Найдите таблицу распределения случайной величины х .

    7. Задана функция распределения дискретной случайной величины х :

    Составьте таблицу распределения данной случайной величины.

    8. Монету бросают n раз. Составьте таблицу распределения и найдите функцию распределения числа появлений герба. Постройте график функции распределения при n = 5.

    9. Монету бросают, пока не выпадет герб. Составьте таблицу распределения и найдите функцию распределения числа появлений цифры.

    10. Снайпер стреляет по цели до первого попадания. Вероятность промаха при отдельном выстреле равна р . Найдите функцию распределения числа промахов.

    3. Функция распределения является неубывающей : если , то

    4. Функция распределения непрерывна слева : для любого .

    Примечание . Последнее свойство обозначает, какие значения принимает функция распределения в точках разрыва. Иногда определение функции распределения формулируют с использованием нестрогого неравенства: . В этом случае непрерывность слева заменяется на непрерывность справа: при . Никакие содержательные свойства функции распределения при этом не меняются, поэтому данный вопрос является лишь терминологическим.

    Свойства 1-4 являются характеристическими, т.е. любая функция , удовлетворяющая этим свойствам, является функцией распределения некоторой случайной величины.

    Функция распределения задает распределение вероятностей случайной величины однозначно. Фактически, она является универсальным и наиболее наглядным способом описания этого распределения.

    Чем сильнее функция распределения растет на заданном интервале числовой оси, тем выше вероятность попадания случайной величины в этот интервал. Если вероятность попадания в интервал равна нулю, то функция распределения на нем постоянна.

    В частности, вероятность того, что случайная величина примет заданное значение , равна скачку функции распределения в данной точке:

    .

    Если функция распределения непрерывна в точке , то вероятность принять данное значение для случайной величины равна нулю. В частности, если функция распределения непрерывна на всей числовой оси (при этом и соответствующее распределение называется непрерывным ), то вероятность принять любое заданное значение равна нулю.

    Из определения функции распределения вытекает, что вероятность попадания случайной величины в интервал, замкнутый слева и открытый справа, равна:

    С помощью данной формулы и указанного выше способа нахождения вероятности попадания в любую заданную точку, легко определяются вероятности попадания случайной величины в интервалы других типов: , и . Далее, по теореме о продолжении меры, можно однозначно продолжить меру на все борелевские множества числовой прямой . Для того, чтобы применить эту теорему, требуется показать, что таким образом определенная на интервалах мера является на них сигма-аддитивной; при доказательстве этого в точности используются свойства 1-4 (в частности, свойство непрерывности слева 4, поэтому отбросить его нельзя).

    Генерация случайной величины, имеющей заданное распределение

    Рассмотрим случайную величину , имеющую функцию распределения . Предположим, что непрерывна . Рассмотрим случайную величину

    .

    Легко показать, что тогда будет иметь равномерное распределение на отрезке .

    Функция распределения вероятностей и ее свойства.

    Функцией распределения вероятностей F(x) случайной величины Х в точке х называется вероятность того, что в результате опыта случайная величина примет значение, меньше, чем х, т.е. F(x)=P{X < х}.
    Рассмотрим свойства функции F(x).

    1. F(-∞)=lim (x→-∞) F(x)=0. Действительно, по определению, F(-∞)=P{X < -∞}. Событие (X < -∞) является невозможным событием: F(-∞)=P{X < - ∞}=p{V}=0.

    2. F(∞)=lim (x→∞) F(x)=1, так как по определению, F(∞)=P{X < ∞}. Событие Х < ∞ является достоверным событием. Следовательно, F(∞)=P{X < ∞}=p{U}=1.

    3. Вероятность того, что случайная величина примет значение из интервала [Α Β] равна приращению функции распределения вероятностей на этом интервале. P{Α ≤X<Β}=F(Β)-F(Α).

    4. F(x 2)≥ F(x 1), если x 2, > x 1 , т.е. функция распределения вероятностей является неубывающей функцией.

    5. Функция распределения вероятностей непрерывна слева. FΨ(x o -0)=limFΨ(x)=FΨ(x o) при х→ x o

    Различия между функциями распределения вероятностей дискретной и непрерывной случайных величин хорошо иллюстрировать графиками. Пусть, например, дискретная случайная величина имеет n возможных значений, вероятности которых равны P{X=x k }=p k , k=1,2,..n. Если x ≤ x 1 , то F(Х)=0, так как левее х нет возможных значений случайной величины. Если x 1 < x ≤ x 2 , то левее х находится всего одно возможное значение, а именно, значение х 1 .

    Значит, F(x)=P{X=x 1 }=p 1 .При x 2 < x ≤ x 3 слева от х находится уже два возможных значения, поэтому F(x)=P{X=x 1 }+P{X=x 2 }=p 1 +p 2 . Рассуждая аналогично,приходим к выводу, что если х k < x≤ x k+1 , то F(x)=1, так как функция будет равна сумме вероятностей всех возможных значений, которая по условию нормировки равна еденице. Таким образом, график функции распределения дискретной случайной величины является ступенчатым. Возможные значения непрерывной величины располагаются плотно на интервале задания этой величины, что обеспечивает плавное возрастания функции распределения F(x), т.е. ее непрерывность.

    Рассмотрим вероятность попадания случайной величины в интервал , Δx>0: P{x≤X< x+Δx}=F(x+ Δx)-F(x). Перейдем к пределу при Δx→0:

    lim (Δx→0) P{x≤ X < x+Δx}=lim (Δx→0) F(x+Δx)-F(x). Предел равен вероятности того, что случайная величина примет значение, равное х. Если функция F(x) непрерывна в точке х, то lim (Δx→0) F(x+Δx)=F(x), т.е. P{X=x}=0.

    Если F(x) имеет разрыв в точке х, то вероятность P{X=x} будет равна скачку функции в этой точке. Таким образом, вероятность появления любого возможного значения для непрерывной величины равна нулю. Выражение P{X=x}=0 следует понимать как предел вероятности попадания случайной величины в бесконечно малую окрестность точки х при P{Α< X≤ Β},P{Α ≤ X< Β},P{Α< X< Β},P{Α ≤ X≤ Β} равны, если Х - непрерывная случайная величина.

    Для дискретных величин эти вероятности неодинаковы в том случае, когда границы интервала Α и(или) Β совпадают с возможными значениями случайной величин. Для дискретной случайной величины необходимо строго учитывать тип неравенства в формуле P{Α ≤X<Β}=F(Β)-F(Α).