Как посчитать дисперсию случайной величины

Загрузить PDFЗагрузить PDF

Дисперсия случайной величины является мерой разброса значений этой величины. Малая дисперсия означает, что значения сгруппированы близко друг к другу. Большая дисперсия свидетельствует о сильном разбросе значений. Понятие дисперсии случайной величины применяется в статистике. Например, если сравнить дисперсию значений двух величин (таких как результаты наблюдений за пациентами мужского и женского пола), можно проверить значимость некоторой переменной.[1] Также дисперсия используется при построении статистических моделей, так как малая дисперсия может быть признаком того, что вы чрезмерно подгоняете значения.[2]

Метод 1
Метод 1 из 2:

Вычисление дисперсии выборки

Загрузить PDF
  1. How.com.vn Русский: Step 1 Запишите значения выборки.
    В большинстве случаев статистикам доступны только выборки определенных генеральных совокупностей. Например, как правило, статистики не анализируют расходы на содержание совокупности всех автомобилей в России – они анализируют случайную выборку из нескольких тысяч автомобилей. Такая выборка поможет определить средние расходы на автомобиль, но, скорее всего, полученное значение будет далеко от реального.
    • Например, проанализируем количество булочек, проданных в кафе за 6 дней, взятых в случайном порядке. Выборка имеет следующий вид: 17, 15, 23, 7, 9, 13. Это выборка, а не совокупность, потому что у нас нет данных о проданных булочках за каждый день работы кафе.
    • Если вам дана совокупность, а не выборка значений, перейдите к следующему разделу.
  2. How.com.vn Русский: Step 2 Запишите формулу для вычисления дисперсии выборки.
    Дисперсия является мерой разброса значений некоторой величины. Чем ближе значение дисперсии к нулю, тем ближе значения сгруппированы друг к другу. Работая с выборкой значений, используйте следующую формулу для вычисления дисперсии:[3]
    • = ∑[( - x̅)]/(n - 1)
    • – это дисперсия. Дисперсия измеряется в квадратных единицах измерения.
    • – каждое значение в выборке.
    • Σ – знак суммы. То есть из каждого значения нужно вычесть x̅, возвести в квадрат, а затем сложить полученные результаты.
    • x̅ – выборочное среднее (среднее значение выборки).
    • n – количество значений в выборке.
  3. How.com.vn Русский: Step 3 Вычислите среднее значение...
    Вычислите среднее значение выборки. Оно обозначается как x̅.[4] Среднее значение выборки вычисляется как обычное среднее арифметическое: сложите все значения в выборке, а затем полученный результат разделите на количество значений в выборке.
    • В нашем примере сложите значения в выборке: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Теперь результат разделите на количество значений в выборке (в нашем примере их 6): 84 ÷ 6 = 14.
      Выборочное среднее x̅ = 14.
    • Выборочное среднее – это центральное значение, вокруг которого распределены значения в выборке. Если значения в выборке группируются вокруг выборочного среднего, то дисперсия мала; в противном случае дисперсия велика.
  4. How.com.vn Русский: Step 4 Вычтите выборочное среднее из каждого значения в выборке.
    Теперь вычислите разность - x̅, где – каждое значение в выборке. Каждый полученный результат свидетельствует о мере отклонения конкретного значения от выборочного среднего, то есть как далеко это значение находится от среднего значения выборки.[5]
    • В нашем примере:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Правильность полученных результатов легко проверить, так как их сумма должна равняться нулю. Это связано с определением среднего значения, так как отрицательные значения (расстояния от среднего значения до меньших значений) полностью компенсируются положительными значениями (расстояниями от среднего значения до больших значений).
  5. How.com.vn Русский: Step 5 Возведите в квадрат каждый полученный результат.
    Как отмечалось выше, сумма разностей - x̅ должна быть равна нулю. Это означает, что средняя дисперсия всегда равна нулю, что не дает никакого представления о разбросе значений некоторой величины. Для решения этой проблемы возведите в квадрат каждую разность - x̅. Это приведет к тому, что вы получите только положительные числа, которые при сложении никогда не дадут 0.[6]
    • В нашем примере:
      ( - x̅)
      - x̅)
      92 = 81
      (-7)2 = 49
      (-5)2 = 25
      (-1)2 = 1
    • Вы нашли квадрат разности - x̅) для каждого значения в выборке.
  6. How.com.vn Русский: Step 6 Вычислите сумму квадратов разностей.
    То есть найдите ту часть формулы, которая записывается так: ∑[( - x̅)]. Здесь знак Σ означает сумму квадратов разностей для каждого значения в выборке. Вы уже нашли квадраты разностей - x̅) для каждого значения в выборке; теперь просто сложите эти квадраты.
    • В нашем примере: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. How.com.vn Русский: Step 7 Полученный результат разделите...
    Полученный результат разделите на n - 1, где n – количество значений в выборке. Некоторое время назад для вычисления дисперсии выборки статистики делили результат просто на n; в этом случае вы получите среднее значение квадрата дисперсии, которое идеально подходит для описания дисперсии данной выборки. Но помните, что любая выборка – это лишь небольшая часть генеральной совокупности значений. Если взять другую выборку и выполнить такие же вычисления, вы получите другой результат. Как выяснилось, деление на n - 1 (а не просто на n) дает более точную оценку дисперсии генеральной совокупности, в чем вы и заинтересованы. Деление на n – 1 стало общепринятым, поэтому оно включено в формулу для вычисления дисперсии выборки.[7]
    • В нашем примере выборка включает 6 значений, то есть n = 6.
      Дисперсия выборки = 33,2
  8. How.com.vn Русский: Step 8 Отличие дисперсии от стандартного отклонения.
    Заметьте, что в формуле присутствует показатель степени, поэтому дисперсия измеряется в квадратных единицах измерения анализируемой величины. Иногда такой величиной довольно сложно оперировать; в таких случаях пользуются стандартным отклонением, которое равно квадратному корню из дисперсии. Именно поэтому дисперсия выборки обозначается как , а стандартное отклонение выборки – как .
    • В нашем примере стандартное отклонение выборки: s = √33,2 = 5,76.
    Реклама
Метод 2
Метод 2 из 2:

Вычисление дисперсии совокупности

Загрузить PDF
  1. How.com.vn Русский: Step 1 Проанализируйте некоторую совокупность значений.
    Совокупность включает в себя все значения рассматриваемой величины. Например, если вы изучаете возраст жителей Ленинградской области, то совокупность включает возраст всех жителей этой области. В случае работы с совокупностью рекомендуется создать таблицу и внести в нее значения совокупности. Рассмотрим следующий пример:
    • В некоторой комнате находятся 6 аквариумов. В каждом аквариуме обитает следующее количество рыб:





  2. How.com.vn Русский: Step 2 Запишите формулу для...
    Запишите формулу для вычисления дисперсии генеральной совокупности. Так как в совокупность входят все значения некоторой величины, то приведенная ниже формула позволяет получить точное значение дисперсии совокупности. Для того чтобы отличить дисперсию совокупности от дисперсии выборки (значение которой является лишь оценочным), статистики используют различные переменные: [8]
    • σ = (∑( - μ))/n
    • σ – дисперсия совокупности (читается как «сигма в квадрате»). Дисперсия измеряется в квадратных единицах измерения.
    • – каждое значение в совокупности.
    • Σ – знак суммы. То есть из каждого значения нужно вычесть μ, возвести в квадрат, а затем сложить полученные результаты.
    • μ – среднее значение совокупности.
    • n – количество значений в генеральной совокупности.
  3. How.com.vn Русский: Step 3 Вычислите среднее значение совокупности.
    При работе с генеральной совокупностью ее среднее значение обозначается как μ (мю). Среднее значение совокупности вычисляется как обычное среднее арифметическое: сложите все значения в генеральной совокупности, а затем полученный результат разделите на количество значений в генеральной совокупности.
    • Имейте в виду, что средние величины не всегда вычисляются как среднее арифметическое.
    • В нашем примере среднее значение совокупности: μ = = 10,5
  4. How.com.vn Русский: Step 4 Вычтите среднее значение...
    Вычтите среднее значение совокупности из каждого значения в генеральной совокупности. Чем ближе значение разности к нулю, тем ближе конкретное значение к среднему значению совокупности. Найдите разность между каждым значением в совокупности и ее средним значением, и вы получите первое представление о распределении значений.
    • В нашем примере:
      - μ = 5 - 10,5 = -5,5
      - μ = 5 - 10,5 = -5,5
      - μ = 8 - 10,5 = -2,5
      - μ = 12 - 10,5 = 1,5
      - μ = 15 - 10,5 = 4,5
      - μ = 18 - 10,5 = 7,5
  5. How.com.vn Русский: Step 5 Возведите в квадрат каждый полученный результат.
    Значения разностей будут как положительными, так и отрицательными; если нанести эти значения на числовую прямую, то они будут лежать справа и слева от среднего значения совокупности. Это не годится для вычисления дисперсии, так как положительные и отрицательные числа компенсируют друг друга. Поэтому возведите в квадрат каждую разность, чтобы получить исключительно положительные числа.
    • В нашем примере:
      ( - μ) для каждого значения совокупности (от i = 1 до i = 6):
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. How.com.vn Русский: Step 6 Найдите среднее значение полученных результатов.
    Вы нашли, как далеко каждое значение совокупности расположено от ее среднего значения. Найдите среднее значение суммы квадратов разностей, поделив ее на количество значений в генеральной совокупности.
    • В нашем примере:
      Дисперсия совокупности = 24,25
  7. How.com.vn Русский: Step 7 Соотнесите это решение с формулой.
    Если вы не поняли, как приведенное выше решение соотносится с формулой, ниже представлено объяснение решения:
    • Находим разность между каждым значением и средним значением совокупности, а затем возводим каждую разность в квадрат, то есть получаем ( - μ), ( - μ) и так далее вплоть до ( - μ), где – последнее значение в генеральной совокупности.
    • Для вычисления среднего значения полученных результатов нужно найти их сумму и разделить ее на n:( ( - μ) + ( - μ) + ... + ( - μ) ) / n
    • Теперь запишем приведенное объяснение с использованием переменных: (∑( - μ))/n и получим формулу для вычисления дисперсии совокупности.
    Реклама

Советы

  • Дисперсию довольно сложно интерпретировать, поэтому в большинстве случаев она вычисляется как промежуточная величина, которая необходима для нахождения стандартного отклонения.
  • При вычислении дисперсии выборки деление на n-1, а не просто на n, называется коррекцией Бесселя. Дисперсия выборки представляет собой только оценочное значение дисперсии генеральной совокупности, при этом выборочное среднее смещено, чтобы соответствовать этому оценочному значению. Коррекция Бесселя устраняет такое смещение.[9] Это связано с тем, что при анализе n – 1 значения использование n-го значения уже ограничено, так как только определенные значения приводят к выборочному среднему (x̅), которое используется в формуле для вычисления дисперсии.[10]
Реклама

Об этой статье

How.com.vn Русский: Mario Banuelos, PhD
Соавтор(ы): :
Преподаватель математики
Соавтор(ы): Mario Banuelos, PhD. Марио Бануэлос — преподаватель математики в Университете штата Калифорния во Фресно. Имеет более восьми лет преподавательского опыта, специализируется на математической биологии, оптимизации, статистических моделях эволюции генома и науке о данных. Получил степень бакалавра по математике в Университете штата Калифорния во Фресно и PhD по прикладной математике в Калифорнийском университете в Мерседе. Преподавал как на уровне вуза, так и старшей школы. Количество просмотров этой статьи: 132 891.
Эту страницу просматривали 132 891 раз.

Была ли эта статья полезной?

⚠️ Disclaimer:

Content from Wiki How Русский language website. Text is available under the Creative Commons Attribution-Share Alike License; additional terms may apply.
Wiki How does not encourage the violation of any laws, and cannot be responsible for any violations of such laws, should you link to this domain, or use, reproduce, or republish the information contained herein.

Notices:
  • - A few of these subjects are frequently censored by educational, governmental, corporate, parental and other filtering schemes.
  • - Some articles may contain names, images, artworks or descriptions of events that some cultures restrict access to
  • - Please note: Wiki How does not give you opinion about the law, or advice about medical. If you need specific advice (for example, medical, legal, financial or risk management), please seek a professional who is licensed or knowledgeable in that area.
  • - Readers should not judge the importance of topics based on their coverage on Wiki How, nor think a topic is important just because it is the subject of a Wiki article.

Реклама