СОДЕРЖАНИЕ
1. ВВЕДЕНИЕ 6
1. ОСНОВНЫЕ ПАРАМЕТРЫ И ОПРЕДЕЛЕНИЯ НОРМАЛЬНОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ 8
1.1. Нормальное распределение 8
1.2. Статистическая гипотеза 8
1.3. Ошибки первого и второго рода. Уровень значимости 9
1.4. Степень свободы параметра 10
1.5. Критическая область. Область принятия гипотезы. 10
1.6. Критерий Стьюдента 11
1.7. Критерий Фишера 13
1.8. Критерий Кохрэна 15
1.9. Критерий Пирсона 15
2. ХАРАКТЕРИСТИКА ПАКЕТА EXCELL 19
3. АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИ 21
4. 4. ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ ЗАКОНЕ РАСПРЕДЕЛЕНИЯ ДАННЫХ В ВЫБОРКЕ 24
4. РУКОВОДСТВО ПОЛЬЗОВАТЕЛЯ О НОРМАЛЬНОМ ЗАКОНЕ РАСПРЕДЕЛЕНИЯ ДАННЫХ В ВЫБОРКЕ 26
ЗАКЛЮЧЕНИЕ 28
ЛИТЕРАТУРА 29
ВВЕДЕНИЕ
Нормальное (гауссовское) распределение занимает центральное место в теории и практике вероятностно-статистических исследований. В качестве непрерывной аппроксимации к биномиальному распределению его впервые рассматривал А.Муавр в 1733 г. Через некоторое время нормальное распределение снова открыли и изучили К.Гаусс (1809 г.) и -П.Лаплас, которые пришли к нормальной функции в связи с работой по теории ошибок наблюдений.
Цель их объяснения механизма формирования нормально распределенных случайных величин заключается в следующем. Постулируется, что значения исследуемой непрерывной случайной величины формируются под воздействием очень большого числа независимых случайных факторов, причем сила воздействия каждого отдельного фактора мала и не может превалировать среди остальных, а характер воздействия - аддитивный (т.е. при воздействии случайного фактора F на величину а получается величина ___________, где случайная "добавка" ______ мала и равновероятна по знаку).
Во многих случайных величинах, изучаемых в технике и других областях, естественно видеть суммарный аддитивный эффект большого числа независимых причин. Но центральное место нормального закона не следует объяснять его универсальной приложимостью.
В этом смысле нормальный закон - один из многих типов распределения, имеющихся в природе, однако с относительно большим удельным весом практической приложимости.
Однако полнота теоретических исследований, относящихся к нормальному закону, а также сравнительно простые математические свойства делают его наиболее привлекательным и удобным в применении. Даже в случае отклонения исследуемых экспериментальных данных от нормального закона существует, по крайней мере, два пути его целесообразной эксплуатации: во-первых, использовать нормальный закон в качестве первого приближения (при атом нередко оказывается, что подобное допущение дает достаточно точные с точки зрения конкретных целей исследования результаты); во-вторых. подобрать такое преобразование исследуемой случайной величины, которое видоизменяет исходный "не нормальные" закон распределения, превращая его в нормальный.
Удобно для статистических приложений и свойство "самовоспроизводимости" нормального закона, заключающееся в том, что сумма любого числа нормально распределенных случайных величин тоже подчиняется нормальному закону распределения. Кроме того, с помощью закона нормального распределения выведен целый ряд других важных распределений, построены различные статистические критерии
1. ОСНОВНЫЕ ПАРАМЕТРЫ И ОПРЕДЕЛЕНИЯ НОРМАЛЬНОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ 1.1. Нормальное распределение
В приложениях статистики чаще всего используется нормальное (гауссовское) распределение. Непрерывная случайная величина Х называется распределенной по нормальному закону с параметрами ______, если ее плотность распределения есть
.
1.2. Статистическая гипотезаЧасто необходимо знать закон распределения генеральная совокупности. Если он неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), выдвигают гипотезу: генеральная совокупность распределена по закону А. Таким образом, в этой гипотезе речь вдет о виде предполагаемого распределения.
Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, то неизвестный параметр Q равен определенному значению Q0 , выдвигают гипотезу: Q = Q0. Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и многие другие.
Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.
Например статистическими будут гипотезы; генеральная распределена по закону Пуассона, дисперсии двух нормальных совокупностей равны между собой.
В первой гипотезе сделано предположение о виде неизвестного распределения, во второй - о параметрах двух известных распределений.
Наряду с выдвинутой гипотезой рассматривают и противоречивую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, имеет место противоречащая гипотеза. По этой причине эти гипотезы необходимо различать.
Нулевой (основной) называют выдвинутую гипотезу Н0.
Конкурирующей (альтернативной) называют гипотезу Н1, противоречащую нулевой.
1.3. Ошибки первого и второго рода. Уровень значимостиВыдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость проверить ее. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.
Ошибка второго рода состоит в том» что будет принята неправильная гипотеза.
Правильное решение может быть принято также в двух случаях: гипотеза принимается; причем и в действительности она правильная; гипотеза отвергается, причем и в действительности она неверна.
Вероятность совершить ошибку первого рода принято обозначать q. Ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста мы рискуем допустить ошибку первого рода (отвергнуть правильную гипотезу).
1.4. Степень свободы параметра. Степень свободы у какого-либо параметра определяют числом опытов, по которым рассчитывают данный параметр, за вычетом количества констант, найденных по этим опытам независимо друг от друга.
1.5. Критическая область. Область принятия гипотезы.Для проверки нулевой гипотеза используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Ее обозначают t если она распределена по закону Стюдента, X2 - по закону "хи квадрат", F- по закону Фишера, G - по закону Кохрэна. Обозначим эту величину К
Статистическим критерием (или просто критерием) называется случайная величина К, служащая для проверки нулевой гипотезы.
Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.
Наблюдаемым значением (Кнабл) называют значение критерия, вычисленное по выборкам. .
После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества; одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое - при которых она принимается.
Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.
Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области - гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы - гипотезу принимают.
Поскольку критерий К - одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами, и, следовательно, существуют точки, которые их разделяют.
Критическими точками Ккр называют точки, отделяющие критическую область от области принятия гипотезы.
Различают, одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.
Правосторонней называют критическую область, определяемую неравенством К>Ккр , где Ккр- положительное число.
Левосторонней называют критическую область, определяемую неравенством КК1.
1.6. Критерий Стьюдентаt-критерий Стьюдента применяется, когда необходимо сделать статистический вывод, равно ли математическое ожидание M{Х} генеральной совокупности некоторому предполагаемому значению С или когда требуется построить доверительный интервал для M{Х}. Обнаружено, что случайная величина t (при независимых наблюдениях) распределена по закону Стьюдента, если Х распределена нормально:
где N- общее число наблюдений (объем выборки),
Х - среднее арифметическое случайной переменной Х;
S{Х), S{X}- среднеквадратическое отклонение соответственно единичных значений Х и среднего арифметического Х.
На рис.1.2 показаны кривые дифференциального закона распределения Ф(t) для различных степеней свободы f=N-1 , по которым вычисляют несмещенную оценку дисперсии S2{ Х } . При сравнительно небольших N кривая Ф(t) более пологая, чем нормальный закон распределения Ф(Х). При N----- кривая Ф(t) приближается к кривой нормированного нормального распределения. Из рис.1.2 видно, что t-распределение симметрично относительно t=0, поэтому в таблицах, где даны критические значения tкр = tq,f для принятого уровня значимости q и имеющегося числа степеней свободы f , задаются только положительные tкр .
Если при расчете t по формуле (1.3) при подстановке в нее вместо М{X} предполагаемого значения С окажется, что t< tкр , то можно сделать вывод о том, что гипотеза М{X} = С не противоречит результатам наблюдения при принятой уровне значимости q .
В противном случае эта гипотеза отвергается с тем же уровнем значимости q. При этом остается возможность совершить ошибку первого рода, т.е. отвергнуть верную гипотезу с вероятностью q . -
Рассмотрим использование t-критерия Стьюдента для построения доверительного интервала для математического ожидания.
При t=tкр разность [X - M{Х}] в (1.3) равна половине ширины доверительного интервала __ т.е.
Доверительный интервал, в котором с доверительной вероятностью P=I-q находится математическое ожидание M{X} , определяется следующими выражениями:
Поскольку математическое ожидание М{X} есть истинное, объективно существующее неслучайное значение, а границы интервала - случайные величины (за счет наличия в них случайных величин X и S{X}), то правильно будет говорить о том, что доверительный интервал (1.5), (1.6) с вероятностью Р = I - q накрывает М {X}.
1.7. Критерий ФишераКритерий Фишера применяется при проверке гипотезы о равенстве дисперсий двух генеральных совокупностей, распределенных по нормальному закону.
F-критерий Фишера называют дисперсионным отношением, так как он формируется как отношение двух сравниваемых несмещенных оценок дисперсий:
причем в числителе ставится большая из двух дисперсий. Расчетное F сравнивают с _____________, которое находят из таблиц, для степеней свободы _____________________________________где N1 - число элементов выборки, по который вычислена _______ .
N2 - число элементов выборки, по которым получена оценка дисперсии ________.
Если F