Н. В. Перцев планирование и математическая обработка результатов химического эксперимента учебное пособие



страница14/46
Дата26.06.2015
Размер4.46 Mb.
1   ...   10   11   12   13   14   15   16   17   ...   46

3.3. Выборочные параметры


Для выборок малого объема можно вычислить некоторые параметры. Их рассчитывают без всяких априорных допущений о характере распределения вариант; это эмпирические характеристики. Выборочные параметры разделяют на две большие группы:

1. Характеристики центра рассеяния (среднее арифметическое, среднее геометрическое, мода, медиана и др.). Среднее арифметическое = 1/n хi. – наиболее важная из характеристик этой группы. Если число вариант велико и результаты были классифицированы, среднее арифметическое рассчитывают с учетом заселенности каждого класса по формуле = f i xdi .

Доказано, что если нет систематических ошибок, то при достаточно большом (n > 30) числе повторных измерений  Q, где Q – действительное значение измеряемой величины. То есть приблизительно соответствует «правильному» измерению. Но при малых n не следует пренебрегать возможностью случайного отличия найденного среднего арифметического от истинного значения измеряемой величины, даже если выборка репрезентативна. Для оценки Q в этих случаях рассчитывают доверительные интервалы.

Среднее геометрическое используют в тех случаях, когда предполагают, что распределение имеет логарифмически нормальный характер, например, при определении «следов» или обработке полуколичественных результатов измерений с очень большим разбросом вариант. Варианты с отрицательными или нулевыми значениями при расчете отбрасывают. Применяют формулы:

или lg = 1/n

Мода (Мо) – наиболее часто встречающаяся в выборке варианта, она соответствуют максимуму на гистограмме, т. е. среднему значению признака в наиболее заселенном классе. Медиана (Ме) – значение варианты, которое стоит точно посередине ранжированной совокупности. Так, при четном n медиана – полусумма двух вариант, стоящих посередине ряда; при нечетном – варианта, равноотстоящая от обоих концов ряда. Так, в выборке 5, 7, 8, 10 медиана равна (7+8) : 2 = 7,5; в выборке 5, 8, 10 медиана равна 8. Моду и медиану используют для больших совокупностей, они мало чувствительны к характеру разброса вариант относительно центра рассеяния. Приблизительное равенство моды, медианы и среднего арифметического указывает на симметричное распределение вариант в выборке.

2. Характеристики степени рассеяния вариант относительно некоторого центра рассеяния (практически всегда – относительно ) В эту группу выборочных параметров входят дисперсия, среднее отклонение, стандартное отклонение, относительное стандартное отклонение, коэффициент вариации, размах и некоторые другие характеристики.



Дисперсия обозначается как S2 и рассчитывается по формуле (3.1). Она имеет размерность.

S 2 = . (3.1)

Величина выборочной дисперсии (S2), полученная по результатам n повторных независимых измерений одной и той же случайной величины, при n → ∞ стремится к предельному значению, называемому дисперсией генеральной совокупности и обозначаемому как 2. Обычно в химических исследованиях величину2 оценивают по формуле (3.2), применимой при n >30:

2 . (3.2)

Дисперсии используют при сравнении выборок, а также при выявлении относительного вклада разных факторов в общую погрешность измерений (дисперсионный анализ). Расчеты дисперсий по приведенным выше «классическим» формулам без компьютера или программируемого микрокалькулятора требуют слишком много времени. Для облегчения расчетов применяют ряд приемов:

1) все варианты увеличивают или уменьшают на постоянную поправку А (обычно берут целочисленную ). Так, вместо того, чтобы обрабатывать выборку 101, 103, 98, 100, 99, можно воспользоваться выборкой 1, 3, –2, 0, –1. Дисперсия при таком преобразовании не изменится;

2) все варианты выборки можно заранее увеличить в 10n раз, до целочисленных значений. Получив дисперсию по новой выборке, ее умножают на 102n ;

3) при расчетах дисперсий можно использовать формулы, не содержащие отклонений отдельных вариант от среднего арифметического:

S2 = = . (3.3)

Если случайные величины (результаты измерений) складывают, или перемножают, или совершают какие-то другие действия над случайными величинами, то дисперсию результата вычисляют по особым правилам (см. [9]). В ряде руководств выборочные дисперсии обозначают иными символами (V или D).



Стандартное отклонение – основная характеристика разброса вариант. Имеет ту же размерность, что и сами варианты. Эту величину также называют средней квадратической ошибкой или средним квадратическим отклонением отдельного измерения. Для характеристики небольших выборок (n 30) используют выборочное стандартное отклонение S, рассчитывая его по формуле (3.4):

S = (3.4)

. (3.5)

Стандартное отклонение генеральной совокупности обозначают  и при n > 30 оценивают его по формуле (3.5). В обоих случаях берут только положительное значение корня.

Относительное стандартное отклонение Sr – безразмерная величина, которую находят при делении S на . Это очень важный показатель, характеризующий воспроизводимость (сходимость) методики измерений. Коэффициент вариации W (или cv) – то же, что и относительное стандартное отклонение, но выраженное в процентах. Очевидно, W= 100 Sr .

Среднее отклонение D = 1/n |хi | широко использовалось в прошлом, но сейчас выходит из употребления, так как величина D не входит в формулы, описывающие теоретические распределения случайных величин. Для расчета D отклонения отдельных вариант от среднего арифметического берут по модулю, иначе они бы при суммировании компенсировали друг друга.

Размах R равен разности хmax хmin. Считать его легко, но по величине R нельзя судить о характере распределения вариант в выборке. Хотя размах не является основной характеристикой выборки, в некоторых случаях можно использовать его для оценки гораздо более важного выборочного параметра – стандартного отклонения. Дин и Диксон предложили вместо трудоемкого расчета S умножать размах R на некоторый табличный коэффициент k*, зависящий от числа вариант в выборке. Так, по Дину и Диксону для n =5 k* =0,43. Примером может быть выборка 14,5; 14,7; 14,3; 14,4; 14,1. В данной выборке размах равен 0,6; величина S примерно равна 0,6 · 0,43  0,26. Обычный метод расчета дает S = 0,22. Расхождение относительно невелико. Однако метод Дина и Диксона следует применять очень осторожно, так как правильные результаты получаются лишь при отсутствии грубых промахов (размах очень чувствителен к ним) и лишь при нормальном распределении.

Наиболее важные параметры выборки – среднее арифметическое и стандартное отклонение. Именно их используют, проверяя характер распределения.



1   ...   10   11   12   13   14   15   16   17   ...   46


База данных защищена авторским правом ©zubstom.ru 2015
обратиться к администрации

    Главная страница