Систематическая ошибка. Систематическая погрешность

ОПРЕДЕЛЕНИЕ ОШИБОК ИЗМЕРЕНИЙ

Ошибки (погрешности), возникающие при измерениях, делятся на два больших класса: погрешности случайные и погрешности систематические. Для уяснения разницы между ними обратимся к конкретному примеру. Допустим, вы определяете массу тела взвешиванием его на рычажных весах. Обычно тело кладется на левую чашку весов, а разновесы – на правую. Плечи весов, разумеется, не могут быть абсолютно одинаковыми. Разница в их длине искажает результаты измерений и, притом, всегда одинаковым образом. Ошибки, сохраняющие величину и знак от опыта к опыту, носят название систематических. К систематическим относятся ошибки, связанные с неравноплечностью весов, неправильным весом гирь, неточной разбивкой шкалы измерительных приборов и т.д.

Однако, систематические ошибки не единственные причины погрешностей измерений. В том же опыте со взвешиванием тела есть ошибки, которые могут изменяться от опыта к опыту. В самом деле, коромысло весов качается с некоторым трением. Поэтому, даже при постоянной нагрузке весов, оно останавливается не всегда в одном и том же месте а в разных местах, лежащих в области, размер которой определяется силами трения. Ошибки в этом случае от опыта к опыту не повторяются.

Случайными ошибками называются ошибки, которые непредсказуемым образом изменяют свою величину и знак от опыта к опыту.

Бывают случаи, когда случайные ошибки не связаны с дефектами аппаратуры, а лежат в сущности изучаемого явления.

Так, например, если вы изучаете радиоактивный распад какого-либо радиоактивного элемента, то число зарегистрированных распадов, скажем, в 1 минуту, не будет оставаться постоянным. В одних измерениях вы зарегистрируете, например, 18,15,12,17 распадов в минуту, в других – 23, 25, 17, 22 распадов. В среднем вы получите 20 распадов в минуту. Отклонение измеренного числа распадов от среднего значения 20 распадов в минуту носит чисто случайный характер. И связано с самой природой изучаемого явления.

Влияние случайных ошибок может быть уменьшено при многократном повторении опыта, т.к. опыты, результаты которых превышают среднее значение будут встречаться столь же часто, как и опыты с результатами меньшими среднего значения.

Уменьшить же вклад систематических ошибок таким способом нельзя. Главной причиной этих погрешностей является несовершенство измерительных приборов. Поэтому для их уменьшения необходимо воспользоваться более совершенными средствами измерений, погрешность которых меньше. Качество измерительных приборов характеризуется их классом точности, т.е. той максимальной погрешностью, которую могут вносить эти приборы в измеряемую величину. Чем выше класс точности прибора тем эта погрешность ниже. Помимо необходимости совершенствовать приборы, можно изменить методику опыта. Например, в опыте со взвешиванием нужно либо уменьшить неравноплечность весов, либо взвешивать тело дважды, один раз на левой чашке весов, другой – на правой и усреднить полученные результаты.

Ошибки измеренийподразделяются на систематические и случайные.

Величина систематических ошибок одинакова во всех измерениях, проводящихся одним и тем же методом с помощью одних и тех же измерительных приборов. Различают четыре группы систематических ошибок:

1) ошибки, причина возникновения которых известна и величина которых может быть определена достаточно точно. Например, при определении результата прыжка рулеткой возможно изменение её длины за счёт различий в температуре воздуха. Это изменение можно оценить и ввести поправки в измеренный результат;

2) ошибки, причина возникновения которых известна, а величина нет. Такие ошибки зависят от класса точности измерительной аппаратуры. Например, если класс точности динамометра для измерения силовых качеств спортсменов составляет 2.0, то его показания правильны с точностью до 2% в пределах шкалы прибора. Но если проводить несколько измерений подряд, то ошибка в первом из них может быть равной 0,3%, а во втором – 2%, в третьем – 0,7% и т. д. При этом точно определить её значения для каждого из измерений нельзя;

3) ошибки, происхождение которых и величина неизвестны. Обычно они проявляются в сложных измерениях, когда не удаётся учесть все источники возможных погрешностей;

4) ошибки, связанные не столько с процессом измерения, сколько со свойствами объекта измерения. Как известно, объектами измерений в спортивной практике являются действия и движения спортсмена, его социальные, психологические, биохимические и т. п. показатели. Измерения такого типа характеризуются определённой вариативностью, и в её основе может быть множество причин. Рассмотрим следующий пример. Предположим, что при измерении времени сложной реакции хоккеистов используется методика, суммарная систематическая погрешность которой по первым трём группам не превышает 1%. Но в серии повторных измерений конкретного спортсмена получаются такие значения времени реакции (ВР): 0,653 с; 0,526 с; 0,755 с и т. д. Различия в результатах измерений обусловлены внутренними свойствами спортсменов: один из них стабилен и реагирует практически одинаково быстро во всех попытках, другой – нестабилен. Однако и эта стабильность (или нестабильность) может измениться в зависимости от утомления, эмоционального возбуждения, повышения уровня подготовленности.

Систематический контроль за спортсменами позволяет определить меру их стабильности и учитывать возможные погрешности измерений.

В некоторых случаях ошибки возникают по причинам, предсказать которые заранее невозможно. Такие ошибки называются случайными. Их выявляют и учитывают с помощью математического аппарата теории вероятностей.

Перед проведением любых измерений нужно определить источники систематических погрешностей и по возможности устранить их. Но так как полностью это сделать нельзя, то внесение поправок в результат измерения позволяет исправить его с учётом систематической погрешности.

Для устранения систематической погрешности используют:

а) тарирование – проверку показаний измерительных приборов путём сравнения их с показаниями эталонов во всём диапазоне возможных значений измеряемой величины;

б) калибровку – определение погрешностей и величины поправок.

Под случайными величинами понимают числовые характеристики случайных событий. Другими словами, случайные величины – это числовые результаты экспериментов, значения которых которые невозможно (в данное время) предсказать заранее. Случайные величины делят на дискретные и непрерывные в зависимости от того, каково множество всех возможных значений соответствующей характеристики – дискретное или же непрерывное.

Это деление довольно условно, но полезно при выборе адекватных методов исследования.

Случайные величины можно задавать разными способами. Дискретные случайные величины обычно задаются своим законом распределения. Тут каждому возможному значению x1, x2,... случайной величины X сопоставляется вероятность p1,p2,... этого значения. В результате образуется таблица, состоящая из двух строк:

Это и есть закон распределения случайной величины. Непрерывные случайные величины законом распределения задать невозможно, так как по самому своему определению их значения невозможно перенумеровать и потому задание в виде таблицы тут исключается. Однако для непрерывных случайных величин есть другой способ задания (применимый, кстати, и для дискретных величин) –это функция распределения:

равная вероятности события , которое состоит в том, что случайная величина X примет значение, меньшее заданного числа x.

14 При обработке данных используют такие характеристики случайной величины Х как моменты порядка q, т.е. математические ожидания случайной величины Xq, q = 1, 2, … Так, само математическое ожидание – это момент порядка 1. Для дискретной случайной величины момент порядка q может быть рассчитан как

Для непрерывной случайной величины

Моменты порядка q называют также начальными моментами порядка q, в отличие от родственных характеристик – центральных моментов порядка q, задаваемых формулой

Вопрос.

Диспе́рсия случа́йной величины́ - мера разброса данной случайной величины, то есть её отклонения от математического ожидания

Дисперсией дискретной случайной величины называют сумму квадратов отклонения значений случайной величины от своего математического ожидания. Дисперсия показывает величину разброса значений случайной величины от своего математического ожидания.

Пусть - случайная величина, определённая на некотором вероятностном пространстве. Тогда

D{X}=M [|X-M[X]| 2 ] , где символ M обозначает математическое ожидание.

Дисперсия любой случайной величины неотрицательна:

Если дисперсия случайной величины конечна, то конечно и её математическое ожидание;

Если случайная величина равна константе, то её дисперсия равна нулю

Дисперсия суммы двух случайных величин равна: , где - их ковариация;

Вероятность того, что истинное значение измеряемой величины лежит внутри некоторого интервала, называется доверительной вероятностью, или коэффициентом надежности, а сам интервал - доверительным интервалом. Каждой доверительной вероятности соответствует свой доверительный интервал. Однако это утверждение справедливо только при достаточно большом числе измерений (более 10), да и вероятность 0,67 не представляется достаточно надежной - примерно в каждой из трех серий измерений a может оказаться за пределами доверительного интервала. Для получения большей уверенности в том, что значение измеряемой величины лежат внутри доверительного интервала, обычно задаются доверительной вероятностью 0,95 - 0,99. Доверительный интервал для заданной доверительной вероятности учетом влияния числа измерений n можно найти, умножив стандартное отклонение среднего арифметического на так называемый коэффициент Стьюдента.

Ошибки измерения делятся на случайные (тот самый шум, о котором шла речь ранее) и систематические. Прояснить, что такое систематическая ошиб­ка, можно на следующем примере: предположим, мы немного изменим в схеме по рис. 13.3 сопротивление резистора R2. При этом у нас на опреде­ленную величину сдвинется вся шкала измерений: показания термометра бу­дут соответствовать действительности, только если мы прибавим (или вы­чтем, неважно) некоторую константу к полученной величине: / = /’ + 5, где / - «правильное» значение температуры (оно все же отличается от истинно­го значения из-за наличия случайной ошибки); /’ - показания термометра; 5 - величина систематической ошибки из-за сдвига шкалы. Более сложный случай систематической погрешности - если мы оставим R2 в покое, а не­много изменим R5, то есть изменим наклон характеристики термометра, или, как еще это называют, крутизну преобразования. Это равносильно тому, что мы умножаем показания на некий постоянный множитель к, и «правильное» значение будет тогда определяться по формуле: t = ht\ Эти виды ошибок но­сят название аддитивной и мультипликативной погрешностей.

О систематических погрешностях математическая статистика «ничего не зна­ет», она работает только с погрешностями случайными. Единственный спо­соб избавиться от систематических погрешностей (кроме, конечно, подбора прецизионных компонентов) - это процедуры калибровки (градуировки), о них мы уже говорили в этой главе ранее.

Случайные ошибки измерения и их оценка

я предполагаю, что читатель знаком с таким понятием, как вероятность. Ес­ли же нет - настоятельно рекомендую книгу , которая есть переиздание труда от 1946 г. Расширить кругозор вам поможет классический учебник , который отличает исключительная внятность изложения (автор его, извест­ный математик Елена Сергеевна Вентцель, кроме научной и преподаватель­ской деятельности, также писала художественную литературу под псевдони­мом И. Грекова). Более конкретные сведения о приложении методов математической статистики к задачам метрологии и обработки эксперимен­тальных данных, в том числе с использованием компьютера, вы можете най­ти, например, в . Мы же остановимся на главном - расчете случайной по­грешности.

В основе математической статистики лежит понятие о нормальном распре­делении. Не следует думать, что это нечто заумное - вся теория вероятно­стей и матстатистика, как прикладная дисциплина, в особенности, основа­ны на здравом смысле в большей степени, чем какой-либо другой раздел математики.

Не составляет исключения и нормальный закон распределения, который на­глядно можно пояснить так. Представьте себе, что вы ждете автобус на оста­новке. Предположим, что автопарк работает честно, и надпись на табличке «интервал 15 мин» соответствует действительности. Пусть также известно, что предыдущий автобус отправился от остановки ровно в 10:00. Вопрос - во сколько отправится следующий?

Как бы идеально ни работал автопарк, совершенно ясно, что ровно в 10:15 следующий автобус отправится вряд ли. Пусть даже автобус выехал из парка по графику, но тут же был вынужден его нарушить из-за аварии на перекре­стке. Потом его задержал перебегающий дорогу школьник. Потом он просто­ял на остановке из-за старушки с огромной клетчатой сумкой, которая за­стряла в дверях. Означает ли это, что автобус всегда только опаздывает? От­нюдь, у водителя есть план, и он заинтересован в том, чтобы двигаться побы­стрее, потому он может кое-где и опережать график, не гнушаясь иногда и нарушением правил движения. Поэтому событие, заключающееся в том, что автобус отправится в 10.15, имеет лишь определенную вероятность, не более.

Если поразмыслить, то станет ясно, что вероятность того, что следующий автобус отправится от остановки в определенный момент, зависит также от того, насколько точно мы определяем этот момент. Ясно, что вероятность отправления в промежутке от 10.10 до 10.20 гораздо выше, чем в промежутке от 10.14 до 10.16, а в промежутке от 10 до 11 часов оно, если не возникли ка­кие-то форс-мажорные обстоятельства, скорее всего, произойдет наверняка. Чем точнее мы определяем момент события, тем меньше вероятность того, что оно произойдет именно в этот момент, и в пределе вероятность того, что любое событие произойдет ровно в указанный момент времени, равна нулю.

Такое кажущееся противоречие (на которое, между прочим, обращал внима­ние еще великий отечественный математик Колмогоров) на практике разре­шается стандартным для математики способом: мы принимаем за момент события некий малый интервал времени 5/. Вероятность того, что событие произойдет в этом интервале, уже равна не нулю, а некоей конечной величи­не бЛ а их отношение 5P/5t при устремлении интервала времени к нулю рав­на для данного момента времени некоей величине /?, именуемой плотностью распределения вероятностей. Такое определение совершенно аналогично определению плотности физического тела (в самом деле, масса исчезающе малого объема тела также стремится к нулю, но отношение массы к объему конечно) и потому многие понятия математической статистики имеют назва­ния, заимствованные из соответствующих разделов физики.

Правильно сформулированный вопрос по поводу автобуса звучал бы так: ка­ково распределение плотности вероятностей отправления автобуса во време­ни? Зная эту закономерность, мы можем всегда сказать, какова вероятность того, что автобус отправится в определенный промежуток времени.

Интуитивно форму кривой распределения плотности вероятностей опреде­лить несложно. Существует ли вероятность того, что конкретный автобус отправится, к примеру, позже 10:30 или, наоборот, даже раньше предыдуще­го автобуса? А почему нет - подобные ситуации в реальности представить себе очень легко. Однако ясно, что такая вероятность намного меньше, чем вероятность прихода «около 10:15». Чем дальше в обе стороны мы удаляемся от этого центрального наиболее вероятного срока, тем меньше плотность ве­роятности, пока она не станет практически равной нулю (то, что автобус за­держится на сутки - событие невероятное, скорее всего, если такое случи­лось, вам уже будет не до автобусов). То есть распределение плотностей ве­роятностей должно иметь вид некоей колоколообразной кривой.

В теории вероятностей доказывается, что при некоторых предположениях относительно вероятности конкретных исходов нашего события, эта кривая будет иметь совершенно определенный вид, который называется нормаль­ным распределением вероятностей или распределением Гаусса. Вид кривой плотности нормального распределения и соответствующая формула показа­ны на рис. 13.5.

Рис. 13.5. Плотность нормального распределения вероятностей

Далее мы поясним смысл отдельных параметров в этой формуле, а пока отве­тим на вопрос: действительно ли реальные события, в частности, интере­сующие нас ошибки измерения, всегда имеют нормальное распределение? Строгого ответа на этот вопрос в общем случае нет, и вот по какой причине. Математики имеют дело с абстракциями, считая, что мы уже имеем сколь угодно большой набор отдельных реализаций события (в случае с автобусом это была бы бесконечная таблица пар значений «плотность вероятности - время»). В реальной жизни такой ряд невозможно получить не только пото­му, что для этого потребовалось бы бесконечно долго стоять около остановки и отмечать моменты отправления, но и потому, что стройная картина непре­рывного ряда реализаций одного события (прихода конкретного автобуса) будет в конце концов нарушена совершенно не относящимися к делу веща­ми: маршрут могут отменить, остановку перепестри, автопарк обанкротится, не выдержав конкуренции с маршрутными такси… да мало ли что может произойти такого, что сделает бессмысленным само определение события.

Однако все же интуитивно понятно, что, пока автобус ходит, какое-то, пусть теоретическое, распределение имеется. Такой идеальный бесконеч­ный набор реализаций данного события носит название генеральной сово­купности. Именно генеральная совокупность при некоторых условиях мо­жет иметь, в частности, нормальное распределение. В реальности же мы имеем дело с выборкой из этой генеральной совокупности. Причем одна из важнейших задач, решаемых в математической статистике, состоит в том, чтобы имея на руках две разных выборки, доказать, что они принадлежат одной и той же генеральной совокупности - проще говоря, что перед нами есть реализации одного и того же события. Другая важнейшая для практи­ки задача состоит в том, чтобы по выборке определить вид кривой распре­деления и ее параметры.

На свете сколько угодно случайных событий и процессов, имеющих распре­деление, совершенно отличное от нормального, однако считается (и доказы­вается с помощью т. н. центральной предельной теоремы), что в интересую­щей нас области ошибок измерений при большом числе измерений и истинно случайном их характере, все распределения ошибок - нормальные. Предпо­ложение о большом числе измерений не слишком жесткое - реально доста­точно полутора-двух дес5Гтков измерений, чтобы все теоретические соотно­шения с большой степенью точности соблюдались на практике. А вот про истинную случайность ошибки каждого из измерений можно говорить с из­рядной долей условности: неслучайными их может сделать одно только же­лание экспериментатора побыстрее закончить рабочий день. Но математика тут уже бессильна.

Полученные опытным путем характеристики распределения называются оценками параметров, и, естественно, они будут соответствовать «настоя­щим» значениям с некоторой долей вероятности - наша задача и состоит в том, чтобы определить интервал, в котором могут находиться отклонения оценок от «истинного» значения и соответствующую ему вероятность. Но настало время все же пояснить - что же это за параметры?

в формуле на рис. 13.5 таких параметра два- величины ц и а. Они называ­ется моментами нормального распределения (аналогично моментам распре­деления масс в механике). Параметр ц называется математическим ожидани­ем (или моментом распределения первого порядка), а величина а - средним квадратическим отклонением. Нередко употребляют его квадрат, обозначае­мый как D или просто и носящий название дисперсии (или центрального момента второго порядка).

Математическое ожидание есть абсцисса максимума кривой нормального распределения (в нашем примере с автобусом это время 10:15), а дисперсия, как видно из рис. 13.5, характеризует «размытие» кривой относительно этого максимума- чем больше дисперсия, тем положе кривая. Этим моменты имеют прозрачный физический смысл (вспомните аналогию с фи^зическим распределением плотностей): математическое ожидание есть аналогия цен­тра масс некоего тела, а дисперсия характеризует распределение масс отно­сительно этого центра (хотя распределение плотности материи в физическом теле далеко от нормального распределения плотности вероятности).

Оценкой гпх математического ожидания ц служит хорошо знакомое нам со школы среднее арифметическое:

Здесь п- число измерений; /- текущий номер измерения (/= l,…,w); дс/ - значение измеряемой величины в /-м случае.

Оценка дисперсии вычисляется по формуле:

(2)

Оценка среднего квадратического отклонения, соответственно, будет:

Здесь (jc, – гПх) - отклонения конкретных измерений от ранее вычисленного среднего.

Следует особо обратить внимание, что сумму квадратов отклонений делить следует именно на « – 1, а не на «, как может показаться на первый взгляд, иначе оценка получится смещенной. Второе, на что следует обратить внима­ние - разброс относительно среднего характеризует именно среднее квадра-тическое отклонение, вычисленное по формулам (2) и (3), а не среднее арифметическое отклонение, как рекомендуют в некоторых школьных справочни­ках - последнее дает заниженную и смещенную оценку (не напоминает ли вам это аналогию со средним арифметическим и действующим значениями переменного напряжения?).

Заметки на полях

Кроме математического ожидания, средние значения распределения вероят­ностей характеризуют еще величинами, называемыми модой и медианой. В случае нормального распределения все три величины совпадают, но в дру­гих случаях они могут оказаться полезными: мода есть абсцисса наивероят-нейшего значения (то есть максимума на кривой распределения, что полно­стью отвечает бытовому понятию о моде), а медиана выборки есть такая точка, что половина выборки лежит левее ее, а вторая половина - правее.

В принципе этими формулами для расчета случайных погрешностей можно было бы ограничиться, если бы не один важный вопрос: оценки-то мы полу­чили, а вот в какой степени они отвечают действительности? Правильно сформулированный вопрос будет звучать так: какова вероятность того, что среднее арифметическое отклоняется от «истинного» значения (то есть мате­матического ожидания) не более чем на некоторою величину 8 (например, на величину оценки среднего квадратического отклонения s)?

Величина 5 носит название доверительного интервала, а соответствующая вероятность - доверительной вероятностью (или надежностью). Обычно решают задачу, противоположную сформулированной: задаются величиной надежности и вычисляют доверительный интервал 5. В технике принято за­даваться величиной надежности 95%, в очень уж серьезных случаях - 99%. Простейшее правило для обычных измерений в этом случае таково: при уело-вии достаточно большого числа измерений (практически - более 15-20) доверительной вероятности в 95% соответствует доверительный интер­вал в 2Sy а доверительной вероятности в 99% - доверительный интервал в 3s. Это известное правило «трех сигма», согласно которому за пределы утро­енного квадратического отклонения не выйдет ни один результат измерения, но на практике это слишком жесткое требование. Если мы не поленимся про­вести не менее полутора десятков отдельных измерений величины дс, то с чистой совестью можем записать, что результат будет равен

Систематическая ошибка – это смягченное выражение, заменяющее слова «ошибка экспериментатора».

Систематические ошибки остаются, как правило, постоянными на протяжении всей серии опытов. Величина их может быть и известной, и неизвестной заранее. Например, курс шхуны «Пилигрим» содержал неизвестную Дику Сэнду, но известную Негоро систематическую ошибку.

Систематические погрешности могут быть обусловлены различными причинами:

· ограниченной точностью изготовления прибора (погрешностью прибора). Шкала линейки может быть нанесена неточно (неравномерно); взвешивание может производиться с помощью неточных гирь; положение нуля термометра может не соответствовать нулевой температуре; капилляр термометра может иметь разное сечение в разных участках шкалы; стрелка амперметра может не располагаться на нуле в отсутствие электрического тока через прибор;

· такие ошибки часто возникают из-за того, что реальная установка в чем-то отличается от идеальной, или условия эксперимента отличаются от предполагаемых теорией, а поправки на это несоответствие не делаются. Систематическая погрешность возникает при измерении массы, если не учитывается действие выталкивающей силы воздуха на взвешиваемое тело и на разновесы; при измерениях объема жидкости или газа, если не учитывается тепловое расширение; при калориметрических измерениях, если не учитывается теплообмен прибора с окружающей средой. Другими примерами эффектов, которыми может быть обусловлена обсуждаемая ошибка, являются термо-ЭДС в контактах, сопротивление подводящих проводов, «мертвое» время счетчиков частиц;

· систематические ошибки могут быть обусловлены также неправильным выбором метода измерений. Например, мы совершим такую ошибку, определяя плотность какого-то материала посредством измерений объема и веса образца, если этот образец содержит внутри пустоты, например, пузыри воздуха, попавшие туда при отливке;

· мы допускаем систематическую погрешность, округляя численную величину до какого-либо приближенного значения, например, полагая π = 3, π = 3.1, π = 3.14 и т. д. вместо π = 3.14159265…



При наличии скрытой систематической погрешности результат, приведенный с незначительной ошибкой, будет выглядеть вполне надежным, хотя на самом деле он является неверным.

Классическим примером может служить опыт Милликена по измерению элементарного электрического заряда e . В этом эксперименте требуется знать вязкость воздуха. Милликен взял заниженную величину вязкости и получил

e = (1.591 ± 0.002)∙10 - 19 Кл.

В настоящее же время принято значение

e = (1.60210 ± 0.00002)∙10 - 19 Кл.

Долгое время величины ряда других атомных констант, таких, как постоянная Планка и число Авогадро, базировались на значении элементарного электрического заряда e , полученном Милликеном, и, следовательно, содержали ошибку, превышающую 0.5 %.

Систематические ошибки не поддаются математическому анализу, и поэтому их нужно выявить и устранить . Если удается обнаружить причину и найти величину сдвига (например, вес вытесненного телом воздуха при точном взвешивании), то систематическую погрешность можно исключить введением поправки к измеренному значению. Однако общих рецептов и универсальных правил, позволяющих обнаружить систематические ошибки конкретного измерения, не существует Выявление, оценка и устранение таких ошибок требует опыта, догадки и интуиции экспериментатора. Нужно тщательно продумывать методику опытов и придирчиво выбирать аппаратуру. Иногда систематическую ошибку, обусловленную измерительным прибором, можно уменьшить, используя более точный прибор, желательно, другого типа. Наиболее действенный способ обнаружения систематических ошибок – это сравнение результатов измерений одной и той же величины, выполненных принципиально разными методами.

Случайная ошибка

Случайные ошибки проявляются в разбросе отсчетов при повторении измерений в одних и тех же доступных контролю условиях.

Величина случайных ошибок различна даже для измерений, выполненных одинаковым образом. Случайные ошибки происходят вследствие меняющихся от измерения к измерению неконтролируемых причин, действие которых неодинаково в каждом опыте и не всегда может быть учтено. Даже при взвешивании одними и теми же гирями мы, вообще говоря, будем получать разные значения веса. Источниками ошибок могут быть, например, колебания воздуха, воздействующие неодинаково на чашки весов; пылинка, осевшая на одну из чашек; нагревание одной половины коромысла от приближения руки взвешивающего; разное трение в правом и левом подвесах чашек и множество других причин, которые практически невозможно учесть. При измерениях периода колебаний маятника с помощью секундомера скажутся погрешности моментов пуска и остановки секундомера, ошибка в величине отсчета, небольшая неравномерность движения маятника вследствие трения. Случайные погрешности вызываются также сотрясениями здания. В опытах по измерению скорости радиоактивного распада ядер сама определяемая величина определена лишь статистически, как некоторое среднее значение, и флуктуации числа распадов в равные промежутки времени будут наблюдаться даже при идеально точной аппаратуре.

Проделав измерения и используя методы обработки, основанные на теории ошибок, можно дать оценку случайной ошибки и указать вероятность, с которой истинное значение измеряемой величины находится внутри некоторого доверительного интервала.

Случайную ошибку можно уменьшить путем многократного повторения измерений.

Промах

Следует особо выделить такой вид ошибок, как грубый просчет, или промах. Под промахом понимается ошибка, сделанная вследствие неверной записи показаний прибора, недосмотра экспериментатора, или вызванная неисправностями аппаратуры. Например, неправильно записанный отсчет, замыкание электрической цепи являются промахами, которых следует по возможности избегать.

В качестве примера промаха при взвешивании можно привести запись веса 100.20 г вместо 1000.20 г. При измерениях длины метровой линейкой промах может появиться, если один из концов измеряемого предмета окажется совмещенным не с нулевым делением линейки, а, скажем, с делением 10 см.

Если серия из небольшого числа измерений содержит грубую ошибку – промах, то наличие этого промаха может сильно исказить как среднее значение <x > измеряемой величины, так и погрешность измерения D.x . Поэтому такой промах необходимо исключить из окончательного результата. Обычно промах имеет значение, резко отличающееся от других данных. Иногда промах удается выявить, повторив измерение.

Для устранения промахов нужно соблюдать аккуратность и тщательность в работе и записи данных. Как правило, грубые ошибки могут быть обнаружены, поэтому результаты таких измерений следует отбрасывать.

Систематическая ошибка -- это систематическое (неслучайное, однонаправленное) отклонение результатов исследований от истинных значений. Выделяют несколько основных видов систематических ошибок.

Систематическая ошибка, обусловленная нарушением правил подбора пациентов (selection bias). Она чаще всего возникает на этапе формирования исследуемых групп в результате отбора для включения в исследование лиц, которые не являются репрезентативными для общей совокупности больных. Эта систематическая ошибка создаётся в результате того, что сравниваемые группы испытуемых различаются не только по основным признакам, но и по другим факторам, влияющим на результат исследования, т.е. участники фактически отбираются из разных популяций.

Пример: в том случае, когда в качестве группы контроля используются ранее набранные больные, а методика их обследования с течением времени претерпела изменения, наступает хронологическое смещение.

Пример: в исследование включаются добровольцы, сами откликнувшиеся на объявление об исследовании.

Систематическая ошибка отбора может приводить в ИСК к формированию контрольной группы, плохо сопоставимой с основной группой. Например, при формировании контрольной группы из больных с другим заболеванием вмешиваются привходящие факторы, связанные с этой болезнью. С другой стороны, если контрольная группа формируется из общей популяции, то результаты могут оказаться несопоставимыми с основной группой, например, по возрасту и полу. Для предотвращения этой ошибки нужно подбирать пациентов попарно в контрольную и основную группы по нескольким признакам, потенциально влияющим на изучаемые показатели. Другой вариант предотвратить ошибку - использовать несколько контрольных групп.

Ошибка подбора, более характерная для ИСК, может возникать и в РКИ, если, например, из контрольной группы теряются самые тяжелые пациенты.

Систематическая ошибка, возникающая при измерении, вследствие неудачно выбранного метода оценки результатов исследования. Подобная ошибка появляется тогда, когда пациенты в сравниваемых группах обследуются неодинаково (разные методы диагностики, частота обследований) или используются нестандартизованные схемы получения данных и субъективные оценки.

Субъективная оценка в большинстве случаев даёт завышенный результат по сравнению с оценкой независимого эксперта и/или объективными методами.

Пример: ошибка вследствие различия в степени подробности сбора анамнеза в группах больных и здоровых.

Пример: рентгенологи, если проводят оценку рентгенограмм, зная дополнительную информацию о пациенте, могут более пристально и критически оценивать «контрольных» пациентов, по сравнению с «получающими активное лечение».

Систематическая ошибка, обусловленная действием вмешивающихся факторов (confounding), проявляется тогда, когда изучаемые факторы взаимосвязаны, и одни из них искажают эффекты других. Это может произойти из-за систематической ошибки при отборе, под действием случайности или из-за реального взаимодействия факторов, что должно учитываться при анализе результатов исследования.

Пример: при проведении исследования влияния потребления овощей на возникновение заболевания, не была учтена разная распространенность второго фактора риска (например, курения) в сравниваемых группах.

Систематическая ошибка, обусловленная эффектом плацебо . «Эффект пустышки» - систематическое улучшение состояния пациентов при имитации лечения. Если в контрольной группе проводится лечение, внешне не отличимое от активного в группе вмешательства, то разница между этими группами исключает эффект плацебо.

В ходе наблюдения за больными у них наблюдается улучшение состояния. Часть этого эффекта объясняется естественным течением болезни, часть - неспецифическим влиянием лечения (эффект плацебо), а разница между группами соответствует дополнительной пользе, приносимой активным лечением. РКИ специально планируются так, чтобы отсеять все эффекты, за исключением собственно эффекта активного лечения.

Рисунок 1. Выявление эффекта активного лечения по сравнению с плацебо

Способы устранения систематических ошибок

Наиболее частыми источниками погрешностей при проведении КИ являются ожидания исследователей и испытуемых, влияние которых можно уменьшить путём использования стандартных способов контроля с использованием: анамнез лечение плацебо

грамотного отбора испытуемых в контрольные группы;

метода «ослепления» (маскирование вмешательства);

рандомизации (со стратификацией или без неё) при формировании различных групп испытуемых;

методов статистического моделирования.

Испытания с самоконтролем - для экспериментальной и контрольной групп привлекается один объект, например, пациент в отдельные дни получает лечение, в другие - плацебо.

Перекрестное испытание - одни пациенты выбираются для экспериментальной группы, другие - для контрольной; после остановки лечения в новом периоде группа лечения становится контрольной, а контрольная - группой лечения. При обобщенном рассмотрении результатов получается, что каждый пациент был сам себе контролем.


Рисунок 2. Источники систематических ошибок и методы борьбы с ними

Испытания с подобранным контролем - проводятся путём подбора контроля к каждому случаю так, чтобы они не отличались ни по одному из подозреваемых факторов. Это позволяет избежать различий между группами, связанных с известными факторами, которые не интересны в данном исследовании. Например, при изучении связи болезни с особенностями питания путем подбора контрольных лиц можно исключить влияние на здоровье дохода и курения. При подборе сравниваются различия не между всеми случаями и контролем, а совокупность различий внутри отдельных пар.

Метод маскирования вмешательств («слепое» исследование, ослепление)

Немаскируемый (открытый) метод выполнения РКИ - испытуемый и исследователь знают о лечении, которое получает испытуемый. При этом, например, испытуемый в контрольной группе может начать лечиться другими средствами и разница между группами исчезнет.

Простой слепой метод - испытуемый не знает, какое лечение он получает. Метод чреват ошибками, связанными с тем, что врач и другие медицинские работники будут относиться по-разному к ведению пациентов, получающих активное лечение и плацебо (старое и новое вмешательство).

Двойной слепой метод - исследователь и пациент не знают, какое лечение получает он или группа.

Тройной слепой метод - исследователь, пациент и руководители КИ, организующие исследование и анализирующие его результаты, не знают, какое лечение получает группа.

Рандомизация - способ распределения испытуемых в группы в случайной последовательности - с использованием таблицы случайных чисел или иного правильного метода. Рандомизация - обязательное свойство правильного проведения КИ, которое в таком случае называется рандомизированным. Использование случайных чисел гарантирует, что вероятность попадания в конкретную группу лечения одинакова для всех испытуемых. Рандомизация используется не только при проведении КИ, но и при проведении исследований на экспериментальных животных.

В настоящее время РКИ стали стандартом клинических испытаний. Разработаны разные методы рандомизации -рандомизация пациентов по группам, парная рандомизация, факторная, адаптивная и ряд других.


Рисунок 3. Схематическое изображение РКИ

Правильными методами рандомизации являются использование таблиц случайных чисел и компьютерных программ, а также иногда бросание монеты, т.е. методы, которые генерируют случайную последовательность распределения пациентов по группам.

Однако надо отметить, что, несмотря на всеобщее признание, суть рандомизации нередко понимают неверно и вместо случайного распределения испытуемых прибегают к упрощенным способам (по алфавиту, датам рождения, дням недели и т.д.) и даже допускают произвольное распределение в группы. Подобная «псевдорандомизация» не даёт ожидаемых результатов.

Стратификация - используется с целью обеспечения равного распределения испытуемых по группам лечения с учетом факторов, существенно влияющих на исход, например, возраста, длительности болезни и т.д. Иными словами, например, пациенты-мужчины рандомизируются независимо от женщин. Стратификация гарантирует одинаковое распределение указанных факторов в группах лечения.

Статистическое моделирование - применяется для оценки силы связи и эффекта воздействия с одновременным учётом действия множества переменных. Наиболее распространенным методом статистического моделирования вероятности качественных событий (госпитализация, смерть) является множественная логистическая регрессия.



Просмотров