Методичка по Математике. Методическая разработка для самоподготовки по курсу Высшая математика, информатика
Скачать 0.49 Mb.
|
Т е м а 7 Элементы обработки медико-биологической информации В данной теме рассматриваются некоторые вопросы обработки медико- биологической информации методами математической статистики. С такой об- работкой или ее результатами приходится иметь дело врачу или фармацевту. 30 Как выяснить, каков должен быть нормальный вес новорожденного ре- бенка. Как оценить истинное содержание лекарственного вещества в одной и той же пробе, например, экстракта из лекарственного растения или в сыво- ротке крови, если повторные измерения дают различные результаты. Ответ на эти и многие другие вопросы можно получить, используя методы стати- стической обработки медико-биологической информации. Литература для подготовки к занятию по теме: Ю.В.Морозов "Основы высшей математики и статистики", М., 1998, с.131-135, 139-144. В процессе подготовки к практическому занятию по теме необходимо уметь отвечать на следующие вопросы: 1) Что такое генеральная и выборочная статистические совокупности? 2) Как рассчитать выборочную дисперсию? 3) Как рассчитать исправленную выборочную дисперсию? 4) Как рассчитать исправленное среднее квадратическое отклонение среднего выборочного? 5) Что называется доверительной вероятностью, доверительным интер- валом? 6) Как рассчитать величину доверительного интервала? Эталоны решения типовых задач и задачи для самоконтроля Задача 1. При измерении некоторой величины получены следующие зна- чения 2 , 3 ; 3 , 3 ; 1 , 3 3 2 1 = = = x x x С доверительной вероятностью 95 , 0 = p оценить истинное значение из- меренной величины. Решение Вычисляем среднее выборочное значение 2 , 3 3 2 , 3 3 , 3 1 , 3 1 = + + = = ∑ = n x x n i n B Вычисляем исправленную выборочную дисперсию 01 , 0 1 3 ) 2 , 3 2 , 3 ( ) 1 , 3 3 , 3 ( ) 1 , 3 2 , 3 ( 1 ) ( 2 2 2 1 2 2 = − − + − + − = − − = ∑ = n x x S n i B i Вычисляем полуширину доверительного интервала. Число измерений 30 < n , пользуемся распределением Стьюдента. Значение коэффициента Стью- дента находим по таблице (см. с.223 учебника Ю.В.Морозова). 3 , 4 ) ( 95 , 0 = f t , где 2 1 = − = n f Следовательно, полуширина доверительного интервала 25 , 0 3 01 , 0 3 , 4 ) ( = = = Δ n S f t x p Получаем, что x находится в интервале 25 , 0 2 , 3 25 , 0 2 , 3 + < < − Г x Следовательно, с доверительной вероятностью 95 , 0 = p истинное зна- чение измеряемой величины (генеральное среднее) находится в интервале (2,95;3,45). 31 II. Решение задачи о вычислении точечных и интервальных оценок из- меряемой величины по выборочным данным с помощью персонального компьюте- ра. Выборка (получена из массива данных приложения (табл.1) 10,59 10,65 10,4 10,45 10,56 10,52 10,68 10,35 10,29 10,68 10,54 10,68 10,38 10,52 10,59 10,35 10,53 10,4 10,5 10,59 10,73 10,9 10,52 10,51 10,68 10,3 10,68 10,42 10,35 10,68 Характеристики выборки Объем выборки, n 5 15 30 Выборочное среднее n x x n i i B ∑ = = 1 10,53 10,53 10,53 Исправленная выборочная дисперсия 1 ) ( 1 2 2 − − = ∑ = n x x S n i B i 0,01 0,02 0,02 Исправленное среднее квадратическое отклонение 2 S S = 0,10 0,13 0,15 Коэффициент Стьюдента ) ( f t p Объем выборки n=5 n=30 р=0,68 1,13 1,01 р=0,95 2,78 2,05 Доверительная вероятность Р=0,99 4,60 2,76 Интервальная оценка генерального среднего, x Δ Объем выборки n=5 n=30 р=0,68 0,05 0,03 р=0,95 0,13 0,05 Доверительная вероятность Р=0,99 0,21 0,07 ) ( ), ( x x x x x B B Г Δ + Δ − ∈ Из полученных результатов видно, что с увеличением объема выборки при одном и том же значении доверительной вероятности полуширина довери- тельного интервала уменьшается. 32 В то же время при увеличение значения доверительной вероятности и одинаковом объеме выборки полуширина доверительного интервала увеличива- ется. Приложение Для вычисления точечных и интервальных оценок на занятии приведены зна- чения некоторых случайных величин, распределенных по нормальному закону. Таблица 1 10,8 10,98 10,13 10,98 10,2 10,75 10,13 10,54 10,73 10,79 10,6 10,73 10,76 10,56 10,68 10,73 10,42 10,33 10,54 10,66 10,33 10,75 10,89 10,25 10,33 10,36 10,58 10,78 10,73 10,58 10,8 10,75 10,67 10,58 10,97 10,45 10,75 10,33 10,45 10,8 10,68 10,73 10,98 10,36 10,6 10,66 10,58 10,6 10,73 10,25 10,33 10,76 10,63 10,43 10,98 10,45 10,43 10,42 10,67 10,58 10,75 10,2 10,74 10,76 10,6 10,74 10,94 10,73 10,45 10,8 10,6 10,47 10,75 10,43 10,47 10,56 10,33 10,6 10,8 10,5 10,54 10,8 10,74 10,5 10,52 10,58 10,43 10,73 10,73 10,42 10,8 10,47 10,23 10,54 10,45 10,74 10,42 10,42 10,36 10,73 10,4 10,65 10,42 10,6 10,47 10,94 10,94 10,97 10,42 10,79 10,43 10,36 10,43 10,23 10,56 10,56 10,36 10,94 10,68 10,65 10,97 10,74 10,45 10,52 10,52 10,63 10,56 10,65 10,4 10,36 10,47 10,98 10,54 10,54 10,2 10,52 10,54 10,8 10,63 10,54 10,76 10,42 10,42 10,6 10,63 10,4 10,73 10,2 10,42 10,75 10,36 10,36 10,5 10,76 10,13 10,42 10,6 10,36 10,8 10,97 10,97 10,73 10,53 10,9 10,94 10,5 10,97 10,8 10,36 10,36 10,42 10,53 10,35 10,56 10,42 10,36 10,73 10,63 10,42 10,94 10,54 10,73 10,52 10,36 10,63 10,42 10,2 10,36 10,56 10,42 10,48 10,54 10,97 10,2 10,94 10,6 10,97 10,52 10,36 10,69 10,42 10,36 10,6 10,56 10,5 10,36 10,54 10,42 10,29 10,36 10,63 10,5 10,52 10,53 10,63 10,42 10,36 10,8 10,97 10,2 10,97 10,53 10,54 10,2 10,36 10,97 10,73 10,36 10,6 10,36 10,54 10,42 10,6 10,97 10,36 10,63 10,63 10,5 10,63 10,42 10,36 10,5 10,36 10,6 10,58 10,13 10,69 10,2 10,36 10,97 10,36 10,58 10,5 10,2 10,97 10,75 10,6 10,97 10,36 10,47 10,69 33 Таблица 2 Представленные данные показывают возраст больных язвенной болезнью (по материалам А.Ю.Котаева - кафедра хирургических болезней №2 второго л/ф). 50 41 33 48 40 29 28 46 75 75 50 51 80 53 50 24 29 32 53 52 45 30 45 70 68 65 53 69 51 25 42 50 51 34 66 42 41 54 45 31 47 30 53 40 28 52 23 54 60 48 35 53 49 45 42 51 53 67 53 80 34 70 50 52 39 49 39 31 45 51 60 33 38 33 55 44 51 53 43 55 40 65 52 49 54 47 62 63 46 67 38 51 72 39 40 46 84 54 47 50 37 49 38 58 39 64 85 53 47 51 42 48 35 58 33 36 36 57 59 44 65 60 24 32 50 23 50 34 38 52 44 30 33 51 25 39 36 24 19 49 32 32 31 22 52 49 45 61 65 84 50 29 27 62 52 34 32 19 62 56 55 45 58 26 67 44 34 73 39 53 40 59 47 35 57 36 72 56 51 63 38 26 48 38 33 30 39 44 38 58 41 52 18 58 49 46 34 42 39 23 35 43 30 56 43 40 40 58 39 46 92 51 38 24 56 35 19 63 45 39 38 37 54 53 46 48 33 47 43 52 56 42 38 60 69 45 83 37 43 62 80 66 51 32 46 57 37 46 24 65 60 31 39 44 71 61 46 41 36 46 42 36 60 38 70 64 31 62 35 83 58 41 45 49 40 40 35 33 32 27 41 29 57 42 76 55 31 58 63 44 53 36 56 50 26 30 41 29 63 61 47 62 53 60 37 49 32 48 48 41 17 47 48 31 69 50 21 30 55 35 43 31 51 57 41 67 67 46 36 85 51 46 41 43 61 43 33 39 66 45 24 32 23 36 65 46 49 38 58 24 33 56 48 60 44 44 79 36 58 62 62 55 51 50 54 33 40 24 58 47 34 44 35 49 57 32 73 50 76 40 54 24 57 62 37 30 79 47 47 89 52 54 60 59 43 47 27 33 56 45 58 28 42 35 72 65 45 50 77 65 32 40 45 53 53 52 40 66 49 80 69 30 50 74 49 53 31 57 43 46 60 64 42 28 77 62 38 41 33 26 56 68 30 28 23 68 60 50 74 79 42 31 31 23 49 56 53 25 75 53 72 43 67 50 79 51 34 41 59 39 36 74 50 61 42 72 43 63 76 78 54 48 35 46 54 45 21 40 66 32 43 71 28 26 84 48 36 41 31 30 57 26 45 37 47 48 90 43 46 57 75 65 56 48 56 48 43 59 72 50 48 69 40 61 74 Т е м а 8 Об использовании гистограмм в задачах медицинской диагностики Целью любого эксперимента является получение надежных выводов об измеряемых величинах или каких-либо функциях от них. Эта цель не дости- гается с окончанием измерений. Результаты измерений необходимо проанали- зировать и провести необходимую математическую обработку. Только после этого можно сформулировать выводы относительно величин, представляющих интерес. Если результаты измерений можно представить в виде интервально- го ряда распределения, то гистограмма является хорошей наглядной иллюст- 34 рацией экспериментальных данных. Этот графический способ представления материала широко используется в практике медицинских исследований. Литература для подготовки к занятию по теме: Ю.В.Морозов "Основы высшей математики и статистики", М., 1998, с.135-140. В процессе подготовки к практическому занятию по теме необходимо выполнить следующее: 1. Повторить следующие теоретические вопросы: 1) Что такое генеральная совокупность и выборка? 2) Дискретные и непрерывные случайные величины. 3) Статистический дискретный ряд распределения. 4) Как рассчитать выборочную среднюю? 5) Как рассчитать исправленную выборочную дисперсию и исправленное среднее квадратическое отклонение? 6) Как рассчитать полуширину доверительного интервала? П. Изучить по указанной литературе следующие теоретические вопросы: 1) Понятие частоты, плотности частоты, относительной частоты, плот- ности относительной частоты случайной величины. 2) Статистическая вероятность случайного события. 3) Функция плотности распределения вероятностей. 4) Что называется статистическим интервальным рядом распределения? Как его построить? 5) Что называется гистограммой? 6) Как вычислить среднее выборочное значение для интервального ряда распределения? 7) Как вычислить исправленную выборочную дисперсию и исправленное среднее квадратическое отклонение для интервального ряда распределения? Эталоны решения типовых задач и задачи для самоконтроля. Задача 1. В 20 экспериментах ( 20 = n ) непрерывная случайная вели- чина A принимает значения: 21, 11, 17, 23, 28,14,19,22,24,33,16,21,18,29,23,22,31,24,27,26. По этим данным составить статистический интервальный ряд распреде- ления. Решение Среди полученных результатов находим минимальное и максимальное значения случайной величины: 33 ; 11 max min = = x x Далее разность min max x x − надо разделить на равное число частей. Однако часто эта разность нацело не делится на требуемое число час- тей. В этом случае весь интервал несколько расширяется как в сторону меньших, так и в сторону больших значений. В рассматриваемой задаче удобно выбрать 5 = Δx . Тогда удобнее рассмотреть интервал (10,35). Полу- чим, что в первый интервал (10-15) попадает всего два значения перемен- ной x , а именно: 11,14. Частота 2 = m . Во второй интервал (15-20) попа- дают значения переменной x равные 17,19,16,18, из чего следует 4 = m Продолжая аналогичные рассуждения, составим таблицу, содержащую последо- вательность интервалов и соответствующих им частей, т.е. статистический интервальный ряд распределения (всего 5 интервалов, 5 = k ). 35 X 10-15 15-20 20-25 25-30 30-35 m 2 4 8 4 2 В общем виде статистический интервальный ряд распределения имеет вид таблицы: X 1 0 x x − 2 1 x x − 3 2 x x − k k x x − −1 m 1 m 2 m 3 m k m Зная частоты m и величину x Δ , найдем плотности частот ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ Δx m i и плотности относительных частот ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ Δx P * . Например, для 1-го интервала плотность частоты 4 0 5 2 = = Δx m i ; а плотность относительной частоты 02 0 520 2 * = = Δx P . Данные обработки результатов представлены в таблицах 3 и 4. Таблица 3 x 10-15 15-20 20-25 25-30 30-35 x m i Δ 0,4 0,8 1,6 0,8 0,4 Таблица 4 x 10-15 15-20 20-25 25-30 30-35 x P Δ * 0,02 0,04 0,08 0,04 0,02 Задача для самоконтроля При измерении артериального давления у 30 случайным образом ото- бранных пациентов клиники получены следующие результаты (в мм рт.ст.): 151, 166, 133, 155, 179, 148, 143, 128, 138, 172, 163, 163, 157, 158, 136, 169, 153, 142, 147, 134, 164, 167, 131, 152, 145, 176, 122, 149, 154, 161. Представить эти данные в виде интервального статистического ряда распределения. Задача 2. По результатам данных таблиц 3 и 4 построить гистограмму плот- ности частот и гистограмму плотности относительных частот. 36 Решение x m Δ x P Δ * 1,6 0,08 1,2 0,06 0,8 0,04 0,4 0,02 10 20 30 х 10 20 30 х Рис.1 Гистограмма Рис 2. Гистограмма плотности частот. плотности относительных частот. Гистограммы на рис.1 и рис.2 имеют один и тот же вид. Поэтому с точки зрения наглядности не имеет значения представлять ли данные в виде гистограммы плотности частот или гистограммы плотности относительных частот. Однако для установления вида функции плотности распределения ве- роятностей необходимо пользоваться гистограммой плотности относительных частот. Приближенно предполагаемый вид функции плотности распределения ве- роятностей показан на рис.2 пунктирной линией. Представление экспериментальных данных именно в виде гистограммы плотности относительных частот необходимо, если ставится, например, за- дача о сравнении вида распределении двух или нескольких совокупностей. В таком случае бывает полезно совмещать различные гистограммы, а это воз- можно только, если рассматриваются плотности относительных частот. Это позволяет исключить зависимость от объема выборки и ширины интервала x Δ Практика показывает, что при построении гистограммы важно правильно выбрать ширину интервала x Δ . Если число интервалов k будет мало (а ширина интервала x Δ - велика), следует ожидать, что частично информация о случайной величине x может быть потеряна. С другой стороны, если k слишком велико, ( x Δ - мало), то обработка результатов измерений будет излишне трудоемкой, не давая существенного выигрыша в информации. Практика показывает, что рационален выбор числа интервалов k в за- висимости от объема выборки с помощью таблицы 5. Таблица 5 объем выборки, n 25-40 40-60 60-100 100-200 >200 число интервалов, k 5-6 6-8 7-10 8-12 10-15 Задачи для самоконтроля 1) Измерения роста 30 случайным образом отобранных студентов дали результаты: 178, 177, 179, 163, 171, 176, 176, 180, 174, 167, 170, 175, 176, 181, 174, 175, 175, 181, 174, 180, 178, 175, 172, 176, 177, 181, 177, 177, 179, 173. 37 Построить статистический интервальный ряд распределения. Построить гистограмму плотности частот, гистограмму плотности относительных час- тот. 2) Построить гистограмму плотности частот и гистограмму плотности относительных частот величины кровяного давления у 200 практически здо- ровых женщин в возрасте 60-65 лет по данным статистического интервально- го ряда распределения. X , мм.рт.ст. 70- 80 80- 90 90- 100 100- 110 110- 120 120- 130 130- 140 140- 150 150- 160 m 1 1 5 17 36 42 57 30 11 Нарисовать приближенно функцию плотности распределения вероятно- стей. Задача 3. По результатам измерений массы (в кг) 80 девочек в возрасте 10 лет рассчитать среднее выборочное значение ( ) B x , исправленную выборочную дисперсию ( ) 2 S и исправленное среднее квадратическое отклонение ( ) S X , кг 18-22 22-26 26-30 30-34 34-38 m 10 20 35 10 5 Решение. Для расчета среднего выборочного значения интервального ряда рас- пределения прежде всего находим значения середин интервалов * x . Они вы- числяются по формуле: 2 1 * i i i x x x + = − , где 1 − i x и i x - начальное и конечное значение интервала. ( ) ( ) ( ) 36 ; 32 ; 28 2 30 26 ; 24 2 26 22 ; 20 2 22 18 * 5 * 4 * 3 * 2 * 1 = = = + = = + = = + = x x x x x Представим результаты в виде таблицы: * x 20 24 28 32 36 m 10 20 35 10 5 Найдем B x по формуле ∑ ∑ = = = k i i k i i i B m x m x 1 1 * , где k - число интервалов. 27 5 10 35 20 10 36 5 32 10 28 35 24 20 20 10 ≈ + + + + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ = B x Значение исправленной выборочной дисперсии находим по формуле ( ) 1 1 2 * 2 − − = ∑ = n x x m S k i B i i , где ∑ = = k i i m n 1 - объем выборки, ( ) ( ) ( ) ( ) ( ) ( ) [ ] 2 2 2 2 2 2 2 27 36 5 27 32 10 27 32 10 27 28 35 27 24 20 27 20 10 79 1 − + − + − + − + − + − = S ==16 38 Исправленное среднее квадратическое отклонение будет равно 4 16 ; 2 = = = S S S Таким образом, 4 ; 16 ; 27 2 = ≈ ≈ S S x B Задачи для выполнения на практическом занятии. 1) Данные о систолическом давлении крови x (в мм.рт.ст.) у 100 практически здоровых женщин в возрасте 60-69 лет приведены ниже. Построить гистограмму плотности относительных частот. Вычислить ; S x B x (мм.рт.ст.) 121 127 132 139 115 120 125 137 139 122 152 126 133 111 122 123 135 137 139 150 81 95 136 114 128 140 149 144 125 141 101 101 129 138 132 145 105 107 130 136 134 135 115 148 140 146 119 113 127 136 142 137 111 151 143 116 121 123 127 106 73 143 106 120 144 147 142 127 131 110 159 133 109 130 154 148 116 139 118 124 112 98 134 131 131 156 119 124 113 125 113 102 139 141 140 112 128 126 118 134 Указание. Для выполнения задания рекомендуется принять 70 min = x , 200 max = x , число интервалов 13 = k 2) Значения артериального давления крови x (мм.рт.ст.) у 50 женщин в возрасте 60-69 лет с диагнозом "гипертоническая болезнь", составляют: 192 145 156 177 157 186 173 162 172 194 185 149 153 182 162 193 194 165 158 166 171 151 175 161 178 126 137 176 148 159 119 152 196 165 163 173 187 154 164 137 172 144 161 179 173 187 175 164 169 171 Построить гистограмму плотности относительных частот. Вычислить ; S x B Указание. Рекомендуется выбрать 70 min = x , 200 max = x , число интерва- лов 13 = k Гистограмму следует построить под гистограммой задания 1), исполь- зуя числовую ось с тем же началом координат и масштабной единицей, что и в задании 1. Сравнить результаты. |