Составитель Борис Демешев
Скачать 1.58 Mb.
|
Будет ли оценка веса первого слитка смещенной? Будет ли она лучше чем усреднить семь взвешиваний по 1-му слитку Задача 22.10. Есть два золотых слитка, разных повесу. Сначала взвесили первый слиток и получили результат. Затем взвесили второй слиток и получили результат 𝑌 . Затем взвесили оба слитка и получили результат 𝑍. Допустим, что ошибка каждого взвешивания - это случайная величина с нулевым средними дисперсией а) Придумайте наилучшую оценку веса первого слитка. б) Сравните придуманную Вами оценку с оценкой, получаемой путем усреднения двух взвешиваний первого слитка. Задача 22.11. Задача по эконометрике? Given a weighing device and two balls. Weigh the first ball using the weighing device, we get a value X; weigh the second ball using the weighing device, we get a value Y; weigh the two balls together, we get a value Z. Suppose that each time the error in the weights is an iid random variable, for example, 𝑋 = 𝑎 + 𝑅 𝑎 , 𝑌 = 𝑏 + 𝑅 𝑏 , 𝑍 = 𝑎 + 𝑏 + 𝑅 𝑐 , where 𝑅 𝑎 , 𝑅 𝑏 , 𝑅 𝑐 are iid. How do you get the best estimation of the first ball’s the real weight (i.e., a). We don’t know the distribution of the R’s. best - unbiased, min Задача 𝑖𝑖𝑑 , какая из приведенных оценок для 𝑉 𝑎𝑟 (является несмещенной а) 𝑋 2 1 − 𝑋 1 𝑋 2 ; б ¯ 𝑋 ) 2 𝑛 ; в ¯ 𝑋 ) 2 𝑛−1 ; где) 𝑋 1 𝑋 2 Задача 22.13. Случайные величины распределены равномерно на отрезке [0; 𝑎], известно, что 𝑎 > 10. Исследователь хочет оценить параметра) Используя постройте несмещенную оценку ˆ𝜃 для б) Найдите дисперсию построенной оценки в) Является ли построенная оценка состоятельной? Задача 22.14. Пусть 𝑋 1 , ... независимы и равномерно распределены на [0; 𝑘], где 𝑘 ∈ [1; 2] - неизвестный параметра) Постройте несмещенную оценку для 𝑘 вида ˆ𝑘 = 𝑐 · б) Постройте несмещенную оценку для 𝑘 видав) Постройте несмещенную оценку для 𝑘 вида ˆ𝑘 = 𝑐 · max{𝑋 1 , ..., г) Какая из них является наиболее эффективной? Задача 22.15. Пусть независимы, одинаково распределены с функцией плотности 𝑝(𝑡) = {︂ 2𝑡/𝑘 2 , 𝑡 ∈ [0; 𝑘] 0, иначе По имеющейся выборке 𝑋 1 , 𝑋 2 , ... 𝑋 𝑛 : ТВИМС-задачник. Демешев Бориса) Оцените медиану этого распределение методом максимального правдоподобия б) Оцените медиану этого распределения методом моментов, используя Задача 𝑋 𝑖 - iid with pdf given by: 𝑝(𝑡) = {︃ 𝑒 −𝑡/𝜆 𝜇+𝜆 , 𝑡 ≥ 0 𝑒 𝑡/𝜇 𝜇+𝜆 , 𝑡 < 0 You are given a sample of 𝑋 1 , ... 𝑋 𝑛 a) Find ML estimators for 𝜇 and 𝜆 Hint: You may found useful the following notation: 𝑆 + - sum of all positive 𝑋 𝑖 𝑆 − - sum of all negative 𝑋 𝑖 b) Let 𝑛 = 1, is the estimator of 𝜆 is unbiased? Задача 22.17. Пусть 𝑋 1 , 𝑋 2 , 𝑋 3 - независимы, одинаково распределены с плотностью) = {︂ 𝑒 𝑘−𝑡 , 𝑡 ≥ 𝑘 0, 𝑡 < Являются ли следующие оценки для 𝑘 несмещенными? Какая из оценок будет наиболее эффективной? Задача 22.18. Пусть 𝑋 𝑖 - iid, 𝑈[−𝑏; 𝑏]. Имеется выборка из х наблюдений. Вася строит оценку для 𝑏 по формуле = 𝑐 · (|𝑋 1 | + |𝑋 2 |) a) При каком 𝑐 оценка будет несмещенной? б) При каком 𝑐 оценка будет минимизировать среднеквадратичную ошибку, 𝑀𝑆𝐸 = 𝐸((ˆ𝑏 − в) Решите задачу, если имеется 𝑛 наблюдений, и оценка строится по формуле ˆ𝑏 = 𝑐 ∑︀ 𝑛 𝑖=1 |𝑋 𝑖 | Source: экзамен миэф, 2008, Пересецкий Задача 22.19. Пусть величины 𝑋 1 , ..., 𝑋 𝑛 равномерны на [𝑘; 𝑘 + 1] и независимы. Есть две оценки параметра 𝑘: ˆ 𝑘 1 = ¯ 𝑋 − 1 и ˆ𝑘 2 = 𝑚𝑎𝑥{𝑋 𝑖 } а) Являются ли оценки несмещенными? б) У какой оценки ниже дисперсия (при большой выборке)? в) Являются ли оценки состоятельными? Задача 22.20. Пусть 𝑋 𝑖 - независимы и имеют функцию плотности 𝑝(𝑡) = при 𝑡 > 𝑎, где 𝑎 - неизвестный параметр. В качестве оценки неизвестного 𝑎 используется ˆ𝑎 𝑛 = min{𝑋 1 , 𝑋 2 , ..., а) Является ли предлагаемая оценка состоятельной? б) Является ли предлагаемая оценка несмещенной? Задача 22.21. Пусть 𝑋 𝑖 - независимы и распределены равномерно на [𝑎 − 1; 𝑎], где 𝑎 - неизвестный параметр. В качестве оценки неизвестного 𝑎 используется ˆ𝑎 𝑛 = max{𝑋 1 , 𝑋 2 , ..., а) Является ли предлагаемая оценка состоятельной? б) Является ли предлагаемая оценка несмещенной? Задача 22.22. Пусть 𝑋 1 ,... независимы и имеют функцию распределения 𝐹 (𝑡). Обозначим ˆ 𝐹 (𝑡) - долю величин, оказавшихся не выше Является ли оценка ˆ 𝐹 (𝑡) состоятельной? Задача 22.23. Пусть ˆ𝑎 𝑛 - состоятельная и несмещенная оценка для неизвестного параметра 𝑎. Пусть 𝑏 = 𝑒𝑥𝑝(𝑎) и а) Будет ли несмещенной оценкой для б) Будет ли состоятельной оценкой для Задача ТВИМС-задачник. Демешев Борис. Васе нужно узнать вес двух слитков. У Васи есть очень интересные электронные весы с двумя чашами. Они показывают разницу в весе между левой и правой чашой. Например, вес одного слитка можно узнать, положив его на правую чашу, а на левую не положив ничего. Результат взвешивания является случайной величиной со средним равным истинному весу предмета и дисперсией 𝜎 2 , независящей отвеса предмета. Васе можно воспользоваться чудо-весами всего два раза. Какая стратегия лучше? а) Взвесить каждый слиток по отдельности б) Сначала взвесить два слитка вместе (на одной чаше весов, затем оценить разность их веса и путем простых арифметических операций оценить вес каждого слитка MM, ML, Задача MM, ML и Допустим, что закон распределения имеет вид 0 2 Prob 𝜃 2𝜃 − 0.2 1.2 − Имеется выборка 𝑋 1 = 0 , 𝑋 2 = 2 a) Найдите оценки ˆ𝜃 𝑀 и ˆ𝜃 𝑀 𝑀 b) Первоначально ничего о 𝜃 не было известно и поэтому предполагалось, что 𝜃 распределена равномерно на [0.1; 0.4]. Как выглядит условное распределение 𝜃? Задача 23.2. Известно, что распределены одинаково и независимо. С помощью ML оцените значение неизвестного параметра 𝜃, если функция плотности имеет вида) при 𝑦 ∈ [0; 1] ; б) 2𝑦 𝜃 2 при 𝑦 ∈ [0; 𝜃] ; в 𝜃 2 при 𝑦 ∈ [0; +∞) ; г) 𝜃 ( ln 𝜃−1 𝑦 ) 𝑦 при 𝑦 ∈ [1; д) при ∈ [−𝜃; 𝜃] . В пунктах а, б) и д) постройте также ММ оценку. Задача 23.3. Постройте MM и ML оценки параметра 𝜆 экспоненциального распределения. Задача 23.4. Постройте MM и ML оценки параметра 𝜇 нормального распределения при известном 𝜎 2 Задача 23.5. Постройте MM и ML оценки параметра нормального распределения при известном 𝜇. Задача 23.6. Пусть 𝑋 1 , 𝑋 2 ,..., независимы и их функции плотности имеет вид (𝑥) = {︂ (𝑘 + 1)𝑥 𝑘 , 𝑥 ∈ [0; 1]; 0, 𝑥 / ∈ [0; Найдите оценки параметра а) Методом максимального правдоподобия б) Методом моментов Задача 23.7. Пусть 𝑋 1 , 𝑋 2 ,..., независимы и равномерно распределены на отрезке [0; 𝜃], 𝜃 > а) Постройте ˆ𝜃 методом максимального правдоподобия б) Постройте ˆ𝜃 методом моментов в) Как изменятся ответы на «a» и б, если исследователь не знает значений самих 𝑋 𝑖 , а знает ТВИМС-задачник. Демешев Борис. только количество оказавшихся больше единицы? Задача 23.8. Про зайцев В темно-синем лесу, где трепещут осины, отловлено 100 зайцев. Каждому из них на левое ухо завязали бант из красной ленточки и отпустили. Через неделю будет снова отловлено 100 зайцев. Из них 𝑁 (св) окажутся с бантами. Найдите 𝐸(𝑁), если всего в лесу 𝑧 зайцев. а) Придумайте MM оценку общего числа зайцев. б) Придумайте ML оценку общего числа зайцев. Задача 23.9. Шутка Вася утверждает, что оценки метода максимального правдоподобия являются состоятельными. Является ли Васино утверждение а) максимально правдоподобным; б) состоятельным? Задача 23.10. Найдите MM и ML оценки параметра 𝑎, если 𝑋 𝑖 - независимы и одинаково распределены с функцией плотности 𝑝(𝑡) = 𝑎 2 · 𝑡 · при 𝑡 > 0. Задача 23.11. Пусть св. независимы и имеют функцию плотности 𝑝(𝑡) = 𝑎 2 𝑒 −𝑎·|𝑡| . Найдите оценку параметра 𝑎 a) методом максимального правдоподобия б) методом моментов приравняв теоретическую 𝑉 и эмпирическую в) методом моментов приравняв и соответствующий эмпирический момент. Задача 23.12. [т?] Пусть св. независимы и имеют функцию плотности 𝑝(𝑡) = 𝑎 2 𝑒 −𝑎·|𝑡−𝑏| . Найдите ML оценку параметров и 𝑏. Задача 23.13. [т] Пусть наблюдаются 𝑌 1 = 𝛽 + и 𝑌 2 = 2 · 𝛽 + 𝑢 2 , где ненаблюдаемые независимо и одинаково распределены, причем 𝐸(𝑢 𝑖 ) = и 𝑉 𝑎𝑟(𝑢 𝑖 ) = 𝛾 . Оказалось, что 𝑦 1 = 0.9 , а 𝑦 2 = 2.3 . Найдите оценки методом максимального правдоподобия для 𝛽 и 𝛾, если: а) 𝑢 𝑖 - равномерно распределены; б) 𝑢 𝑖 - нормально распределены; Задача 23.14. Пусть и независимы и распределены по Пуассону. Известно также, что 𝐸(𝑌 1 ) = и) = 𝑒 𝑎+𝑏 . Найдите ML оценки для 𝑎 и Ответ ˆ𝑎 = ln(𝑌 1 ) , ˆ𝑏 = ln(𝑌 2 ) − ln(𝑌 1 ) Source: Suhov, Probability and statistics Задача 23.15. Пусть независимы и одинаково распределены 𝑁(𝛼, По выборке 𝑋 1 , ..., постройте оценку для а) Методом моментов б) Методом максимального правдоподобия ТВИМС-задачник. Демешев Борис. roah@yandex.ru 104 Задача 23.16. На отрезке [0; 𝑏] равномерно независимо друг от друга выбираются два числа. Пете сообщают величину 𝑋, максимум из этих двух чисел. Васе сообщают величину 𝑋, минимум из этих двух чисел. а) Помогите Васе и Пете построить оценки неизвестного 𝑏 методом моментов и методом максимального правдоподобия. б) Какие из четырех оценок будут несмещенными? в) Какая из четырех оценок будет наиболее эффективной Наиболее эффективной среди несмещенных г) Решите эту задачу, если вместо двух чисел на отрезке выбираются 𝑛 чисел. Задача 23.17. Корректоры очепяток-2 Вася замечает опечатку с вероятностью 𝑝, Петя независимо от Васи замечает опечатку вероятностью. В книге имеется 𝑛 опечаток. Известно, что Вася обнаружил опечаток, Петя - 𝑁 2 опечаток, причем опечаток были обнаружены и Петей, и Васей. а) Предполагая, что параметры 𝑝 и 𝑞 известны, а 𝑛 - неизвестен, построить оценку 𝑛 методом максимального правдоподобия. б) Предполагая, что 𝑝, 𝑞, 𝑛 - неизвестны, построить их оценки методом максимального правдоподо- бия. Solution: Задача 2.22. может быть полезна. а) Находим вероятность получить заданные 𝑁 1 , 𝑁 2 , как функцию от 𝑝, 𝑞 и 𝑛 (получаем 𝑓(𝑝, 𝑞, 𝑛)) Максимизируем по 𝑛: значение 𝑛 увеличиваем пока 𝑓(𝑝, 𝑞, 𝑛 + 1)/𝑓(𝑝, 𝑞, 𝑛) ≥ Получаем ˆ𝑛 если забыть про целочисленность) б) Оценки ML для 𝑝 и 𝑞 выглядят стандартно = 𝑁 1 ^ 𝑛 , ˆ𝑞 Решая систему уравнений получаем = 𝑁 1 𝑁 2 𝑁 12 ˆ 𝑝 = 𝑁 12 𝑁 2 ˆ 𝑞 = 𝑁 12 𝑁 1 Задача 23.18. Вася стрелял по мишени до го промаха. Вася записывал, только сколько попаданий подряду него было. Осталась запись 4, 3, 5, 6, 8. Она означает что сначала у него было 4 попадания подряд, затем сколько-то промахов, затем 3 попадания подряд, затем сколько-то промахов и т.д. Предположим, что в течение этого времени меткость Васи не менялась. Постройте оценку для Васиной меткости а) методом моментов б) методом максимального правдоподобия в) оцените 𝑛 методом максимального правдоподобия Решение: уточним, что 𝑛 - число промахов, 𝑇 - число записанных Васей цифр, ¯ 𝑋 = ∑︀ по смыслу задачи находим закон распределения 𝑃 (𝑋 𝑖 = 𝑘) = а) 𝐸(𝑋 𝑖 ) = 1 𝑞 , отсюда ˆ𝑝 = 1 б) максимизируем по 𝑝 (при заданном числе записанных серий) получаем также ˆ𝑝 = 1 в) если максимизировать и по 𝑛: 𝐿 = 𝑃 (𝑋 1 , ..., 𝑋 𝑇 |𝑇 ) · 𝑃 (𝑇 ) Находим когда 𝐿(𝑛) растет, те. когда 𝐿(𝑛 + 1) ≥ Получаем ˆ𝑛 = 𝑇 ^ 𝑝 ТВИМС-задачник. Демешев Борис. roah@yandex.ru 105 Задача 23.19. Допустим, что поток посетителей ларька - Пуассоновский процесс с интенсивностью 𝜆 человек в час. Продавщица каждый день закрывает ларек на обед с 13:00 до 14:00, выходных нет. а) Сколько (в среднем) посетителей придут к закрытому ларьку за неделю? б) Имеются наблюдения 𝑋 1 , 𝑋 2 , интервалы времени между отдельными посетителями, 𝑛 ≥ С помощью этих величин постройте несмещенную и с минимальной диспресией оценку среднего количества посетителей, приходящих к закрытому ларьку. в) Что происходит в случае 𝑛 = 1? Ответы: а) б в) несмещенной оценки не существует, Expected number of sums in a given set, American Mathematical Monthly, Vol. 104, No 1 (Авторы Kotlarsky, Agnew, Schilling, Roters Задача 23.20. Серия В крупном банке 10 независимых клиентских окошек. В момент открытия в банк вошло человек. Предположим, что время обслуживания одного клиента распределено экспоненциально с параметром 𝜆. Оцените параметр 𝜆 методом максимального правдоподобия в каждой из ситуаций: а) Менеджер записал время обслуживания первого клиента в каждом окошке. Первое окошко обслужило своего первого клиента за 10 минут, второе (своего первого) - за 20 минут оставшуюся часть записей менеджер благополучно затерял. б) Менеджер наблюдал за окошками в течение получаса и записывал время обслуживания первого клиента. Первое окошко обслужило своего первого клиента за 10 минут, второе (своего первого- за 20 минут остальные окошки еще обслуживали своих первых клиентов в тот момент, когда менеджер удалился. в) В момент открытия банка в банк вошло 10 человек. Менеджер наблюдал за окошками в течение получаса. За эти полчаса два окошка успели обслужить своих первых клиентов. Остальные окошки еще обслуживали своих первых клиентов в тот момент, когда менеджер удалился. г) Менеджер наблюдал за окошками и решил записать время обслуживания первых двух клиентов. Первое окошко обслужило своего первого клиента за 10 минут, второе (своего первого) - за 20 минут. Сразу после того, как был обслужен второй клиент менеджер прекратил наблюдение. д) Одновременно с открытием банка началась деловая встреча директора банка с инспектором по охране труда. Время проведения таких встреч - случайная величина, имеющая эскпоненциальное распределение со средним временем 30 минут. За время проведения встречи было обслужено два клиента. е) Одновременно с открытием банка началась деловая встреча директора банка с инспектором по охране труда. Время проведения таких встреч - случайная величина, имеющая эскпоненциальное распределение со средним временем 30 минут. За время проведения встречи было обслужено два клиента, один за 10 минут, второй - за 20 минут. ж) Изменим условие в банке 11 окошек, при открытии банка вошло 11 клиентов. Клиент попавший в 11 окошко смотрел за остальными. Раньше клиента из 11 окошка освободилось двое клиентов за минут и за 20 минут. Ответы: а) ˆ𝜆 = 10+20 2 ТВИМС-задачник. Демешев Борис. б) 𝐿 = 𝑝(10)𝑝(20) 𝑃 (𝑋>30) 8 𝑃 (в) 𝐿 = 𝑃 (𝑋 < 30) 2 · 𝑃 (𝑋 > ж) 𝐿 = 𝑝(10)𝑝(20)𝑃 (𝑋 > г) 𝐿 = 𝑝(10)𝑝(20)𝑃 (𝑋 > д) Вероятность быть обслуженным вовремя встречи равна 𝑝(𝜆) = 𝜆 30+𝜆 , поэтому 𝐿 = 𝑝(𝜆) 2 (1 − е) 𝐿 = ...(1 − 𝑝(𝜆)) 8 Задача 23.21. На плоскости нарисована окружность с центром вначале координат и радиусом 𝑟. На ней равномерно выбирается 𝑛 точек. Оцените 𝑟 методом максимального правдоподобия, если известны координаты всех точек. Ответ: окружность наименьшего радиуса, накрывающая все точки Задача 23.22. На плоскости нарисована окружность с центром (𝑎, 𝑏) и радиусом 1 см. На ней равномерно выбирается точек. Оцените вектор (𝑎, 𝑏) методом максимального правдоподобия, если известны координаты всех точек. Ответ: множество таких пар (𝑎, 𝑏), что получающаяся окружность накрывает все точки Задача 23.23. Предположим, что доход жителей страны распределен экспоненциально с параметром Имеется выборка из 1000 наблюдений по жителям столицы. Постройте 90% доверительный интервал для 𝜆. Если... а) столицу можно считать случайной выборкой из жителей страны б) в столице селятся только люди с доходом больше 100 тыс. рублей. в) в столице селятся только люди с доходом больше 𝑚 тыс. рублей, где 𝑚 - неизвестная константа. При этом постройте также и 90% доверительный интервал для г) в столице живут 10% самых богатых жителей страны. д) в столице живут 𝑝% самых богатых жителей страны, где 𝑝 - неизвестная константа. Постройте также 90% доверительный интервал для Задача- iid 𝑈[0; 𝑎]. Помимо числа 𝑛 мы знаем: а) сколько 𝑋-ов из 𝑛 меньше б) сами значения иксов в) сколько 𝑋-ов из 𝑛 меньше 100 и чему равны 𝑋 меньшие Оценить 𝑎 - методом моментов, максимального правдоподобия Задача 23.25. Как узнать ширину и длину, зная только площадь «Насяльника» отправила Равшана и Джамшуда измерить ширину и длину земельного участка. Равшан и Джамшуд для надежности измеряеют длину и ширину 100 раз. Равшан меряет длину, результат измерений - случайная величина 𝑋 𝑖 = 𝑋 * + где 𝑋 * - истинная длина участка, а ∆𝑋 𝑖 ∼ 𝑁 (0; 1) - ошибка измерения. Джамшуд меряет ширину, результат измерений - случайная величина 𝑌 𝑖 = 𝑌 * + ∆𝑌 𝑖 , где 𝑌 * - истинная ширина, а ∆𝑌 𝑖 ∼ 𝑁 (0; 1) - ошибка измерения. Предположим, что все ошибки измерений независимы. Предполагая, что «насяльника» хочет измерить площадь участка, каждый раз Равшан и Джамшуд сообщают «насяльнику» только величину 𝑆 𝑖 = Помогите «насяльнику» оценить и методом моментов ТВИМС-задачник. Демешев Борис. roah@yandex.ru 107 24 Гипотезы о среднем Задача 24.1. До проведения рекламной компании в среднем 7 из 10 посетителей художественного магазина-салона делали покупки. После рекламной компании из 200 посетителей покупки сделали 163. Можно ли считать, что рекламная компания имела эффектна ом уровне значимости? Задача 24.2. Дневные расходы электроэнергии на предприятии составляли 1400 КВт со стандартным отклонением КВт. Задней прошедших после ремонта и наладки оборудования средние расходы задень составили 1340 КВт. Можно ли считать, что ремонт способствовал экономии электроэнергии на уровне значимости? Задача 24.3. Монету подбросили 1000 раз, при этом 519 раз она выпала на орла. Проверьте гипотезу о том, что монета правильная на уровне значимости 5%. Задача 24.4. Вася отвечает на 100 тестовых вопросов. В каждом вопросе один правильный вариант ответа из пяти возможных. На ом уровне значимости проверьте гипотезу о том, что Вася ставит ответы наугад, если он ответил правильно на 26 вопросов из теста. Задача 24.5. Некоторых студентов спросили, на какую оценку они рассчитывает по теории вероятностей, человек надеются на 4 балла, 20 человек – на 6 баллов, 30 человек – на 8 баллов, 10 человек – на баллов. Проверьте гипотезу о том, что медиана равна 7 баллам на уровне значимости 10%. Задача 24.6. Кубик подбросили 160 раз, из них 29 он выпал на шестерку. Проверьте гипотезу о том, что вероятность выпадения шестерки правильная на уровне значимости 10%. Задача 24.7. Двести домохозяек попробовали новый Вовсе необычный порошок, 110 из них получили более удачный результат, чем раньше. На уровне значимости 5% проверьте гипотезу о том, что Вовсе необычный порошок по эффективности не отличается от старого средства (против альтернативной гипотезы о большей эффективности). Задача 24.8. Величины 𝑥 1 , 𝑥 2 , ..., независимы и распределены 𝑁(10, 16). Вася знает дисперсию, ноне знает среднего. Поэтому он строит 60% доверительный интервал для истинного среднего значения. У него получаются две границы - левая и правая. Какова вероятность того, что: |