Главная страница
Навигация по странице:

  • Парадокс Симпсона

  • Вероятность, Библия, 9/11 и отпечатки пальцев

  • О средних величинах и медианах

  • Среднестатистический казначей

  • Среднестатистические водители

  • Говори за себя

  • Хаим ШапираГладиаторы, пираты иигры на доверии. Какнами правят теория игр


    Скачать 1.08 Mb.
    НазваниеХаим ШапираГладиаторы, пираты иигры на доверии. Какнами правят теория игр
    Дата24.02.2023
    Размер1.08 Mb.
    Формат файлаpdf
    Имя файлаGladiatory_piraty_i_igry_na_doverii_Kak_nami_pravyat_teoria_igr_.pdf
    ТипДокументы
    #953590
    страница9 из 10
    1   2   3   4   5   6   7   8   9   10
    Графики и ложь
    А вот пример игры сданными в графических презентациях. Предположим, цена акций некой компании поднялась за период с января 2015 г. по январь 2016 гс до $28. В нашу эпоху господства компьютеров люди любят демонстрировать такие явления на графиках и презентациях. И как сделать это хорошо Это зависит от вашей аудитории.
    Если презентация делается для налоговой компании, рекомендованным будет первый же график, представленный ниже.
    Как видите, здесь все не так радужно. График скорее похож на пульс покойника. Он может разбить сердце даже самых закаленных агентов Налогового управления.
    Если быту же информацию требовалось представить руководству компании, я бы слегка изменил графики сделал
    его вот таким.
    Видите, какая стрела Она показывает не только то, что цена акций взлетела до небесно и то, что эта цена продолжает подниматься!
    Эти две презентации различаются шкалой – той измерительной линейкой, которую мы выбираем. Толика воображения и усилий – и все можно представить наилучшим образом для нас

    Как-то в телерекламе я увидел вот такую графическую презентацию она представляла уровень довольства клиентов то, насколько те удовлетворены работой трех обслуживающих компаний. Само собой, компания, которая спон- сировала рекламный ролик, получила высшую оценку – изв то время как ее конкуренты – 7,3 и 7,2 соответственно. На графике не показали, сколько клиентов составили выборку, и мы не можем узнать, реальна ли разница между тремя компаниями
    Колонки создают впечатление того, что спонсор ролика наголову превосходит конкурентов. Интересно, кто-нибудь раскусил это?
    Бенджамин Дизраэли (1804–1881), вероятно, был прав,
    когда сказал, что есть три вида лжи ложь, гнусная ложь и статистика. Впрочем, если по правде, то эта история, скорее всего, тоже ложь. Эту ремарку приписывал британскому пре- мьер-министру Марк Твен (1835–1910), но никто и никогда
    не слышал того, чтобы Дизраэли произносил это знаменитое высказывание, и нив одном из его сочинений такой фразы не нашли.
    Парадокс Симпсона
    В 1973 г. исследователи, решившие изучить жалобы на гендерные предрассудки в Калифорнийском университете в
    Беркли, выяснили, что, после того как примерно 8000 мужчин и 4000 женщин подали документы в аспирантуру, доля мужчин, которых туда принимали, оказалась намного выше доли женщин. На университет подали в суд за предвзятость. Но была ли здесь дискриминация женщин на самом деле Исследователи проверили данные приемных комиссий по отдельным факультетами выяснили вот что если и была причина для обращения в суд, то по поводу совершенно иной дискриминации Все факультеты отдавали предпочтение женщинами, если судить в процентном отношении,
    принимали их чаще, чем мужчин.
    Если вам незнакома статистика (или законы исчисления дробей, это может показаться невозможным. Если бы все факультеты проявили предвзятость и оказывали благосклонность женщинам, тогда и весь университет проявил быта- кие же гендерные предрассудки – а все обстояло совершенно иначе.
    Английский статистик Эдвард Симпсон (1922–2019) описал этот феномен в своей статье, вышедшей в 1951 г. и озаглавленной Интерпретация взаимодействия в таблицах сопряженности. Сегодня мы называем это явление парадоксом Симпсона, или эффектом Юла – Симпсона (Удни Юл,
    статистик из Великобритании, уже упоминало похожем эффекте в 1901 г. Я объясню это без практических данных
    Беркли – с помощью простой гипотетической версии.
    Предположим, у насесть университет, в котором только два факультета – математический и юридический. Пусть женщин и 100 мужчин подают документы на факультет математики, куда проходят 60 женщин (или 60 %) и 58 мужчин. Кажется, на математическом женщины в фаворе. На юридический подают документы 100 женщин, совершенно других, из них проходят 40 (40 %); что же касается мужчин, то юриспруденцию хотят изучать всего трое, а проходит только один. Один из трех – это меньше чем 40 и создается впечатление, что оба факультета предпочитают брать к себе женщин. Но если мы посмотрим на общие цифры по университету, то окажется, что из 200 женщин, подавших документы, принято 100, то есть 50 %, а из 103 мужчин,
    подавших документы, принято 59, то есть больше 50 И как все это объяснить?
    Вместо того чтобы переходить к техническим сложностям, позвольте привести интуитивно понятное объяснение См Simpson E. H. The Interpretation of Interaction in Contingency Tables //
    Journal of the Royal Statistical Society. 1951. Series B 13. P. 238–241.
    На основании имеющихся данных видно, что юридический факультет относится к поступающим намного суровее. И
    когда много женщин (100) подают документы на юридический факультет, отношение поступивших к общему числу,
    выраженное как 60 %, становится гораздо менее ценным.
    Поскольку равное количество женщин подает документы на каждый факультет, общее процентное отношение женщин,
    принятых в университет, к женщинам, подавшим документы это среднее арифметическое от 60 и 40, то есть 50. Но по причине того, что все знают, сколь суров и жесток юридический факультет, документы туда подают только трое мужчина поступает только один (и ничего бы не изменилось,
    если бы не поступил никто) – и это почти никак не влияет на процентное соотношение мужчин, принятых на математический факультет, к мужчинам, подавшим туда документы.
    Вывод: да, оба факультета отдавали предпочтение женщинам. Но именно потому, что на юридический факультет, где процент зачисленных ниже, пытались поступить в большинстве своем женщины, а мужчины почти не шли, при объединении процентных соотношений доля мужчин действительно оказывается больше.
    Сказать по правде, парадокс Симпсона сообщает нам кое- что очень простое о законах дробей. Приведенные ниже строки – это не более чем та же самая история, только в виде дробей

    60/100 > и также > но + 40) / (100 + 100) < (58 + 1) / (100 + Один мудрый человек как-то сказал, что статистика напоминает ему женщин в бикини все, что открыто, очень мило и греет душу, но самое важное остается скрытым.
    Примеров масса. Можно представить двух баскетболистов, Стефа и Майка. Пусть Стеф, по статистике, два года подряд делает больше точных бросков, чем Майк (в процентном отношении ко всем совершенным броскам, но общая статистика за два года все равно показывает, что Майк превосходит Стефа в меткости. Взгляните на таблицу.
    Я сделал этот пример очень похожим на предыдущий так ясна суть самого явления. Согласно таблице, в процентном отношении Стеф делал больше точных бросков ив г.,
    и в м, но, если взять данные в общем за два года, окажется, что в меткости Майк его превосходит.
    Можно еще представить двух консультантов по инвестициям, один из которых превосходит другого (в процентном отношении доходных портфолио) в первом полугодии, да и во втором полугодии, если взглянуть на процентное отношение, его результаты тоже лучше но стоит подсчитать процентное отношение выгодных портфолио завесь год – и окажется, что оно выше у другого.
    Когда я впервые узнал об этом парадоксе, мне привели в пример две больницы вот с такими данными. Было известно, что мужчины чаще предпочитали проходить осмотр в больнице Аи избегать больницы Б, поскольку показатели мужской смертности в больнице А были ниже. Да и женщины, поступавшие в больницу А, тоже жили дольше, нежели в больнице Б. Но, как только сравнили данные в общем по мужчинами женщинам, оказалось, что в больнице Б показатели смертности меньше, чем в больнице АС радостью приглашаю моих умных читателей вписать числа в таблицу,
    представленную ниже, и посмотреть, как все это работает
    Проценты как они есть
    Одна из проблем интерпретации численного анализа – это тот факт, что мы склонны думать о процентах как об абсолютных величинах. Например, мы чувствуем, что 80 % больше, чем 1 %. И тем не менее, если бы кто-нибудь предложил нам выбрать 80 % акций крошечной компании или 1 акций такого гиганта, как Microsoft, мы бы очень скоро поняли, что процентные выражения – это не тоже самое, что доллары.
    Что мы пытаемся сказать такой фразой Он смазал стопроцентный выстрел!»?
    В чем смысл слов Этот препарат на 17 % снижает вероятность сердечного приступа у 30 % курильщиков»?
    Как выгоднее приобретать товары со скидкой 25 % или со скидкой 50 % за каждый второй купленный товар Почему?
    Там, где дело касается процентных отношений, решение нужно принимать очень осторожно.
    Примеры процентных отношений могут довести нас очень далеко – и даже до фондовой биржи. Когда мы слышим, что таили иная акция возросла на 10 % или упала на %, нельзя считать, что цена акции вернулась туда же, где и была вначале. Если наша акция стоила $100 и возросла на %, то теперь она стоит $110. Если на этом этапе она падает на 10 %, тона самом деле она начинает стоить на $11
    меньше, то есть $99 (что любопытно, тоже самое получится, если акция сперва упадет в цене на 10 %, а потом на них же возрастет. Этот разрыв будет еще ярче, если та же акция сперва возрастет, а потом упадет на 50 % (тогда она будет стоить $150 и $75), а драматическая кульминация – это возрастание и падение на 100 %. В последнем сценарии цена акции сперва удвоится, а потом перестанет существовать.
    Многие не понимают, что если их акция возросла в цене на 90 %, а потом упала на 50 %, то они на самом деле потеряли в деньгах. В это сложно поверить Давайте разберемся.
    Представьте, что ваша акция стоит $100 и потом возрастает на 90 %: теперь она стоит $190, так Потом она падает в цене на 50 %, то есть теперь она стоит только $95. Если финансовый менеджер расхваливает рекомендованную им акцию,
    рассказывая о том, что она поднялась в цене на 90 %, а потеряла всего 50 %, многие могут решить, что за год приобрели выгоду 40 %. Никто и никогда не верит в то, что может проиграть.
    И если даже в процентных отношениях мы уже начинаем блуждать, просто представьте, что происходит, когда мы переходим в мир вероятностей (как правило, грядущих собы- тий).
    Вероятность, Библия, 9/11 и отпечатки пальцев
    Как-то раз один ученый показал мне ловкий трюк. я
    буква в Книге Бытия на иврите – Т. Отсчитайте еще 50 букв ивы окажетесь на букве О. Еще 50 букв – и мы на Рая буква (еще плюс 50) – А. Произнесем все вместе…
    ТОРА! Слово на иврите, призванное обозначить Пятикнижие, или Учение Случайное ли это совпадение Или так было задумано Когда-то в прошлом люди часто развлекались,
    прочесывая Библию на предмет самых разных интервалов,
    исполненных скрытого смысла, и на эту тему даже писали книги и статьи. Так правда ли Священное Писание содержит тайные послания наподобие этого Если оставить в стороне богословские аспекты, то это прежде всего статистический вопрос, который мы можем задать и о других пространных книгах, таких как та же Война и мир. Не содержатся ли в них интересные комбинации Что же, скорее всего, они там есть. Множество любопытных распределений таят все- бе и «Моби Дики Анна Каренина», и много других боль- ших-больших книг. (Просто представьте, сколько их можно найти в романе В поисках утраченного времени, семитомном сочинении Марселя Пруста!)
    После террористических атак 11 сентября 2001 г. жители Нью-Йорка были поражены совпадением случайных
    «фактов», возникших вокруг злодеяния. Например, номер рейса первого самолета, который врезался во Всемирный торговый центр, – 11! В сочетании «Нью-Йорк Сити букв, равно как ив английском написании слова
    «Афганистан» (Afghanistan), ив имени президента Буша

    (George W. Bush). Кроме того, 11 сентября – этой день года. И что – спросите вы. Как что 2 + 5 + 4 = 11! Даже форма башен-близнецов напоминает число 11. Вот теперь и правда становится страшно!
    Еще одна интересная проблема, косвенно с этим связанная раскрытие преступлений по отпечаткам пальцев. Я
    выступаю в защиту такого мнения когда суды готовятся предъявить кому-либо обвинение, поскольку его отпечатки пальцев совпали с теми, что нашлись на месте преступления, сперва неплохо бы подумать о том, сколь густо населена округа. Насколько мне известно, совпадения по отпечаткам пальцев никогда не бывают идеальными совпадает лишь определенное количество идентичных форм. (Возможно, вы помните, как сказал Бенджамин Франклин: уверенным быть можно в двух вещах – в налогах ив смерти. Об отпечатках пальцев он не упоминал) Вероятность того, что совпадут неидентичные отпечатки, составляет 1:100 000 или 000, в зависимости оттого, что за книгу выдержите в руках. Итак, если отпечатки найдены на месте преступления в поселке, где проживают двести человек, и у насесть подозреваемый, чьи отпечатки совпадают с найденными на месте преступления, тогда шанс того, что мы нашли преступника,
    весьма высок вряд ли мы найдем в этом городишке другого жителя с такими же пальчиками. Но, когда этот метод применяют к преступлению, совершенному, скажем, в Нью-Йорке или Токио, разумно предположить, что там мы можем найти
    гораздо больше людей со схожим паттерном отпечатков.
    О средних величинах и медианах
    Хотя средние величины часто упоминаются в самых разных повседневных контекстах, мне кажется, что среднее это одна из самых запутанных проблем в мире статистики. Например, нам скажут, что средняя месячная зарплата в условном Хэппиленде – стране счастливой жизни – составляет. Что это значит Я спросил нескольких умных людей, и оказалось, что многие понимают это так примерно у 50 % жителей Хэппиленда доход превышает $100 000, ау другой половины он ниже этой отметки. Конечно же это ошибка. Величина, разделяющая население надвое, – это не среднее, а медиана. Что же до средней величины, о которой упоминалось выше, то очень вероятно, что в стране есть горстка избранных с баснословными доходами, гораздо выше уровня $100 000, а все остальные – большинство – зарабатывают меньше. Представим такую картинку семеро работают в гипотетическом филиале банка. У шестерых обычные зарплаты, ау менеджера – $7 млн. Выходит, средняя зарплата по банку – более $1 млн. Да, как-то так – ведь даже если мы возьмем одну только зарплату менеджера и разделим ее на семь равных частей, у нас в каждой части будет по миллиону, значит, реальная средняя величина должна быть выше. В этом примере только один человек получает больше
    остальных, а все остальные получают меньше, и, как видно,
    доходы меньше средней зарплаты не у половины сотрудников, ау гораздо большего их числа. Известен тот факт, что в некоторых странах только у 30–40 % работников заработная плата больше средней.
    Со средней величиной есть проблема она очень чувствительна к крайним значениям. Если наш менеджер удвоит даже только свою зарплату – и никто другой при этом не получит ни гроша, – средняя зарплата равно также практически удвоится. Впрочем, медиана (не забывайте, что медиана это срединная величина в перечне чисел, выстроенном от самого малого к самому большому) создает противоположную проблему. Такое же повышение зарплаты менеджера не окажет на медиану никакого влияния она совершенно нечувствительна к крайним значениям. И если мы хотим показать ситуацию в численно обоснованном виде, то должны представить и медиану, и среднюю величину, а также стандартное отклонение и форму распределения. Любопытно:
    когда данные о зарплате появляются в новостях, почти всегда сообщают о средней зарплате или о средних расходах среднестатистической семьи (надеюсь, теперь вы понимаете причину. Безусловно, редакторы новостей чувствуют, что им не следует углубляться в статистические сложности это разве что заставит зрителей переключить канал. Новы, мои любезные читатели, не должны делать никаких умозаключений на основе этих данных. Ясно, что статистик, стоя одной
    ногой в ледяной воде, а другой – в кипятке, блаженствует (в среднем).
    Среднестатистический казначей
    Как-то разя слышал репортаж о министре финансов некоей страны, который, судя по его цитируемой фразе, надеялся, что наступит день, когда все рабочие в его стране начнут зарабатывать больше, чем в среднем по стране (иногда автором этой мудрости называют Билла Клинтона). Должен признать, это блестящая идея. Можем только пожелать этому казначею долгих лет жизни – она ему понадобится, если он намерен дождаться дня исполнения своей мечты. В ответ на этот рассказ один из читателей предположил, будто казначей не в курсе, что такое средняя величина, и любезно объяснил работников зарабатывают больше среднего, а % – меньше. Само собой, он тоже не особенно разбирался в статистике – и спутал среднюю величину с медианой.
    Среднестатистические водители
    В другой разя читал статью, автор которой, журналист, в статистике вроде как должен был разбираться подолгу службы. Он утверждал, будто каждый считает, что водит лучше среднего, и объяснял, что такая ситуация математически
    невозможна. Он был неправ. И объяснить почему – очень просто. Скажем, пусть четверо из пяти водителей за последний год попали в аварию по разу, а пятый – 16 раз. Выходит,
    в общем все пятеро водителей попадали в аварии 20 рази средняя величина аварийна каждого водителя – 4. Получается, четверо из пяти (то есть 80 %) водят лучше среднего В
    следующий раз, когда прочтете, что все считают себя водителями лучше среднего, не отвергайте это утверждение так быстро. Кто знает Возможно, они правы – по крайней мере,
    статистически.
    Говори за себя
    Один из самых странных и самых интересных фактов о статистике заключается в том, что многие люди, никогда ее не изучавшие, верят в то, что они ее понимают (покажите мне человека, который никогда не изучал дифференциальные уравнения в частных производных или функциональный анализ – и тем не менее уверяет, будто знает эти дисциплины. Люди часто бросают в разговоре реплики вроде:
    «Числа говорят сами за себя. Это глупо. Я никогда не слышал, чтобы число 7 говорило за себя или вело задушевные беседы с числом 3. А вы
    Увлекательное чтиво
    В этом контексте я хотел бы упомянуть две из моих любимых книг. Первая – Математик за газетой, в которой
    Джон Аллен Паулос объясняет, почему он (математик) читает новостные сводки совершенно иначе, нежели среднестатистический (медианный) человек. Вторая – чудесная книга
    Даррела Хафа Как лгать при помощи статистики
    24
    . Я часто обращаюсь к ней, когда начинаю проводить уроки поста- тистике: она помогает студентам не так сильно ненавидеть предмет Paulos John Allen. A Mathematician Reads the Newspaper: Making Sense of the
    Numbers in the Headlines. Penguin, London, 1996; Basic Civitas Books, 2013; Darrell
    Huff
    . How to Lie with Statistics, revised edition, Penguin, London, 1991.
    24
    Выходила на русском языке в изд-ве «Альпина Паблишер» в 2015 г. – Примеч. ред

    1   2   3   4   5   6   7   8   9   10


    написать администратору сайта