Темные данные - Дэвид Хэнд

- Автор: Дэвид Хэнд
- Жанр: базы данных, экономическая статистика
- Размещение: фрагмент
- Теги: big data, анализ данных, анализ данных и исследования, аналитика, обработка данных, статистика, статистические данные
- Год: 2020
Темные данные
Существуют и другие типы темных данных, о которых мы будем говорить. Напомню, что цель этой книги – рассказать о существующей на сегодня классификации темных данных, объяснить способы их идентификации, наглядно продемонстрировать оказываемое ими влияние и показать пути решения проблем, которые они вызывают, а также то, как темные данные можно использовать. Список типов темных данных приводится в конце этой главы, а краткое описание каждого из них вы найдете в главе 10.
Не было ничего необычного, поэтому мы не придали этому значения
Следующий пример служит иллюстрацией того, что темные данные могут иметь катастрофические последствия и что они не являются специфической проблемой больших наборов данных.
28 января 1986 г. на 73-й секунде полета на высоте около 15 км космический челнок Challenger превратился в гигантский огненный шар в результате неисправности ракеты-носителя. Отсек с экипажем какое-то время еще продолжал двигаться по восходящей траектории, достиг отметки 19 км и рухнул в Атлантику. Все семь членов экипажа погибли.
Впоследствии президентская комиссия установила, что руководители среднего звена NASA нарушили правила безопасности, требующие передачи данных по цепочке управления. Все объяснялось экономическими причинами: необходимо было уложиться в график, ведь дата старта уже переносилась с 22-го на 23-е, потом на 25-е, а затем и на 26 января. Поскольку прогноз погоды на этот день обещал неприемлемо низкую температуру, запуск снова отложили на день. Обратный отсчет прошел нормально, индикаторы показали, что замок люка закрылся должным образом. Однако к тому моменту поднялся сильный ветер, и запуск шаттла вновь пришлось отложить.
В ночь на 27 января состоялась трехчасовая телеконференция между представителями компании Morton Thiokol, построившей разгонные ступени, сотрудниками NASA в Центре космических полетов Маршалла и людьми из Космического центра Кеннеди. Ларри Уир из Центра космических полетов Маршалла попросил представителей Morton Thiokol проверить возможное влияние низких температур на твердотопливные ракетные двигатели. В ответ команда Morton Thiokol указала на то, что при низких температурах уплотнительные кольца становятся более жесткими.
Уплотнительные кольца представляли собой манжеты из резиноподобного материала с диаметром поперечного сечения около 6 мм, которые устанавливались по окружности в стыки между четырьмя сегментами ракетного двигателя. Твердотопливные ракетные ускорители имели 45 м в высоту и 11 м в диаметре. Во время запуска зазор величиной 0, 1 мм, который в обычных условиях полностью герметизировался уплотнительными кольцами, открывался максимум до 1, 5 мм и оставался открытым в течение каких-то 0, 6 секунды.
Роберта Эбелинга из Morton Thiokol беспокоило то, что при низких температурах повышение жесткости уплотнительных колец может привести к потере способности герметизировать зазоры между сегментами, пока они будут в течение 0, 6 секунды оставаться увеличенными на 1, 4 мм. На телеконференции Роберт Лунд, вице-президент Morton Thiokol, заявил, что рабочая температура уплотнительного кольца не должна быть ниже границы подтвержденной температуры запуска 53? F (около 12? C). За этим последовала довольно горячая дискуссия, продолжавшаяся и после окончания конференции на уровне личных бесед. По ее итогам Morton Thiokol пересмотрела свою позицию и согласилась рекомендовать запуск.
Ровно через 58, 79 секунды с момента старта из правого ракетного двигателя в районе последнего стыка вырвалось пламя. Оно быстро превратилось в мощную струю, которая выломала стойки, соединяющие ракетный двигатель с внешним топливным баком. Двигатель развернуло и ударило сначала о крыло орбитального аппарата, а затем о топливный бак, в результате чего этот резервуар, наполненный жидкими водородом и кислородом, попал в струю пламени. На 64-й секунде полета поверхность бака получила повреждения, а еще через 9 секунд огромный огненный шар поглотил Challenger, и он разлетелся на несколько больших частей [8 - https: //er. jsc. nasa. gov/seh/explode. html (https: //er. jsc. nasa. gov/seh/explode. html). ].
Мы не должны ни на секунду забывать, что космические полеты всегда связаны с риском. Ни одна миссия, даже при самых хороших условиях, не является безопасным предприятием – риск просто не может быть сведен к нулю. И всегда существуют противоречивые требования.
Кроме того, как и в любом другом подобном инциденте, установить какую-то одну причину произошедшего бывает довольно сложно. Было ли это вызвано нарушением правил безопасности, неоправданным давлением на менеджеров по экономическим соображениям, следствием ужесточения бюджета или, возможно, влиянием СМИ, которые после семикратного откладывания запуска предыдущего челнока Columbia встречали каждую новую задержку саркастическими насмешками? Вот что сказал, например, известный журналист Дэн Ратер в выпуске вечерних новостей в понедельник, 27 января, после того, как старт Challenger был отложен в четвертый раз: «Еще одна дорогостоящая и позорная задержка запуска космического челнока. На этот раз виноватыми оказались плохой болт на крышке люка и гром среди ясного неба». А может быть, причина кроется в политическом давлении? В конце концов, интерес к этому запуску был значительно выше, чем к предшествующим, потому что в число экипажа впервые вошел рядовой гражданин США, учительница Криста Макалиф и на вечер 28 января было запланировано выступление президента.
В таких ситуациях обычно переплетаются несколько факторов. Их запутанные и неопределенные взаимодействия могут привести к неожиданным последствиям. Но в нашем случае был еще один фактор: темные данные.
После катастрофы комиссия, возглавляемая бывшим госсекретарем Уильямом Роджерсом, обратила внимание на то, что не все результаты полетов, которые показывали опасное состояние уплотнительных колец, были включены в диаграмму, обсуждаемую на телеконференции (темные данные DD-тип 3: выборочные факты, а также DD-тип 2: данные, о которых мы не знаем, что они отсутствуют). На с. 146 отчета сказано следующее: «Менеджеры сопоставляли с температурой окружающей среды лишь те полеты, во время которых были зафиксированы критические состояния уплотнительных колец, но не рассматривали частоту их возникновения на основе данных всех полетов» [9 - https: //xkcd. com/552/ (https: //xkcd. com/552/); отчет комиссии Роджерса см. https: //forum. nasaspaceflight. com/index. php? topic=8535. 0 (https: //forum. nasaspaceflight. com/index. php? topic=8535. 0). ]. Именно в этом и заключается истинная причина трагедии: данные некоторых полетов не были включены в анализ. Ранее я уже показал, к каким проблемам может привести такое игнорирование данных.
Далее в докладе говорится: «При таком сопоставлении [то есть с использованием ограниченного набора данных] не было заметно отклонений от нормы в распределении критических состояний уплотнительного кольца по всему диапазону температур при запуске от 53 до 75? F [от 12 до 24? C}». Это означает, что нет очевидной зависимости между температурой воздуха и числом уплотнительных колец, показывающих критическое состояние. Тем не менее «если рассматривать всю историю полетов, включая “нормальные” полеты без каких-либо разрушений или прорывов газа, результаты сопоставления существенно отличаются». Иначе говоря, если вы включите все данные, то получите другую картину. Фактически не включенные в анализ полеты, которые осуществлялись при более высоких температурах, с гораздо большей вероятностью не имели проблем, и это были те самые темные данные, не учтенные на графике. Ведь если вывод о том, что, чем выше температура, тем меньше вероятность возникновения проблемы, верен, то верно и обратное: чем температура ниже, тем выше вероятность возникновения этой проблемы. А согласно прогнозу температура воздуха на момент запуска была 31? F или около 0? C.
Читать похожие на «Темные данные» книги

Электронный учебник – сборник материалов, после изучения которого вы сможете получить краткое и емкое представление о работе с Большими Данными. – Что такое Большие Данные? – Откуда берутся Большие Данные и в чем их польза? – Из каких этапов состоит работа над Большими Данными? – Как собирать, хранить и анализировать Большие Данные? – Как понять, о чем говорят специалисты? На изучение вам потребуется 40 минут. В конце вас ждут вопросы для проверки усвоения материала.

Собрать разрозненные данные для отчета и представить их наглядно не самая простая задача для заказчика. Об этом хорошо знает Алексей Колоколов, который обучает анализу и визуализации данных с 2015 года. Он написал подробное руководство по созданию дашбордов и посвятил большую его часть практике. Колоколов последовательно разбирает процесс составления отчета, начиная с подготовки данных и заканчивая оформлением в фирменном стиле. На реальных примерах он описывает, что нужно сделать на каждом

С погоней разобрался, молодец, Кериэль! Теперь и с остальными делами можно. Что на очереди? Сестра, которая жаждет тебя убить? Задумавший недоброе сородич? Взрыв в архиве? Покушения на наместника? Подозрительный инквизитор? Темные души, поселившиеся внутри? Подумаешь! Выпьем горячего кахве, закусим свежей булочкой и со всеми напастями справимся. Или нет…

Власть, которая казалась вечной, рухнула. Жертвы неизбежны – новое всегда приходит с кровью. Новое всегда не такое, каким кажется. Особенно для тех, кто его ждал. Они хотели перемен – а им стали указывать во что одеваться… Они отказывались молчать – и стали пропадать из собственных домов… Они затаились, но взрыв неизбежен. Быть свободным – все равно, что дышать. Смогут ли молодые герои противостоять новой власти? Или проще смириться и покорно принять, что решения уже приняты? Признать их силу и

Сумеречный двойной мир разделен между двумя населяющими его расами: темными альвами, живущими на поверхности Свартальвхейма, и двергами, заселяющих его подземье. Армаэля – наследника трона темных альвов ждала тяжелая доля. Пойти войной на светлых альвов и вернуть темную материю, являвшуюся источником питания их звездных кораблей, но для начала ему предстояло разобраться с заговором против него и собрать войско чудовищ. Армаэль преодолел границу между мирами и проник в Альвхейм, там по воле

Орланда с детства ненавидела драконов: по вине одного из Крылатых лордов девушка осиротела. Воспитанная теткой, она с малолетства видела изнанку академии магии и не желала в ней учиться. Но пробудившийся дар не оставил выбора. Только идти по накатанной дорожке Орланда не собиралась и со скандалом покинула академию сразу после получения диплома. Спустя четыре года новый ректор просит ее занять вакантную должность на Темном факультете. Только вот он дракон, а в академии творятся непонятные вещи.

Это лето Валерий Швецов, молодой архивист из Москвы, запомнит надолго. Благодаря поручению Великого Полоза ему пришлось пережить массу приключений, как забавных, так и страшных, у него появились новые друзья и новые враги, причем не всегда можно понять, кто из них кем на самом деле является. И самое главное – еще ничего не закончилось. Впереди у Валеры новые испытания. Ему предстоит попасть в закрытый для всего мира дом, пройти через Туманные Пути, куда смертным путь заказан, повидать путь Вия,

1889 год, Эдинбург. Большое семейство устраивает спиритический сеанс – популярную забаву викторианской эпохи. Провести его приглашают гадалку по имени мадам Катерина. Но наутро после сеанса все приглашённые оказываются мертвы – за исключением Катерины. Гадалке грозит казнь за убийство шестерых, но она клянётся, что невиновна. Распутать это загадочное дело предстоит двум инспекторам шотландской полиции – Девятипалому Макгрею, известному своей кипучей натурой и любовью к оккультным наукам, и Иэну

Продолжение Катарсиса… Попаданец в Мире магии и меча, пережившем апокалипсис. Голод, страх, запустение, средневековье с мечниками и магами. Но кроме них в мире разлита Скверна и бродят её порождения – чудовища, мутанты и ожившие мертвецы. Все против всех. И хорошо было бы, если бы я был бы спецназовцем, мастером фехтования или магом с постоянным доступом к Википедии, но… Возможно, так и есть, но я – случайно помещён в первое попавшееся тело и совсем ничего не помню о себе. Совсем ничего. А

Даша Васильева – мастер странных покупок, но на сей раз она превзошла себя. Дашутка купила приправу под названием «Бня Борзая», которую из магазина доставили домой на… самосвале. И теперь вся семья ломает голову, как от этой «вкусноты» избавиться. В это же время в детективное агентство полковника Дегтярева обратилась студентка исторического факультета Анна Волкова. Она подрабатывает составлением родословных. Однажды мама подарила Ане сумку, которую украшали ее фотография в молодости и надпись