Книги » Дэвид Хэнд » Темные данные » Читать онлайн бесплатно

На сайте интернет библиотеки вы можете начать читать книгу Темные данные - Дэвид Хэнд онлайн бесплатно и без регистрации. Электронная (цифровая) литература удобна тем, что читать романы online с телефона можно абсолютно везде. Вы нашли версию издания Темные данные, так как интересуетесь работами автора Дэвид Хэнд или жанром в стиле базы данных. Помимо чтения, книгу можно скачать в популярном формате fb2, перейдя на соседнюю страницу. Читайте актуальные новинки и скачивайте их на свои гаджеты.

Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой – крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, результатах медицинского исследования, которые намеренно утаили или случайно исказили, или данных, ставших «темными» из-за плохого набора критериев для включения в выборку. Хэнд также рассказывает о том, какие меры могут сгладить эффект «темных данных» и как их можно обратить себе на пользу. Книга будет интересна широкому кругу читателей, интересующихся дата-сайенс, программированием и статистикой.

Книга Темные данные читать онлайн бесплатно

Страница 1

Посвящается Шелли

Предисловие

Перед вами необычная книга. Почти все, что издается на эту тему – будь то популярная литература о больших или открытых данных, обработке данных или пособия по статистическому анализу, – основывается на том, что у вас уже есть. Речь идет об информации, хранящейся в компьютере, ящиках рабочего стола или аудио-, видеозаписях вашего смартфона. Но эта книга совсем о другом. Она о данных, которых у вас нет. Возможно, вы пытаетесь получить их прямо сейчас или когда-то безуспешно пытались сделать это, а может быть, ошибочно полагаете, что они у вас имеются. Как бы то ни было, речь пойдет о данных, которых у вас нет.

Я утверждаю и далее продемонстрирую это на многих примерах, что отсутствующие данные важны не менее тех, которыми мы располагаем. Вы сможете сами убедиться, что неизвестные нам данные являются причиной многих заблуждений, порой имеющих катастрофические последствия. Я покажу, как и почему это происходит. Затем я расскажу, как этого можно избежать – на что именно стоит обращать внимание, чтобы обойти неприятности. А в завершение, когда вы поймете, как возникают темные данные и как они создают нам проблемы, я покажу, как с их помощью перевернуть с ног на голову традиционное представление об анализе данных и, если вы достаточно проницательны, глубже вникнуть в свою область, улучшить процесс принятия решений и выбора действий.

Мое собственное понимание темных данных развивалось постепенно, на протяжении всей карьеры. Я благодарю всех, кто подкидывал мне проблемы, которые, как я постепенно осознал, были не чем иным, как проблемами темных данных. Я выражаю признательность всем, кто вместе со мной искал способы их решения. Сферы, где возникали эти проблемы, варьировались от медицинских исследований и фармацевтической промышленности до государственной и социальной политики, финансового сектора и производства – ни одна сфера человеческой деятельности не свободна от рисков, которые несут с собой темные данные.

Отдельно хочу поблагодарить тех, кто любезно согласился пожертвовать своим временем, чтобы прочитать рукопись этой книги, а именно Кристофороса Анагностопулоса, Нила Ченнона, Найла Адамса и трех анонимных читателей от издательства. Они помогли мне избежать неловкости перед вами, сократив число допущенных ошибок. Питер Таллак, мой агент, помог найти идеального издателя для этой работы, любезно давал мне советы и направлял работу над книгой в целом. Мой редактор из издательства Princeton University Press Ингрид Гнерлих была мудрым и ценным гидом в вопросах оформления проекта. Наконец, я особенно признателен своей жене профессору Шелли Ченнон, за ее вдумчивую критику моих рукописей. Благодаря ее вкладу книга стала значительно лучше.

    Имперский колледж, Лондон

Часть I

Темные данные

Происхождение и последствия

Глава 1

Темные данные

Незримая сила, которая формирует наш мир

Призрак данных

Как-то во время прогулки я встретил странного пожилого человека, который что-то высыпал на пешеходную дорожку примерно через каждые 15 м. Я не смог сдержать любопытства и поинтересовался, что это он такое делает.

– Рассыпаю слоновий порошок, – совершенно серьезно ответил он. – Слоны не выносят его запах, поэтому держатся подальше.

– Постойте, но в наших краях нет слонов, – улыбнулся я.

– Вот именно! – воскликнул он. – Это очень эффективное средство.

Этот забавный случай служит хорошим прологом для вещей куда более серьезных, о которых я собираюсь рассказать.

Каждый год корь убивает почти 100 000 человек. Один из 500 заболевших умирает от осложнений, многие страдают от необратимой потери слуха или от поражения головного мозга. К счастью, для Соединенных Штатов это редкое заболевание – например, в 1999 г. было зарегистрировано всего 99 случаев. Однако внезапная вспышка кори в январе 2019 г. привела к тому, что в штате Вашингтон была объявлена чрезвычайная ситуация. Некоторые штаты также сообщили о резком увеличении числа случаев заражения корью [1 - https: //blog. uvahealth. com/2019/01/30/measles-outbreaks/ (https: //blog. uvahealth. com/2019/01/30/measles-outbreaks/), accessed 16 April 2019. ]. Подобное отмечалось и в других местах. На Украине в середине февраля 2019 г. число заразившихся превысило 21 000 [2 - http: //outbreaknewstoday. com/measles-outbreak-ukraine-21000-cases-2019/ (http: //outbreaknewstoday. com/measles-outbreak-ukraine-21000-cases-2019/), accessed 16 April 2019. ]. В Европе в 2017 г. было отмечено 25 863 случая, а в 2018 г. – уже более 82 000 [3 - https: //www. theglobeandmail. com/canada/article-canada-could-see-large-amount-of-measles-outbreaks-health-experts/ (https: //www. theglobeandmail. com/canada/article-canada-could-see-large-amount-of-measles-outbreaks-health-experts/), accessed 16 April 2019. ]. С 1 января 2016 г. по конец марта 2017 г. в Румынии зарегистрировано более 4000 случаев заражения и 18 летальных исходов.

Корь – коварное заболевание, распространяющееся незаметно, поскольку симптомы проявляются лишь через несколько недель после инфицирования. Болезнь поражает организм намного раньше, чем обнаруживаются ее признаки.

Это не означает, что корь нельзя предотвратить. Простая вакцинация способна иммунизировать организм, эффективно снижая риск заражения. И, действительно, национальные программы вакцинации, подобные тем, которые проводились в Соединенных Штатах, доказали свой успех. В результате большинство родителей в странах, где осуществляются такие программы, никогда не видели и тем более не испытывали на себе ужасных последствий этого заболевания.

Именно поэтому, когда родителям рекомендуют делать детям прививку от кори – заболевания, которого они и в глаза не видели, которым не болели ни их друзья, ни соседи и которое Центр по контролю и профилактике заболеваний признал неэндемичным для Соединенных Штатов, – они принимают такой совет с изрядной долей скепсиса.

Вакцинировать от того, чего вроде бы нет? Это то же самое, что использовать слоновий порошок.

Правда, в отличие от слонов, риск заражения все-таки существует, причем такой же реальный, как и раньше. Просто информация и данные, которые нужны родителям для принятия решений, отсутствуют, и риски становятся неочевидными.

Для многочисленных видов отсутствующих данных я использую обобщающий термин «темные данные». Темные данные скрыты от нас, и этот факт означает, что мы рискуем недооценить опасность, сделать неправильный вывод и принять неверное решение. Иначе говоря, наше неведение становится причиной ошибок.

Понятие «темные данные» возникло из аналогии с другим, физическим, термином – темной материей. Около 27 % Вселенной состоит из этого таинственного вещества, которое не взаимодействует со светом или каким-либо другим электромагнитным излучением и потому остается невидимым. Поскольку темная материя не видна, когда-то астрономы не подозревали о ее существовании. Но затем наблюдения за вращением галактик показали, что звезды более удаленные от центра движутся ничуть не медленнее звезд, расположенных ближе к центру галактики, что противоречит нашему пониманию гравитации. Эта аномалия вращения галактик на сегодняшний день объясняется предположением, что галактики имеют более значительную массу, чем та, о которой мы можем судить по звездам и другим видимым в телескопы объектам. Поскольку эта дополнительная масса не видна, ее назвали темной материей. И она может быть весьма значительной: согласно оценкам, наша галактика Млечный Путь содержит в 10 раз больше темной материи, чем обычной.

Предыдущая стр. 1 Следующая

Читать похожие на «Темные данные» книги

Электронный учебник – сборник материалов, после изучения которого вы сможете получить краткое и емкое представление о работе с Большими Данными. – Что такое Большие Данные? – Откуда берутся Большие Данные и в чем их польза? – Из каких этапов состоит работа над Большими Данными? – Как собирать, хранить и анализировать Большие Данные? – Как понять, о чем говорят специалисты? На изучение вам потребуется 40 минут. В конце вас ждут вопросы для проверки усвоения материала.

Собрать разрозненные данные для отчета и представить их наглядно не самая простая задача для заказчика. Об этом хорошо знает Алексей Колоколов, который обучает анализу и визуализации данных с 2015 года. Он написал подробное руководство по созданию дашбордов и посвятил большую его часть практике. Колоколов последовательно разбирает процесс составления отчета, начиная с подготовки данных и заканчивая оформлением в фирменном стиле. На реальных примерах он описывает, что нужно сделать на каждом

С погоней разобрался, молодец, Кериэль! Теперь и с остальными делами можно. Что на очереди? Сестра, которая жаждет тебя убить? Задумавший недоброе сородич? Взрыв в архиве? Покушения на наместника? Подозрительный инквизитор? Темные души, поселившиеся внутри? Подумаешь! Выпьем горячего кахве, закусим свежей булочкой и со всеми напастями справимся. Или нет…

Власть, которая казалась вечной, рухнула. Жертвы неизбежны – новое всегда приходит с кровью. Новое всегда не такое, каким кажется. Особенно для тех, кто его ждал. Они хотели перемен – а им стали указывать во что одеваться… Они отказывались молчать – и стали пропадать из собственных домов… Они затаились, но взрыв неизбежен. Быть свободным – все равно, что дышать. Смогут ли молодые герои противостоять новой власти? Или проще смириться и покорно принять, что решения уже приняты? Признать их силу и

Сумеречный двойной мир разделен между двумя населяющими его расами: темными альвами, живущими на поверхности Свартальвхейма, и двергами, заселяющих его подземье. Армаэля – наследника трона темных альвов ждала тяжелая доля. Пойти войной на светлых альвов и вернуть темную материю, являвшуюся источником питания их звездных кораблей, но для начала ему предстояло разобраться с заговором против него и собрать войско чудовищ. Армаэль преодолел границу между мирами и проник в Альвхейм, там по воле

Орланда с детства ненавидела драконов: по вине одного из Крылатых лордов девушка осиротела. Воспитанная теткой, она с малолетства видела изнанку академии магии и не желала в ней учиться. Но пробудившийся дар не оставил выбора. Только идти по накатанной дорожке Орланда не собиралась и со скандалом покинула академию сразу после получения диплома. Спустя четыре года новый ректор просит ее занять вакантную должность на Темном факультете. Только вот он дракон, а в академии творятся непонятные вещи.

Это лето Валерий Швецов, молодой архивист из Москвы, запомнит надолго. Благодаря поручению Великого Полоза ему пришлось пережить массу приключений, как забавных, так и страшных, у него появились новые друзья и новые враги, причем не всегда можно понять, кто из них кем на самом деле является. И самое главное – еще ничего не закончилось. Впереди у Валеры новые испытания. Ему предстоит попасть в закрытый для всего мира дом, пройти через Туманные Пути, куда смертным путь заказан, повидать путь Вия,

1889 год, Эдинбург. Большое семейство устраивает спиритический сеанс – популярную забаву викторианской эпохи. Провести его приглашают гадалку по имени мадам Катерина. Но наутро после сеанса все приглашённые оказываются мертвы – за исключением Катерины. Гадалке грозит казнь за убийство шестерых, но она клянётся, что невиновна. Распутать это загадочное дело предстоит двум инспекторам шотландской полиции – Девятипалому Макгрею, известному своей кипучей натурой и любовью к оккультным наукам, и Иэну

Продолжение Катарсиса… Попаданец в Мире магии и меча, пережившем апокалипсис. Голод, страх, запустение, средневековье с мечниками и магами. Но кроме них в мире разлита Скверна и бродят её порождения – чудовища, мутанты и ожившие мертвецы. Все против всех. И хорошо было бы, если бы я был бы спецназовцем, мастером фехтования или магом с постоянным доступом к Википедии, но… Возможно, так и есть, но я – случайно помещён в первое попавшееся тело и совсем ничего не помню о себе. Совсем ничего. А

Даша Васильева – мастер странных покупок, но на сей раз она превзошла себя. Дашутка купила приправу под названием «Бня Борзая», которую из магазина доставили домой на… самосвале. И теперь вся семья ломает голову, как от этой «вкусноты» избавиться. В это же время в детективное агентство полковника Дегтярева обратилась студентка исторического факультета Анна Волкова. Она подрабатывает составлением родословных. Однажды мама подарила Ане сумку, которую украшали ее фотография в молодости и надпись