Статистические методы являются ключевой частью науки о данных. Однако очень немногие аналитики данных обучены статистике должным образом, поскольку нет книг по статистике, написанных специально для аналитиков данных.С другой стороны, многие ресурсы, посвященные науке о данных, содержат статистические методы, но не раскрывают перспективы применения этих методов достаточно глубоко.Предлагаемая книга, написанная доступным языком, устраняет этот пробел. Если вы немного знакомы с языком программирования R и математической статистикой, то легко освоите материал и существенно повысите свой профессиональный уровеньВо второе издание включены примеры на языке Python, что расширяет практическое применение книги.Прочитав эту книгу, вы узнаете:Почему разведывательный анализ данных является ключевым предварительным шагом в науке о данныхКак случайная выборка может уменьшить смещение и привести к более высококачественному набору данных, даже в условиях больших данныхКак принципы планирования эксперимента помогают получить наиболее полные ответы на вопросыКак использовать регрессию для оценки результатов и выявления аномалийВы освоите:Ключевые методы классификации для предсказания, к какой категории относится записьСтатистические методы машинного обучения, которые "обучаются" на данныхМетоды обучения без учителя для извлечения информации из немаркированных данных2-е издание, переработанное и дополненное.
Statisticheskie metody yavlyayutsya klyuchevoy chastyu nauki o dannykh. Odnako ochen nemnogie analitiki dannykh obucheny statistike dolzhnym obrazom, poskolku net knig po statistike, napisannykh spetsialno dlya analitikov dannykh.S drugoy storony, mnogie resursy, posvyashchennye nauke o dannykh, soderzhat statisticheskie metody, no ne raskryvayut perspektivy primeneniya etikh metodov dostatochno gluboko.Predlagaemaya kniga, napisannaya dostupnym yazykom, ustranyaet etot probel. Esli vy nemnogo znakomy s yazykom programmirovaniya R i matematicheskoy statistikoy, to legko osvoite material i sushchestvenno povysite svoy professionalnyy urovenVo vtoroe izdanie vklyucheny primery na yazyke Python, chto rasshiryaet prakticheskoe primenenie knigi.Prochitav etu knigu, vy uznaete:Pochemu razvedyvatelnyy analiz dannykh yavlyaetsya klyuchevym predvaritelnym shagom v nauke o dannykhKak sluchaynaya vyborka mozhet umenshit smeshchenie i privesti k bolee vysokokachestvennomu naboru dannykh, dazhe v usloviyakh bolshikh dannykhKak printsipy planirovaniya eksperimenta pomogayut poluchit naibolee polnye otvety na voprosyKak ispolzovat regressiyu dlya otsenki rezultatov i vyyavleniya anomaliyVy osvoite:Klyuchevye metody klassifikatsii dlya predskazaniya, k kakoy kategorii otnositsya zapisStatisticheskie metody mashinnogo obucheniya, kotorye "obuchayutsya" na dannykhMetody obucheniya bez uchitelya dlya izvlecheniya informatsii iz nemarkirovannykh dannykh2-e izdanie, pererabotannoe i dopolnennoe.