Книга позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она содержит краткий курс языка Python, элементы линейной алгебры, статистики, теории вероятностей, методов обработки данных. Приведены основы машинного обучения. Описаны алгоритмы k ближайших соседей, наивной байесовой классификации, линейной и логистической регрессии, а также модели на основе деревьев принятия решений, нейронных сетей и кластеризации. Рассмотрены приемы обработки естественного языка, методы анализа социальных сетей, основы баз данных, SQL и MapReduce.Во втором издании примеры переписаны на Python 3.6, игрушечные наборы данных заменены на "реальные", добавлены материалы по глубокому обучению и этике данных, статистике и обработке естественного языка, рекуррентным нейронным сетям, векторным вложениям слов и разложению матриц.2-е издание.
Kniga pozvolyaet izuchit nauku o dannykh (Data Science) i primenit poluchennye znaniya na praktike. Ona soderzhit kratkiy kurs yazyka Python, elementy lineynoy algebry, statistiki, teorii veroyatnostey, metodov obrabotki dannykh. Privedeny osnovy mashinnogo obucheniya. Opisany algoritmy k blizhayshikh sosedey, naivnoy bayesovoy klassifikatsii, lineynoy i logisticheskoy regressii, a takzhe modeli na osnove derevev prinyatiya resheniy, neyronnykh setey i klasterizatsii. Rassmotreny priemy obrabotki estestvennogo yazyka, metody analiza sotsialnykh setey, osnovy baz dannykh, SQL i MapReduce.Vo vtorom izdanii primery perepisany na Python 3.6, igrushechnye nabory dannykh zameneny na "realnye", dobavleny materialy po glubokomu obucheniyu i etike dannykh, statistike i obrabotke estestvennogo yazyka, rekurrentnym neyronnym setyam, vektornym vlozheniyam slov i razlozheniyu matrits.2-e izdanie.