Книга посвящена первичной обработке данных (Data Wrangling) на Python и оценке их качества (Data Quality). Материал содержит основополагающие концепции, экспертные советы и ресурсы, необходимые для первичной обработки, извлечения, оценки и анализа данных. Все темы раскрыты на простых и наглядных примерах из практики. Даны необходимые и достаточные сведения о языке программирования Python 3.8+ для чтения, записи и преобразования данных из различных источников, а также для обработки данных в больших масштабах. Приведены лучшие практики документирования и структурирования кода. Описан сбор данных из файлов, веб-страниц и API. Рассмотрены приемы проведения базового статистического анализа наборов данных, а также наглядные и убедительные способы визуализации и представления данных. Изложение рассчитано как на новичков по обработке данных, так и на профессионалов. Электронный архив на сайте издательства содержит цветные иллюстрации к книге.
Kniga posvyashchena pervichnoy obrabotke dannykh (Data Wrangling) na Python i otsenke ikh kachestva (Data Quality). Material soderzhit osnovopolagayushchie kontseptsii, ekspertnye sovety i resursy, neobkhodimye dlya pervichnoy obrabotki, izvlecheniya, otsenki i analiza dannykh. Vse temy raskryty na prostykh i naglyadnykh primerakh iz praktiki. Dany neobkhodimye i dostatochnye svedeniya o yazyke programmirovaniya Python 3.8+ dlya chteniya, zapisi i preobrazovaniya dannykh iz razlichnykh istochnikov, a takzhe dlya obrabotki dannykh v bolshikh masshtabakh. Privedeny luchshie praktiki dokumentirovaniya i strukturirovaniya koda. Opisan sbor dannykh iz faylov, veb-stranits i API. Rassmotreny priemy provedeniya bazovogo statisticheskogo analiza naborov dannykh, a takzhe naglyadnye i ubeditelnye sposoby vizualizatsii i predstavleniya dannykh. Izlozhenie rasschitano kak na novichkov po obrabotke dannykh, tak i na professionalov. Elektronnyy arkhiv na sayte izdatelstva soderzhit tsvetnye illyustratsii k knige.