Насколько велики на самом деле "большие данные" - огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на "большие данные" вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель - лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина "культуромика", показывают, каким образом анализ "больших данных" помогает исследовать трудные проблемы языка, культуры и истории.
Naskolko veliki na samom dele "bolshie dannye" - ogromnye massivy informatsii, o kotorykh tak mnogo govoryat v poslednee vremya? Vot naglyadnyy primer: esli vypisat v lineyku vse tsifry 0 i 1, iz kotorykh sostoit odin terabayt informatsii (vpolne obychnaya emkost dlya sovremennogo zhestkogo diska), to tsepochka tsifr okazhetsya v 50 raz dlinnee, chem rasstoyanie ot Zemli do Saturna! I tem ne menee, na "bolshie dannye" vpolne mozhno vzglyanut v chelovecheskom izmerenii. Erets Eyden i ZHan-Batist Mishel - lingvisty i kompyuternye genii, sozdateli servisa Google Ngram Viewer i termina "kulturomika", pokazyvayut, kakim obrazom analiz "bolshikh dannykh" pomogaet issledovat trudnye problemy yazyka, kultury i istorii.
How big really is big data – massive amounts of information, about which so much talk lately? Here is a good example: if you write a line of all the numbers 0 and 1, consists of one terabyte of information (quite a common capacity for a modern hard disk), the digit string will be up to 50 times longer than the distance from Earth to Saturn! Nevertheless, "big data", it is possible to look within the human dimension. Erez Aiden and Jean-Baptiste Michel – linguist and computer geniuses, the creators of the Google Ngram Viewer the term "culturalia", show how analysis of big data helps to reveal the difficult puzzles of language, culture and history.