Большие данные
Термин «большие данные» вошел в моду еще в прошлом десятилетии. Представьте, что у вас есть огромное количество данных: вы можете их просеивать в надежде на инсайт, который, возможно, поспособствует успеху вашей стратегии в сфере данных. Неплохо звучит, правда? Любая организация ухватится за такое.
Большие данные – это «разнообразные данные, поступающие в увеличивающихся объемах и с увеличивающейся скоростью».
Сейчас принято говорить о трех «V» больших данных: это разнообразие (Variety), объем (Volume) и скорость (Velocity). Эти три волшебных слова определяют ценность для организации того огромного количества данных, которые она производит. Я в свое время работал на одну из крупнейших финансовых организаций мира. Данные, которыми располагала эта организация, вполне соответствовали этим трем критериям. Объем данных был огромен. Скорость, с которой они поступали, очень велика. Про разнообразие и говорить нечего: мы собирали их едва ли не во всех странах мира. Это определенно были большие данные. Но насколько соответствует истинная ценность больших данных для организации шумихе вокруг этого понятия?
Занимаясь разработкой и воплощением аналитической стратегии, мы должны понимать, что не следует поддаваться «хайпу» по поводу данных и информации. Я имею в виду истерию, зачастую нагнетаемую вокруг взаимодействий с большими данными. Да, в рамках стратегии вам могут понадобиться источники и система обработки больших данных, чтобы распоряжаться ими с пользой. Со временем я пришел к нехитрой мысли, что важны не только большие данные, но также и средние, и малые, и какие угодно. Если сосредоточиться только на больших данных, есть опасность пропустить нечто ценное, поэтому организация должна поставить себе на службу любые данные, находящиеся в ее распоряжении.
Что касается связи больших данных с дата-грамотностью, то она очевидна. Неважно, какие данные перед вами: большие, маленькие, круглые или треугольные, просто нужно чувствовать себя уверенно при обращении с ними и применять навыки дата-грамотности, четыре уровня аналитики и три «С» дата-грамотности, чтобы иметь возможность почерпнуть из данных ценные знания.