Именно столько получает специалист, умеющий обрабатывать и извлекать полезную информацию из большого объема данных. Чаще всего такого профессионала называют Data Scientist. Помимо того, что эти специалисты зарабатывают неплохие деньги, так, по версии журнала от 2012 года Harvard Business Review, «Data scientist — самая сексуальная профессия XXI века». С того времени «сексуальность» данной профессии только растет, также как и доходы.
После того, как я заинтересовал вас такими цифрами и фактами, возможно у читателей появился больший интерес к термину «Big Data». Обратимся к Википедии за определением:
Большие данные (англ. big data) в информационных технологиях — серия подходов, инструментов и методов обработки структурированных и неструктурированных данных огромных объёмов и значительного многообразия для получения воспринимаемых человеком результатов, эффективных в условиях непрерывного прироста, распределения по многочисленным узлам вычислительной сети, сформировавшихся в конце 2000-х годов, альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence.
На самом деле определений по Большим данным множество, каждый авторитетный источник имеет свое. В сфере IT такое часто встречается, так как с каждым днем появляются новые продукты, а за ними термины не успевают сформироваться.
Проще говоря, человечество накопило огромные массивы данных, хранящиеся на наших компьютерах, в дата-центрах, облаках, которую необходимо обрабатывать и извлекать полезную информацию. Эту ценную информацию крупные компании используют для своих будущих идей и разработок, а компании в сфере услуг совершенствуют свою работу, привлекая дополнительный трафик.
Я уже писал статью про технологию Больших данных в менеджменте. Почитать можно тут: Время «укрощать» цифры.
Теперь перейдем к профессии Data Scientist, а также как стать специалистом в этой области.
Раньше специалисты по данным считались обычными программистами, буквально лет 5-7 назад они выделились в отдельную профессию. Еще тогда скептики отмечали, что этот мэйнстрим проживет пару лет и лопнет как пузырь. Но их ожидания не оправдались и уже сегодня все больше компаний, в первую очередь из сферы услуг и финансового сектора, обращают повышенный интерес к специалистам.
Что необходимо знать, чтобы стать Data Scientist
Недавно натолкнулся на статью Александра Крота, который выписал основные направления, по которым нужно работать будущим специалистам по данным. Предлагаю их рассмотреть.
- Стань математиком. Необходимо иметь математическое мышление (Гуманитарии, извините, но это не для вас 😀 ). Изучите курсы дискретной математики, умейте работать с алгоритмами, крутите с цифрами в математической статистике и теории вероятностей.
- Будьте программистами. Здесь Александр Крот советует изучить язык программирования R или Python. Они как нельзя лучше подходят для матстата, обработки и визуализации данных.
- Изучите машинное обучение. Здесь вы научитесь применять свои методы в решении реальных поставленных задач.
- Познакомьтесь с Большими данными. Предстоит научиться работать с инструментами, которые собирают массивы данных.
- Работайте с современными инструментами. Здесь вам придется применить все знания по решению задач в машинном обучении только относительно больших массивов данных.
Есть также онлайн курсы по Большим данным. Здесь вам уже в помощь Google!
Однозначно, эта новая профессия не «вымрет» со временем, а станет такой же востребованной и традиционной, как, к примеру, маркетолог.