Если вы здесь, значит, интересуетесь образованием, а конкретно обучением Data Science. Статья будет полезна как новичкам, так и тем, кто уже сталкивался с питоном, базами данных или нейронными сетями.
Достойные онлайн-курсы по Data Science, машинному обучению
Перспектива профессии и зарплаты дата сайентистов
Просто в одночасье стали мега востребованы специалисты по Data Science, они нужны почти всем и как можно больше. Это голубой океан возможностей для тех кому интересны: математическая статистика, программирование и машинное обучение.
В штатах эта профессия бьёт рейтинги и возглавляет списки по: перспективности, востребованности, зарплате. У нас дела ничуть не хуже, всё что связано с бизнесом, банковским сектором, IT, страховым направлением, медициной, биоинформатикой и т. д., везде требуются датасаентисты.
После профессиональных курсов, которые идут минимум год, вы сможете подавать резюме на позицию Junior (в денежном эквиваленте, примерно от 80 тысяч рублей в месяц — это в Новосибирске, Екатеринбурге). В Москве или Санкт-Петербурге всё намного интереснее, Middle со стажем от года имеет доход от 150 тыс. руб., Senior зарабатывает от 250 тысяч рублей.
Знайте! По мимо всех выше перечисленных преимуществ есть еще одно — это возможность удаленной работы.
Где лучше учиться и как стать специалистом по дата сайнс
Всех кто погружается в Data Science я бы поделил, на 3 группы:
- Это технари, которые окончили университет. К сожалению, а для новичков — к счастью, вузов, которые обучают этому направлению, по пальцам пересчитать.
- Это переквалифицированные разработчики. Тут должны совпасть 2 вещи: опыт в программировании, а также желание заниматься исследованиями и нейросетями.
- Профильные онлайн-курсы. Менеджер одной из школ посетовала, что у них есть успешный опыт обучения людей совсем несвязанных с математикой и программированием.
Безусловно, учиться интереснее и быстрее получается в онлайн-школах (стать хорошим дата сайнс специалистом можно за год-полтора).
Вуз — это отличный вариант, но госучреждения слишком неповоротливы и с сильным скрипом меняют обучающие программы, а так же время придётся потратить гораздо больше.
Если вам интересно моё мнение, то я бы сделал следующим образом: подтянул свои знания на бесплатных программах, а затем пошёл учиться на платные онлайн курсы, где эксперты делятся своим опытом.
Важно! Я узнал, что на рынке абсолютно нет конкуренции, а хантеры будут хватать всех дата-сайентистов на стадии обучения, ещё года так до 25-го, предлагая им различные плюшки (как было лет 5 назад с Java).
Лучшие онлайн-курсы по Data Science
Я старался найти всё, что есть по этой теме. Сразу выкинул тех, кто обещает золотые горы через 2-3 месяца и условно-бесплатные мероприятия. Меня интересовал определённый массив информации, а именно:
Программа | Покрывает ли необходимый стек знаний |
Подача материала | Как хорошо доносят информацию |
Учебный процесс | Насколько интересно проходят занятия |
Взаимодействие с наставником | Помощь и открытость экспертов |
Созданные проекты во время учёбы | Соответствуют ли тенденциям кейсы |
Стажировка, трудоустройство | Наиболее ключевой момент |
Если вы проходили другой курс и он не совпадает с текущей подборкой, то можете указать это в комментариях. Мой субъективный топ:
- МЕСТО. Skillbox.
- МЕСТО. Нетология.
- МЕСТО. GeekBrains.
- Praktikum Yandex.
- SkillFactory.
Я не знаю тех, кто пишет сомнительные отзывы о школах, которые в моём рейтинге, может быть конкуренты. Я вижу другое, что у них сильнейшие эксперты, за плечами большие проекты, программы очень сильные, а учебный процесс выстроен на профессиональном уровне.
Да, порой ценник высокий, но вы должны понимать, что это вложение в своё качественное образование на длительный период, которое окупится в этот же год после учёбы.
Skillbox
Цена. 5 574 руб/месяц, со скидкой.
Срок. 2 года.
Для кого. Без опыта, программистов, начинающих аналитиков.
Формат. Онлайн.
Практика. Большой объём. 3 дипломных проекта.
Документы. Диплом.
Бонусы. Полгода обучения бесплатно. 2 специальности в одном курсе.
Трудоустройство. Помощь. Совместная работа с Мегафон.
официальный сайт
Процесс
Изучаете тему (практические видеоуроки и вебинары) → выполняете задания в комфортном режиме → взаимодействие с преподавателем (исправление ошибок, советы) → защита дипломного проекта.
Занятия проходят в онлайн-режиме, их можно совмещать с работой или учёбой. Все материалы остаются с вами после курса. Ученики тратят на ДЗ от 3 до 5 часов в неделю.
Отработка навыков, практические задания, а так же дипломные проекты можно проходить на современной, соревновательной, международной платформе (получите рейтинг).
Программа
Состоит из 9 блоков:
- Python для Data Science. Введение, основы, операторы, циклы, функции, установка среды, коллекции, файлы, исключения, ООП, итераторы.
- Аналитика. Библиотеки, визуализация данных, курсовая работа, SQL.
- Статистика и теория вероятностей. Основы, манипуляции.
- Математика. Базовая часть объектов, функции, графики, интерполяция, аппроксимация, векторы, матрицы, линейная регрессия.
- Машинное обучение. Концепции, жизненный цикл проекта, метрики, регуляризация, классификация, кластеризация, техники, знакомство с Kaggle, курсовая.
- Аналитика. Язык R, от основ до A/B тестирования. Интерактивная визуализация.
- Machine Learning. Введение в нейронные сети, практика, свёртки, сегментации, детектирование объектов, NLP, оптимизация.
- Бонусный курс.
- Английский для IT-специалистов.
Навыки
На выходе у вас будет 2 года стажа — это существенное преимущество.
Вы научитесь:
- программировать на Python, R;
- взаимодействовать с библиотеками и базами данных (Pandas, NumPy, PostgreSQL, MongoDB);
- работать с фреймворками для нейронных сетей (Tensorflow, Keras);
- создавать дашборды и интерактивную инфографику;
- писать рекомендательную систему.
Нетология
Цена. 3 972 руб/месяц, рассрочка на 2 года. 143 000 рублей со скидкой 40%.
Срок. 1,5 года.
Для кого. Новичков, разработчиков, аналитиков.
Формат. Видеолекции, вебинары, хакатон.
Практика. Основной акцент.
Документы. Диплом.
Бонусы. Гарантия возврата денег.
Трудоустройство. Оказывают помощь.
Отзыв от ученика:
официальный сайт
Процесс
Обучение построено на основе практических работ. Все ваши действия будут под контролем преподавателей. Домашние задания можно выполнять до идеального результата (сколько угодно раз). Каждый тематический блок подкрепляется лабораторной.
В конце вас ждёт проектная работа, выполнение которой даёт пропуск к диплому.
Программа
Поделена на 4 ступени:
- Аналитическое мышление (введение, таблицы, статистика, анализ данных). Визуализация (цель, инструменты, связи, потоки, процессы, карты).
- SQL (архитектура, запросы, команды, импорт/экспорт, библиотеки, функции, консоль, зависимости). Аналитика больших данных (что это, монетизация, характеристика сбор, реализация проектов, NoSQL-подход, MapReduce, Hadoop). Python (типы данных, циклы, функции, классы, библиотеки, визуализация, статистика, события, регрессии, корреляции, интервалы). Математика (линейная алгебра, матанализ, оптимизация, вероятность, предельная теорема).
- Машинное обучение (регрессивный анализ, классификация, потери, точность, качество данных, переменные). Рекомендательные системы (content-based, collaborative filtering, гибридные алгоритмы). Временные ряды (знакомство, методы анализа, модели, процессы, изменения). Нейронные сети (введение, углубление, автокодировщики). Компьютерное зрение (поиск похожих изображений, сегментация, порождающие модели). Обработка естественного языка (основы, структура, синтаксис, дистрибутивная семантика, словари, моделирование, классификация, извлечение информации). Deep learning (регрессия, многослойная нейронка).
- Менеджер data-проектов (требования, методология, отчёты, результаты). Коммуникация (синхронизация, убеждение, интеллект, переговоры, тесты, резюме). Команда (авторитет, общение, налаживание связей). Выступления (презентация, перестать бояться). Хакатон (Kaggle competitions).
Навыки
Вы освоите:
- язык программирования Python и библиотеки;
- использовать математику и сложные алгоритмы;
- работать с базами данных;
- строить модели машинного обучения;
- создавать рекомендательные системы;
- обучать многослойные нейронные сети;
- выявлять проблемы и обрабатывать данные;
- работать в команде;
- курировать Data-проекты.
GeekBrains
Цена. 5 556 руб/мес. рассрочка на 3 года, скидки до 40%.
Срок. Более 1,5 лет.
Для кого. С нуля.
Формат. Онлайн-трансляции.
Практика. Большой объём.
Документы. Диплом.
Бонусы. Курсы и подписки к платным сервисам.
Трудоустройство. Гарантируется.
официальный сайт
Процесс
Уроки проводятся 1-2 раза в неделю, в вечернее время. На лекциях учитель объясняет тему, информация отображается на экране, параллельно студенты пишут вопросы, общаются в чате. В конце занятия получаете практическое задание, результат которого обсуждается на следующем уроке.
Все трансляции записываются и доступны для просмотра, если не смогли посетить вебинар. Методички также выдаются и по ним легко делается ДЗ.
Возможны перерывы в учёбе, к тому же интенсивность вы выбираете самостоятельно.
Огромным преимуществом является оценка преподавателя, если много дизов, то его меняют на более лучшего специалиста.
Программа
1 год
Программирование:
- Основы Python. Знакомство, функции, инструменты, файлы, ООП.
- Высшая математика. Элементарная алгебра, линейная, теория вероятностей.
- Библиотеки. NumPy, работа в Pandas, Matplotlib, Scikit.
- MySQL. Окружение, команды, проектирование, операции, запросы.
Данные, статистика:
- Сбор и обработка. Основы, парсинг HTML, системы управления, Scrapy, Selenium.
- Библиотеки. Введение, анализ, проверка, классификация, оценка.
- Linux. Установка, знакомство, пользователи, процессы, скрипты, пакеты, docker.
- Big Data. Введение в экосистему Hadoop.
Математика:
- Матанализ. Множество, предел функции, производная, интеграл, ряды.
- Линейная алгебра. Пространство, матрицы, преобразования, уравнения, сингулярное разложение.
- Теория вероятностей. Математическая статистика, события, величины, гипотезы, анализ.
Машинное обучение:
- Алгоритмы. Линейная/логистическая регрессия, масштабирование признаков, дерево решений, случайный лес, бустинг.
- Бизнес. Маршрутизация заявок, пользователи, связи, моделирование, прогнозы, тесты.
2 год
Нейронные сети:
- Рекомендательные системы. Введение, бейзлайны, фильтрация, контент, похожие товары.
- Видеокурс от МегаФона. Курсовой проект.
- Нейронка. Основы, библиотеки Keras/TensorFlow, сегментация, GAN.
Специализация:
- Компьютерное зрение.
- Фреймворк PyTorch.
- Естественный язык.
Навыки
Вы овладеете следующими специальностями и сможете работать по ним:
- Data Scientist;
- Data Analyst;
- Machine Learning Engineer;
- Computer Vision;
- NLP.
Портфолио будет набито кейсами, за время учёбы вы внесёте туда 12 штук.
Яндекс Практикум
Стоимость. Сразу 228 т. р. или рассрочка по 16 т. р. в месяц.
Период. 1,5 года.
Кому подходит. Начинающим.
Формат. Онлайн.
Практические занятия. Более 960 часов.
Что выдают. Диплом Яндекса.
Плюшки. Вводный интенсив бесплатный.
Карьера. Помощь.
Как проходит
Используется многофакторная методика: код-ревьюер, преподаватель, наставник, куратор и техподдержка.
Учиться предстоит в 3 этапа: теория с закреплением в тренажёре, ДЗ для самостоятельной работы и наставник для разбора кода.
Есть возможность брать перерывы (2 раза по месяцу).
По окончании у вас будет более 14 проектов в портфолио.
SkillFactory
Стоимость. 2 тарифа: Базовый 6 900 руб/мес., Расширенный 8 100 руб/мес. Скидки до 40%.
Период. 2 года.
Кому подходит. С нуля.
Формат. Онлайн.
Практические занятия. Основной акцент.
Что выдают. Сертификат.
Плюшки. Свой кадровый центр.
Карьера. Помощь.
Занятия идут несколько раз в неделю (итого 10 часов).
На уроках изучаете теоретический материал и закрепляете на практике. Самостоятельно напишите модели различной сложности.
Регулярные живые консультации с экспертами.
Учебный материал
Поделен на 4 части:
Семестр 1. Foundation.
- Python. Основы, анализ данных в Pandas, NumPy, визуализация, файлы, API.
- Подгрузка данных. Выгрузка, SQL, решение задач.
- Разведывательный анализ данных. Статистика, гипотезы, эксперименты, ML-Flow.
Семестр 2. Математика.
- Machine Learning. Введение, классификация, регрессия, признаки, валидация, оптимизация.
- Математика. Линейная алгебра, матанализ, вероятности, оценка алгоритмов.
- ML в бизнесе. Временные ряды, рекомендательные системы, эффективность.
Семестр 3 и 4. Выбор специализации.
- ML-разработчик. Введение в Deep Learning, Python, MVP.
- CV-разработчик. Математика нейронных сетей, компьютерное зрение.
- NLP-разработчик. Hard/Software, задачи, алгоритмы.
Умения
Ваш уровень навыков будет ровняться Middle, соответственно зарплата будет выше.
Вы сможете:
- использовать нейронку;
- применять линейные регрессии, классификаторы, гибридные рекомендательные системы;
- работать с алгоритмами и временными рядами;
- ставить задачи и делать декомпозицию;
- коммуницировать с заказчиками и управлять проектами;
- доведёте свою модель до Production;
Почему выгоднее окончить профессиональные курсы, нежели вуз
Никто, кроме вас не должен решать, где и как вам учиться. Давайте вместе сравним плюсы платного онлайн-образования, а минусы вузу вы подставите сами.
- Процесс. В топовых онлайн-школах практически все эксперты обладают харизмой и интересной подачей информации, вам не будет скучно ни минуты.
- Программа. Кураторы курсов отслеживают актуальность всего стека технологий, который используют учителя.
- Наставник. Школа, как никто другой заинтересована в эффективном обучении. Ваш личный помощник (доступен практически 24/7) по любому вопросу.
- Практика. Безусловно, в вузах бывают курсачи и прочие проверочные срезы знаний, но они не смогут сравниться с профильными курсами, на которых выполняют целые проекты.
- Кейсы. В вузе не сможете составить достойное портфолио, как ни крути, только диплом.
- Время. Курсы дают больше знаний за год-полтора (к тому выходит дешевле), нежели универ за 4 года.
Преграды при самостоятельном обучении
Черпать знания придётся всегда и не факт, что платная информация окажется лучше, чем добытая из сети (и разумеется, наоборот). Главное — получить её вовремя, то есть массив данных, который вы изучили, сразу необходимо внедрять.
Приведу несколько примеров, почему, не вложив ни копейки, результат практически всегда будет печальный:
- youtube. Там есть всё, но подходит ли оно вам, актуальность материала какого года, а потраченное время на поиск, практика ложится на свои плечи, а кто даст волшебного пендаля, когда неохота и т. д.;
- наставник. «Мам я сам» — это конечно хорошо, но кто покажет подводные камни и объяснит, что там «под капотом», а куда развиваться дальше и в какую сторону смотреть, чтобы оставаться в трендах;
- синдром самозванца. Чтобы не случилось с вами такое, а именно сомнения: всё ли знаю, они вон с 12 лет программировали, а я всего-то год-два, я занимаю чьё-то место и для этой должности моих знаний не хватает. Для этого на курсах и пилят кейсы с нуля, в которых принимаете непосредственное участие, после такой практики у вас возрастут амбиции, что захотите сразу на Middle позицию.
Совет! А вообще, лучше так: вначале сам, а дальше к профи.
Как правильно подобрать онлайн-школу
Ошибиться нетрудно, когда огромный выбор и все плюс/минус одинаковые. Денежный момент отметаем сразу, так как учёба окупается на первом же проекте. Назову 6 признаков хорошей онлайн-школы или курсов:
- Лицензия. Маст хэв каждого заведения, к тому же это ваши гарантии.
- Учителя. Несложно узнать, кто вас будет обучать и выяснить их послужной список: где работали, в каких проектах участвовали, какими технологиями владеют.
- Пробник. У уверенных в себе школах есть демо-урок, можно запросить запись или поприсутствовать на «живом», сделать выводы.
- Материал. Тут важна как подача, так и его объём. Загляните на сайт поиска вакансий и сравните требования с тем, что предлагает школа.
- Портфолио. Кейсы в вашем багаже весьма нужная вещь, этим вы будете выделяться среди других претендентов на должность.
- Стажировка. Предлагают ли помощь после окончания учёбы — это ключевой и говорящий о многом нюанс.
Советы для начинающих
Есть некий алгоритм, который поможет уверенно войти в Дата сайнс и стать востребованным специалистом. Рекомендации для начинающих:
- выполняйте все задачи и ДЗ во время прохождения курса, лучших учеников забирают к себе партнёры школ;
- уделите внимание следующим навыкам: статистики, алгоритмам, машинному обучению, английскому, SQL, Python. C/C++ — это для Тимлида и выше;
- можно посетить интенсив по коммуникации — это пригодиться в общении с заказчиками и командой;
- самообразование и любознательность помогут быстрее освоиться в профессии, добывайте информацию где угодно, главное — не останавливайтесь после курсов;
- всё с чем приходится сталкиваться (кейсы, навыки, технологии) записывайте в портфолио и постоянно расширяйте его.
Старт карьеры с нуля, сразу после учёбы
Карьера развивается точно так же, как у любого другого программиста: Junior, Middle, Teamlead, Senior. Каждому этапу придётся посвятить год-два.
Вначале вам будут доверять несложные задачи и обрабатывать данные (причём направлять и показывать). Затем сможете самостоятельно выполнять стандартные действия с применением машинного обучения. В итоге будете принимать любые ТЗ от заказчика и реализовывать все его «хотелки», применяя алгоритмы и фреймворки.
Работать можно в стартапах, корпорациях, фрилансе или развивать свой бизнес, причём направления могут быть совершенно любые (IT, медицина, бизнес, банки, скоринг, распознавание речи и объектов, автономные машины и пр.).
Лучше начать свой путь в отечественных организациях, вы сможете спрашивать всё, что не знаете и будете быстрее перенимать опыт старших коллег. Далее, когда наберетесь скилов нужно пробоваться в зарубежные фирмы.
Если вдруг наскучит Дата сайнс, то легко сможете перейти в Chief Data Officer и управлять проектами, но это совсем другая история.
Всем удачи, вы уже многое сделали — начали интересоваться образованием!