Основы BigData и Data Science: Алгоритмы, библиотеки, инструменты на базе Python
- Код курса: F.BDSP
- Длительность: 5 д.
- Цена: 90 000 Р
Расписание курса
Описание курса
Аннотация:
Курс знакомит с основными понятиями теории Больших Данных, важнейшими алгоритмами их обработки и практической организации работы с ними на примере Hadoop. В курсе дается обзор основных математических алгоритмов для анализа данных и машинного обучения. Рассматриваются алгоритмы обучения с учителем и без учителя, а также способы применения математического аппарата к решению конкретных задач машинного обучения. В качестве практических примеров демонстрируются наиболее популярные инструменты и библиотеки на базе Python: Anaconda, NumPy, Pandas, Matplotlib, Scikit и TensorFlow.
Цели курса:
- Дать обзор технологиям Больших Данных.
- Практически продемонстрировать популярные подходы к организации обработки Больших Данных.
- Продемонстрировать современные алгоритмы машинного обучения и указать сферы их применения.
- Практически показать работу с популярной платформой Anaconda для разработок в области машинного обучения.
- Продемонстрировать применение важнейших библиотек и инструментов для анализа данных: NumPy, Pandas, Scikit, Matplotlib, TensorFlow.
Аудитория:
- Специалисты в области анализа данных.
- Проектировщики систем машинного обучения.
- Специалисты, занимающиеся поддержкой систем обработки Больших Данных.
Предварительная подготовка:
- Минимальное знакомство с Linux и Python приветствуется, но не обязательно.
Программа курса:
- Описание методов, задач обработки и области применения технологий Big Data.
- Основные характеристики больших данных и их влияние на сбор, хранение, обработку и анализ данных.
- Критерии аналитических задач, решение которых предпочтительно с использованием технологий Big Datа.
- Кластеры Hadoop и алгоритмический базис MapReduce.
- Практический пример: построение кластера Hadoop и работа с ним.
- Платформа Anaconda как удобный инструмент работы с машинным обучением.
- Практический пример: возможности библиотек Python NumPy и Pandas.
- Обзор методов бизнес-аналитики.
- Методы машинного обучения (задача классификации и кластеризации, в частности задача формирования статистических выборок).
- Введение в бизнес-аналитику с использованием методов класса machine learning.
- Практический пример: Scikit.
- Языки и модели программирования, используемые в технологиях Big Data.
- Средства визуализации.
- Практический пример: использование Matplotlib.
- Архитектура верхнего уровня Big Data решений.
- Ограничения текущих технологий Big Data.
- Практический пример: использование TensorFlow
Записаться на курс: Основы BigData и Data Science: Алгоритмы, библиотеки, инструменты на базе Python