Основы BigData и Data Science: Алгоритмы, библиотеки, инструменты на базе Python

  • Код курса: F.BDSP
  • Длительность: 5 д.
  • Цена: 90 000 Р

Расписание курса

27.06.2022
90 000 Р
Москва или онлайн

Аннотация:

Курс знакомит с основными понятиями теории Больших Данных, важнейшими алгоритмами их обработки и практической организации работы с ними на примере Hadoop. В курсе дается обзор основных математических алгоритмов для анализа данных и машинного обучения. Рассматриваются алгоритмы обучения с учителем и без учителя, а также способы применения математического аппарата к решению конкретных задач машинного обучения. В качестве практических примеров демонстрируются наиболее популярные инструменты и библиотеки на базе Python: Anaconda, NumPy, Pandas, Matplotlib, Scikit и TensorFlow.

Цели курса:

  • Дать обзор технологиям Больших Данных.
  • Практически продемонстрировать популярные подходы к организации обработки Больших Данных.
  • Продемонстрировать современные алгоритмы машинного обучения и указать сферы их применения.
  • Практически показать работу с популярной платформой Anaconda для разработок в области машинного обучения.
  • Продемонстрировать применение важнейших библиотек и инструментов для анализа данных: NumPy, Pandas, Scikit, Matplotlib, TensorFlow.

Аудитория:

  • Специалисты в области анализа данных.
  • Проектировщики систем машинного обучения.
  • Специалисты, занимающиеся поддержкой систем обработки Больших Данных.

Предварительная подготовка:

  • Минимальное знакомство с Linux и Python приветствуется, но не обязательно.

Программа курса:

  • Описание методов, задач обработки и области применения технологий Big Data.
  • Основные характеристики больших данных и их влияние на сбор, хранение, обработку и анализ данных.
  • Критерии аналитических задач, решение которых предпочтительно с использованием технологий Big Datа.
  • Кластеры Hadoop и алгоритмический базис MapReduce.
  • Практический пример: построение кластера Hadoop и работа с ним.
  • Платформа Anaconda как удобный инструмент работы с машинным обучением.
  • Практический пример: возможности библиотек Python NumPy и Pandas.
  • Обзор методов бизнес-аналитики.
  • Методы машинного обучения (задача классификации и кластеризации, в частности задача формирования статистических выборок).
  • Введение в бизнес-аналитику с использованием методов класса machine learning.
  • Практический пример: Scikit.
  • Языки и модели программирования, используемые в технологиях Big Data.
  • Средства визуализации.
  • Практический пример: использование Matplotlib.
  • Архитектура верхнего уровня Big Data решений.
  • Ограничения текущих технологий Big Data.
  • Практический пример: использование TensorFlow
Записаться на курс: Основы BigData и Data Science: Алгоритмы, библиотеки, инструменты на базе Python


Заявка на обучение

* - обязательные поля

Заявка на обучение

Записаться на курс:

Город:

Дата:

Город проведения