Голосов: 0
#1
Предлагаем Вам погрузиться в Data Science, чтобы познакомиться с Big Data! На нашем курсе Вы соприкоснетесь с самой популярной в IT концепцией.
Наш курс «Основы работы с большими данными: Data Science Orientation» позволит Вам «подружиться» с Big Data (большими данными).
- источники информации: структурированные и неструктурированные;
- основные характеристики больших данных и способы их анализа;
- элементы классификации данных и машинного обучения;
- основы статистического анализа, построение регрессионных зависимостей;
- визуализация «больших данных»;
- обзор классов задач, решаемых инструментами машинного обучения и ИИ: распознавание образов, звуков, текста, прогностика, анализ соцсетей;
- обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики;
- обзор прикладных инструментов: AWS, Azure AI, machine learning c демонстрацией применения;
- специальности в области «больших данных» и формирование команд: аналитики данных, «ученые по данным», программисты по «большим данным», менеджеры по «большим данным» (CDO).
- методы реорганизации работы компании при применении анализа «больших данных».
Предлагаемый курс позволит управляющему персоналу, менеджерам, разработчикам, другим сотрудникам, вовлеченным в аналитическую деятельность своей компании, ознакомиться с современными инструментами сбора, подготовки, обработки и анализа больших объемов разнородных данных.
По итогам курса Вы будете уверенно ориентироваться в мире «больших данных», машинного обучения и сможете организовывать команды для работы с «большими данными» и определите направление своего профессионального развития в этой области.
Модуль 1. Область применения больших данных. Типовые задачи.
Модуль 2. Сбор и подготовка исходных данных. Методика CRISP-DM
- Цели курса
- Определение основных понятий
- История науки о данных
- Выгоды от работы с большими данными
- Типовые задачи: прогноз продаж, производства, спроса. Анализ поведения. Распознавание образов. Экспертные системы.
Модуль 3. Основы математической статистики. ANOVA. Надстройка Excel «Пакет анализа»
- С чего начать. Межотраслевая стандартная методика работы с данными CRISP-DM
- Описательное и ассоциативное исследование исходных данных
- Сегментирование и очистка данных (slice and dice). Примеры инструментов Excel
- Визуализация данных в Excel. Как использовать сводные таблицы и диаграммы
- Практическая работа. Сегментировать и очистить тестовый набор данных.
Модуль 4. Задача прогноза продаж. Понятие машинного обучения. Корреляция. Регрессионный анализ
- Описательная статистика
- Среднее, наиболее вероятное, медиана
- Дисперсия, стандартное отклонение, стандартная ошибка
- Виды распределений
- Пакет анализа данных Excel
- Обзор других прикладных средств работы с данными (R, Python, Octave, MathLab, специализированные БД).
- Практическая работа. Определить статистические характеристики выборки данных.
Модуль 5. Задачи классификации и распознавания образов, видео, речи, текста. Понятие нейронных сетей. Примеры применения.
- Постановка задачи оценки взаимосвязи между различными факторами и построение прогноза
- Корреляция. Коэффициент Пирсона
- Критерий Стьюдента (T-анализ)
- Основы машинного обучения
- Регрессионный анализ
- Критерий Фишера
- Построение и анализ трендов в Excel
- Практическая работа. Определить наличие корреляции и регрессионную зависимость между двумя выборками данных. Построить тренд.
Модуль 6. Задача исследования социальных сетей. Задача прогнозирования поведения пользователя. Социальные и направленные графы. Деревья решений. Примеры применения
- Задача сегментации дискретных данных на примере задач распознавания (графика, речь, текст)
- Нейронные сети как инструмент решения задач классификации
- Демонстрация на примерах Azure, AWS
- Задачи классификации данных в социальных сетях и поиска оптимального решения (маршрута)
- Графы как инструмент решения задач на социальных графах и прогнозирования поведения
- Дерево решений
- Разбиение на выборки (обучающую, тестовую, проверочную)
- Анализ ошибок обучения. Базис и отклонения. Ручная корректировка
- Практическая работа: провести классификацию набора данных и его разбиение на сегменты.
Модуль 7. Продвинутые инструменты: глубокое машинное обучение, искусственный интеллект, нечеткие множества
- Задача классификации данных в социальных сетях
- Графы как инструмент решения задач на социальных графах и прогнозирования поведения
- Разбиение на выборки (обучающую, тестовую, проверочную)
- Анализ ошибок обучения. Базис и отклонения. Ручная корректировка
Модуль 8. Профориентация по специальностям в Data Science. Выводы и рекомендации по построению и организации работы команды
- Понятие Deep Machine Learning
- Многофакторный бизнес анализ на примере нечетких логик
- Роли специалистов по DS: аналитик данных, ученый по данным, программист, цифровой директор
- Требования к компетенциям и взаимодействию сотрудников в области аналитики данных
- Состав и требования к проектной команде для DS
- Подготовка компании к применению «бигдата»
Для просмотра содержимого вам необходимо зарегистрироваться!Для просмотра содержимого вам необходимо зарегистрироваться!
Последнее редактирование модератором:
- Статус
- В этой теме нельзя размещать новые ответы.