-17%

Глубокое обучение с подкреплением. AlphaGo и другие технологии

Максим Лапань

1 739 ₽ 1 449 ₽

+ до 217 бонусов

Нет в наличии
Есть в других городах, 1 магазин
Бронирование товара
За 1 рабочий час мы проверим, есть ли товар в наличии, и сообщим вам.
Забронированный товар будет ждать вас в выбранном магазине в течение 3 дней.
Товары между магазинами не пересылаются.

Описание и характеристики

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.
Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.
В этой книге:
• Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.
• Изучите основу RL: марковские процессы принятия решений.
• Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.
• Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.
• Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.
• Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.
• Реализуете метод AlphaGo Zero для игры в Connect4.
• Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Тип обложки Мягкий переплёт
Год издания 2020
Количество страниц 496
Издательство Питер
Серия Для профессионалов
Автор Максим Лапань
Переводчик Белов С.
Вес 634
Размер 2.3x16.5x23.3
ID товара 2798725
ISBN 978-5-4461-1079-7
Возрастное ограничение 16+