Ник:
Пароль:

Новости



Новости > Hi-Tech > Программы

Алгоритм AlphaZero стал гроссмейстером трех игр

0
Разместил: Писатель Дата: 11.12.2018 Прочитано: 138
Программы

 

AlphaZero — новый алгоритм от DeepMind — продолжает дело своего предшественника AlphaGo. Только играет он на высшем уровне сразу в несколько игр, и научился этому не подглядывая в партии гроссмейстеров-людей.



В 2015 году Google DeepMind разработала алгоритм AlphaGo для игры в го. Используя силу машинного обучения, уже в 2016 году AlphaGo расправился с сильнейшим игроком в го среди людей — Ли Седолем. Это был первый случай победы алгоритма над профессионалом такого уровня. Сразу после игры Корейская ассоциация го присвоила AlphaGo высший уровень мастерства.

Этот матч по важности сравнивают с шахматным матчем между программой Deep Blue и Гарри Каспаровым. С тем лишь нюансом, что освоить го машине намного сложнее.

Но несмотря на всю сложность и отточенность, этот алгоритм был узкоспециализированным. Поэтому сразу после этого специалисты DeepMind принялись за разработку более универсального игрового ИИ — AlphaZero. Он обучается сразу трем настольным играм: помимо го, это традиционные шахматы, а также японские шахматы — сеги.

Zero получился более сбалансированным и совершенным. Всего за три дня и без какого-либо вмешательства человека он стал гроссмейстером во всех трех дисциплинах, пишет Ars Technica.

Сооснователь DeepMInd Демис Хассабис объясняет:

«Начиная с совершенно случайных действий в игре, AlphaZero постепенно доходит до представления о том, как выглядит хороший матч. Он формирует собственные оценки об игре. В этом смысле он свободен от тех ограничений, которые присущи людям, когда они думают о построении стратегий».

В этом важнейшее отличие от предыдущей версии. Для победы над Ли Седолем алгоритму были необходимы примеры успешных партий мастеров го. Zero достаточно только правил игры. Алгоритм стал полностью независимым от человека.

После трехдневного обучения Zero победил в го подряд в 100 партиях.

Секретным ингредиентом стало обучение с подкреплением. Этот подход позволил существенно уменьшить необходимые для алгоритма ресурсы. Чтобы дойти до уровня AlphaGo алгоритму Zero пришлось отыграть 4,9 млн партий. Сам AlphaGo шел к своему уровню мастерства через 30 млн партий.

Шахматный гроссмейстер Гарри Каспаров с восхищением пишет об алгоритме: «Вместо того, чтобы обрабатывать человеческие инструкции и знания с огромной скоростью, как все предыдущие шахматные машины, AlphaZero генерирует свои собственные знания. Это происходит всего за несколько часов, и результаты превосходят любого человека или машину».

В DeepMind все же отмечают, что их алгоритм имеет дело хоть и с огромным, но ограниченным количеством исходов игр. Это можно воспринимать как сильно упрощенную модель реального мира, но не сам мир. Поэтому в более широком применении даже AlphaGo пока будет слаб.

Игры же остаются важным полигоном для отработки алгоритмов. Недавно нейросеть, разработанная специалистами компаний OpenAI и DeepMind, превзошла людей в серии классических игр на приставке Atari 2600.

Смотрите также связанные новости

22.01.2019 - Модики в России тестируют устройство для общения с помощью силы мысли
19.01.2019 - T800 Arm
19.01.2019 - Северный магнитный полюс перемещается из Канады в Сибирь
19.01.2019 - Microsoft снова заставила пользователей обновить Windows 10
17.01.2019 - Huawei Mate 20 и Mate 20 PRO
17.01.2019 - Опубликовано живое фото флагманского смартфона Samsung Galaxy S10+
17.01.2019 - Ученые МФТИ нашли способ для создания лазера размером с бактерию
17.01.2019 - Microsoft прекратит бесплатную поддержку Windows 7 в 2020 году
09.01.2019 - Обзор планшета Huawei MediaPad M5 10
08.01.2019 - Выход Android 10Q ожидается в мае 2019-го
04.01.2019 - Научные сенсации - 2018
03.01.2019 - В Сети появились особенности новых процессоров AMD Ryzen 3000
03.01.2019 - Ученые рассказали о ходе создания квантового компьютера
13.12.2018 - Windows 10 полностью умерла
11.12.2018 - Полетели...
11.12.2018 - На презентации в «Сколково» упала модель городского аэротакси
06.12.2018 - Яндекс.Телефон
06.12.2018 - Почему Земля начала звенеть как колокол?
26.11.2018 - Ученые нашли способ расплавить золото при комнатной температуре
25.11.2018 - Windows 10 получила физический ключ для запуска системы


Нет комментариев. Почему бы Вам не оставить свой?
Вы не можете отправить комментарий анонимно, пожалуйста войдите или зарегистрируйтесь.

Нет содержания для этого блока!