Google навчив штучний інтелект грати в шахи


Опубликованно 13.12.2017 01:30

Google навчив штучний інтелект грати в шахи

У статті, опублікованій в онлайн-бібліотеці Arxiv.org інженери з Google в деталях розповідають про те, як їх новітня ІІ-конфігурація AlphaZero змогла розвинути "надлюдські можливості" у шахах всього за кілька годин.

Після того, як у систему внесли лише базовий набір правил (без стратегій), AlphaZero знадобилося всього чотири години на те, щоб освоїти гру настільки добре, що перед ним упав навіть найсильніший у світі шаховий движок Stockfish.

Після серії з 100 ігор проти Stockfish ІІ-алгоритм AlphaZero здобув перемогу 25 разів за гру білими фігурами і три рази за гру чорними. Всі інші партії обидві системи зіграли внічию. У підсумку Stockfish не змогла перемогти жодного разу, а AlphaZero, в свою чергу, жодного разу не програла.

"У нас з'явився новий повелитель шахів. Це без сумнівів революціонізує гру, але було б непогано подумати і про те, як це може бути застосоване поза шахів", — прокоментував результати Девід Крамалей, дослідник шахової гри і головний редактор сайту Chessable.

Система AlphaZero ґрунтується на напрацюваннях ІІ-алгоритмів AlphaGo і AlphaGo Zero, творцями яких є інженери лабораторії штучного інтелекту DeepMind, що належить Google. DeepMind займається вдосконаленням цих ІІ-алгоритмів вже протягом декількох років, попутно перемагаючи з допомогою них кращих в світі гравців у стародавню логічну гру го. Кульмінація переможної серії відбулася в жовтні цього року, коли нова і повністю автономна версія ІІ-алгоритму AlphaGo, обучавшаяся виключно на грі з самою собою, а не проти людських опонентів, перемогла всі свої попередні версії.

В той же час попередні версії алгоритму AlphaGo Zero частково навчалися грі з допомогою спостереження за тим, як грають люди. Таким чином розробники хотіли допомогти їй у вивченні стратегій гри, але, як виявилось, насправді це лише сповільнило у розвитку. Повне надання самій собі при навчанні позначилося на істотно більш ефективних результатах AlphaGo Zero в змаганнях один на один.

Однак розвиток сфери ІЇ відбувається настільки швидко, що те, що було досягнуто до жовтня цього року, могло вже застаріти. В опублікованій статті інженери DeepMind відзначають, як остання версія AlphaZero перейшла на новий рівень і здатна займатися вирішенням більш широкого кола завдань. Це означає, що тепер AlphaZero здатна не тільки чудово грати в шахи. Вона також відмінно справляється з сьоги (японської настільною грою) і го, у яких досягти досконалості їй вдалося всього за 2 і 8 годин відповідно.

Поки інженери Google, інженери DeepMind відкрито не виступали з коментарями з приводу нових результатів своєї роботи, вони очікують стороннього і незалежного експертного аналізу статті Arxiv.org. Правда, вже зрозуміло, що сходження даного алгоритму до вершин штучного інтелекту ще далеко до свого завершення, але вже зараз він настільки крутий, що його визнають навіть гросмейстери.

"Завжди хотів дізнатися, як би виглядала гра в шахи між більш розвиненими видами, висадилися на Землі. Тепер знаю", - прокоментував результати AlphaZero гросмейстер Петер Хейне Нільсен.



Категория: Обо всем