Искусственному интеллекту AlphaGo больше не нужна помощь людей

Автор София Кириллова Опубликовано 21.04.2019

После турнира в игру го между человеком и искусственным интеллектом, в которой победил компьютер, компания DeepMind объявила, что больше не будет устраивать подобные соревнования.

Логика разработчиков была такой: смысл игры не в том, чтобы победить человека, а в том, чтобы убедиться, что искусственный интеллект может принимать «человеческие» решения. И эта задача была выполнена, но работы над искусственным интеллектом продолжились.

Вскоре после победы машины в DeepMind был создан новый алгоритм обучения искусственного интеллекта. Он называется AlphaZero. TheVerge пишет, что программу разрабатывали не для игры — целью были алгоритмы общего назначения, которые, например, могут решать проблемы научного характера: разработка новых препаратов, моделирование последствий изменений климата и т.д.

Эффективность новой версии программы поражает: если AlphaGo еще нуждался в помощи человека, чтобы получить необходимый опыт, то AlphaZero все делает самостоятельно. В ту же игру го она училась играть, проводя партии с самой собой.

Все началось со случайных ходов, но каждый раз, добиваясь успеха на доске, алгоритм фиксировал удачную комбинацию. После трех дней таких игр AlphaZero была готова, чтобы сразиться с той самой программой, которая оказалась сильнее человека. Результат этого матча — 100:0 в пользу AlphaZero.

По словам ведущего программиста AlphaZero Дэвида Сильвера, искусственный интеллект доказал, что «способен создавать знания с чистого листа, что и позволяет сделать его намного более мощным инструментом в сравнении с прежними версиями». По сути, Zero сам заново открыл принципы игры в го, начав с простейших ходов и достигнув профессионального уровня.

В процессе самостоятельных тренировок алгоритм отработал все уже известные модели игры, а затем нашел новые стратегии, которые и применил в турнире с предыдущей версией AlphaGo. По словам Сильвера, это означает, что для получения новых передовых алгоритмов весь прежний опыт и накопленные данные больше не имеют значения.

Есть у программы AlphaZero и еще одно важное преимущество перед предшественницей: она оказалась намного более экономной в части энергозатрат. На ранних этапах для работы «искусственного интеллекта» требовалось 48 процессоров, теперь же речь идет всего о четырех.

К тому же, и сами процессоры стали эффективнее – летом Google представила второе поколение так называемых ТПУ. Эти специализированные платы с установленными на них чипами выполняют 180 триллионов операций в секунду.