Все, что вы хотели знать об искусственном интеллекте. Искусственный разум в разрезе

Перевод статьи What you wanted to know about AI с любезного согласия Зигмунта Заяца

В последнее время ряд известных людей, в том числе Билл Гейтс, Стивен Хокинг и Элон Маск, предупредили человечество об опасности искусственного интеллекта. Вы знаете, SkyNet. Терминаторы. Матрица. HAL 9000. Лучше проверить, что ИИ, может быть, - это последний момент, чтобы держать его в страхе.

Настоящая глупость каждый раз побеждает искусственный интеллект  - Терри Прачетт

Текущий мыльный пузырь, раздутый медиа, о механизме супер-интеллекта, по меньшей мере, частично основан на убеждении, что истинный ИИ просто за углом. В конце концов, мы так продвинулись и прогресс только все ускоряет.

HedBot
Авторство картинки: Futurama / Joel Veness


Давайте взглянем на то, как далеко мы продвинулись на самом деле. Вот два репрезентативных и хорошо известных примера состояния текущего уровня техники:

  1. Автоматические аннотации изображений с использованием комбинации сверточных и рецидивных нейронных сетей
  2. Глубоко усиление DeepMind для игр Atari

Захват изображений с помощью искусственного интеллекта

Примерно в конце 2014 года несколько лабораторий почти одновременно опубликовали свои документы об автоматических субтитрах. Среди них были Microsoft, Google и Baidu (от промышленности) и Стэнфорд, Беркли и Торонто (из академии). Andrej Karpathy из Стэнфорда опубликовал свой код - который также реализует метод Google - имеется его разговор на эту тему. Стэнфорд и Торонто предоставили онлайн демо, и будем сейчас анализировать эти тесты.

Стэнфордская демонстрация ИИ

На странице Стэнфордского проекта демонстрируется подборка изображений с подписями. Подписи внушают страх, и каждый из ответов правильный. Это подтверждает то, что мы хотим донести: люди часто тщательно избирательны, когда сообщают о результатах исследований.

Помимо главной страницы есть демо с несколькими изображениями. Многие надписи одинаково хороши, но большая часть - нет. Взглянем на некоторые примеры:

"Красный и белый автобус на стоянке перед зданием"
"Мужчина сидит на скамейке с собакой"
"Женщина, держащая плюшевого мишку перед зеркалом"

Ну ладно, "плюшевого медведя" можно простить, учитывая обстоятельства. И наконец,

"Гроздь бананов висит на потолке"

Демонстрация ИИ Торонто

Группа Торонто демонстрирует перевод изображения в текст. Выглядит демонстрация искусственного разума не так хорошо, как у Стэнфорда, - и с точки зрения веб-дизайна, и подписей. Тем не менее, вы можете загрузить свою фотографию - и она будет переведена в аннотации.

На странице доступно статическое демо со множеством картинок. Каждое изображение имеет пять подписей. Давайте взглянем на это поближе.

Подписи:

  • Группа молодых девушек стоят рядом друг с другом на пляже
  • Две молодые женщины на пляже
  • молодые девушки на пляже, и один человек в шляпе
  • Несколько девушек на пляже
  • Две женщины находятся на песке с маленькой девочкой

Надпись №1 впечатляет. Надпись №4 вполне корректна. Другие не так хороши. Теперь - нечто совсем другое:

  • Мальчик ест ребенка
  • У ребенка мальчик во рту
  • Ребенок улыбается вместе со своей матерью
  • Мальчик в ручке со ртом
  • Мальчик улыбается ребенку

Итак, подводя итог. Технология CNN + RNN не воспринимает номера или цвета. Не понимает смысл слов. Здесь и не пахнет реальным AI (искусственным интеллектом) - вероятно, ближе к десяти тысячам обезьян, которые пытаются повторить творчество Шекспира.

Технология DQN в глубине

Второй документ - о всемирно известной игровой сети Atari под названием Deep-Q. DQN использует обучение, которое отличается от "нормальной" машинного обучения в том, что здесь есть некие действия и обратная связь. Агент наблюдает за всем миром, принимает решение, действует и цикл повторяется. DQN "видит" экран и перемещает джойстик. Этот график показывает, как он это делает, по сравнению с людьми.

Авторство изображения: Google Research Blog

Google говорит, что

более половины игр выполняется на более чем 75% от уровня профессиональных игроков.

100% кажется естественным выбором для порога. Почему 75%? Ну, это удобно. Если мы устанавливаем порог на 100%, DQN ниже более чем в половине случаев.

Также обратите внимание, что в четырех из шести крупнейших искусственных интелектов для игр, простой линейный тест работает намного лучше, чем у игрока-человека.

Более тщательный подбор

Вы, возможно, видели демо Breakout  и слышали историю о том, как искусственный разум учится рыть туннели:

В некоторых играх DQN даже придумал удивительно дальновидную стратегию которая позволила добиться максимально достижимую оценку, например, в Breakout, научился первым рыть туннель на одном конце кирпичной стены так, мяч может подпрыгивать вокруг и выбивает кирпич сзади.

Кроме того, есть игрушка Space Invaders. Видели ли вы, как DQN играет в любые другие игры? Нет? Это потому, что нет других видео. Давайте думать об этом, что это замечательно: так много рекламы, "контроль человеческого уровня", и только два коротких видео из 49 игр...Кроме того, Google выпустила код DQN, но он не включает в себя обученные модели. Так что вы можете повторить свои результаты и посмотреть какое-то действие - если у вас есть навыки и месяц или два времени для работы GPU.

Немного PacMan'а

Попросту говоря, нам кажется, что DeepMind AI сдает приблизительно в половине игр. 

Классическая игра Pac-Man аккуратно иллюстрирует наибольшее ограничение программного обеспечения: оно не в состоянии строить планы, даже на несколько секунд вперед. Это позволяет системе выяснить, как пройти через лабиринт безопасно, съесть гранулы и завершить уровень. Искусственный интеллект также не в состоянии понять, что есть определенные магические шарики, которые позволяют съесть призраков, иначе их не избежать любой ценой.

Нет видео для иллюстрации, но один из многих авторов Nature paper, Джоэл Венесс, ранее разработал то, что называется приближение Monte-Carlo AIXI. Что такое Aixi?

J?rgen Schmidhuber, бывший советник нескольких людей из DeepMind, сказал, рассказал об этом в Reddit AMA:

Я думаю, что модель Marcus Hutter в начале 2000-х годов изменит правила игры. (...) Маркус доказал, что существует универсальный ИИ, который математически оптимален, в некотором смысле. Это не практический смысл, в противном случае мы бы, наверное, даже не обсуждали это здесь. Но эта работа расширяет как конечные пределы человека, так и искусственного интеллекта, и впервые вносит математическую обоснованность и теоретическое доверие ко всей области.

Постскриптум

Ничего особенного здесь видите, просто нормальное несущественное изображение. Наверное, кошка или еще что-то.

только изображение