Главная » Технологии » Нейросеть Google DeepMind научилась превращать 2D-изображения в трехмерные объекты

Нейросеть Google DeepMind научилась превращать 2D-изображения в трехмерные объекты

Нейросеть Google DeepMind научилась превращать 2D изображения в трехмерные объектыНейросеть Google DeepMind научилась превращать 2D изображения в трехмерные объекты

Посмотрев на фото, любой человек без труда сможет представить то, что изображено на нем как трехмерное изображение. И даже если часть предметов остается за кадром (например, мы видим лишь переднюю часть спинки стула, но не видим заднюю), нам совсем несложно предположить, как будет выглядеть предмет с обратной стороны. Для ИИ же подобные трюки сложны, но недавно группа инженеров проекта DeepMind не только научила искусственный разум проделывать вышеописанное, но и переводить 2D-изображение в полноценное 3D.

Новая система получила название «Генерирующая сеть запросов» (Generative Query Network — GQN). Чтобы обучить искусственный разум анализировать двухмерные сцены, команда исследователей показывала ему изображения одной сцены с разных точек обзора. Эту цепь изображений ИИ использовал для того, чтобы понять принцип изменения объектов при смене ракурса. Более того, этот подход позволил научиться прогнозировать то, как будет выглядеть сцена с другого угла обзора, учитывая не только положение объектов, но и освещение. Как сообщил один из авторов работы Али Эслами,

«Представьте, что вы смотрите на гору Эверест и передвигаетесь на метр. Гора не изменит своего размера, что даст вам информацию о расстоянии до нее и ее размере. А если вы посмотрите на кружку и проделаете то же самое – ее положение изменится. Приблизительно так и работает наша технология.»

Нейросеть Google DeepMind научилась превращать 2D изображения в трехмерные объектыНейросеть Google DeepMind научилась превращать 2D изображения в трехмерные объекты

«Более того, алгоритм обучается так же, как и человек. Увидев один и тот же объект множество раз, ИИ анализирует его характеристики, запоминает и потом использует при повторном взаимодействии. Сейчас искусственный интеллект может воссоздать целый лабиринт, просканировав всего несколько фотографий, сделанных изнутри.»

Нейросеть Google DeepMind научилась превращать 2D изображения в трехмерные объектыНейросеть Google DeepMind научилась превращать 2D изображения в трехмерные объекты

Источник

О supergran

x

Check Also

Каждое предприятие устроено по определенной модели

Каждое предприятие устроено по определенной модели, в которой объединены различные функции, процессы и ресурсы. От ...

Противопожарные ворота – важный элемент безопасности

Противопожарные ворота – важный элемент безопасности производственных и общественных помещений. Их установка необходима на объектах ...

Все преимущества технологии гидрорезки камня

Гранит представляет собой самый прочный природный камень, обладающий морозоустойчивыми и водоотталкивающими свойствами, благодаря чему часто ...

Топки часть парогенератора, предназначенная для сжигания топлива

Топки — это часть парогенератора, предназначенная для сжигания топлива. Топка — один из основных элементов котельного агрегата. ...

Сортиментовоз это лучшее решение для работы с лесом

Сортиментовоз – лучшее решение для работы в лесу Национальный рынок лесовозной техники абсолютно не соответствует ...