Мы в свое время рассказывали о том, что специалисты компании Google научили свою систему искусственного интеллекта рисовать, в результате чего на свет появились картины, словно сошедшие из-под кисти какого-нибудь художника-абстракциониста. Однако, если перед системой компании Google поставить задачу “нарисовать желтую птицу с черными крыльями и коротким клювом”, она, скорее всего, не сможет успешно справиться с ее выполнением. Тем не менее, такая задача вполне по силам новой системе, созданной специалистами компании Microsoft, и чем подробней будет текстовое описание объекта, том более точный рисунок сможет нарисовать эта система.
Отметим, что новая система не использует никаких готовых рисунков, она создает изображение абсолютно с нуля. “Если вы ищете птицу, то Bing или другая поисковая система выдаст вам множество изображений птиц. Но в нашем случае компьютер создает изображения с чистого листа, рисуя их пиксель за пикселем” – рассказывает Ксиадонг Хи (Xiaodong He), ведущий исследователь, – “Нарисованные птицы, возможно, не существуют в реальном мире, они являются лишь отражением воображения нашего компьютера”.
Основой новой системы являются технологии компьютерного видения SeeingAI и технология обработки естественного языка CaptionBot. Такой набор технологий уже используется для составления заголовков для снимков, для ответов на вопросы, задаваемых людьми касательно конкретных фотографий и т.п. Обе вышеупомянутые технологии реализованы в виде нейронной сети Generative Adversarial Network (GAN) и конкурирующей нейронной сети, которая “критикует” создаваемые изображения. Изначально эта система была обучена на парах изображений и заголовков, которые помогли создать базу данных, связывающих элементы изображений с элементами текстового описания.
В настоящее время работу новой системы искусственного интеллекта компании Microsoft еще нельзя считать идеальной. Но перспективы использования таких систем в будущем весьма обширны. Такие системы смогут стать помощниками художникам и дизайнерам, при их помощи можно будет работать над фотографиями, используя голосовое управление. А “венцом” использования такой технологии могут стать мультипликационные фильмы, составленные компьютерами на основе письменных художественных произведений.