Google искусственный интеллект


ИИ от Google обучил дочерний ИИ, который превосходит все ИИ, созданные человеком / Habr

В мае 2017 года исследователи из Google Brain представили проект AutoML, который автоматизирует проектирование моделей машинного обучения. Эксперименты с AutoML показали, что эта система может генерировать маленькие нейросети с очень хорошими показателями — вполне сравнимые с нейросетями, которые спроектированы и обучены экспертами-людьми. Однако поначалу возможности AutoML были ограничены маленькими научными наборами данных вроде CIFAR-10 и Penn Treebank.

Инженеры Google задумались — а что если поставить перед генератором ИИ более серьёзные задачи? Способна ли эта система ИИ сгенерировать другую ИИ, которая будет лучше созданного человеком ИИ в какой-нибудь важной задаче вроде классификации объектов из базы ImageNet — самого известного из крупномасштабных наборов данных в машинном зрении. Так появилась нейросеть NASNet, созданная практически без участия человека.

Как выяснилось, ИИ справляется с проектированием и обучением нейросетей не хуже человека. Задача классификации объектов из набора данных ImageNet и определения объектов из набора данных COCO осуществлялась в рамках проекта Learning Transferable Architectures for Scalable Image Recognition.

Разработчики проекта AutoML говорят, что задача оказалась нетривиальной, потому что новые наборы данных на несколько порядков больше, чем прежние, с которыми привыкла работать система. Пришлось изменить некоторые алгоритмы работы AutoML, в том числе перепроектировать пространство поиска, чтобы AutoML мог найти наилучший слой и многократно продублировать его перед созданием окончательного варианта нейросети. Кроме того, разработчики исследовали варианты архитектуры нейросетей для CIFAR-10 — и вручную перенесли самую успешную архитектуру на задачи ImageNet и COCO.

Благодаря этим манипуляциям система AutoML сумела обнаружить самые эффективные слои нейросети, которые хорошо работали для CIFAR-10 и в то же время хорошо проявили себя в задачах ImageNet и COCO. Эти два обнаруженных слоя были объединены для формирования инновационной архитектуры, которую назвали NASNet.


Архитектура NASNet состоит из слоёв двух типов: нормальный слой (слева) и слой сокращения (справа). Эти два слоя спроектированы генератором AutoML

Бенчмарки показали, что автоматически сгенерированный ИИ превосходит по результатам классификации и определения объектов все остальные системы машинного зрения, созданные и обученные экспертами-людьми.

Так, в задаче классификации на базе ImageNet нейросеть NASNet продемонстрировала точность предсказания 82,7% на проверочном наборе. Этот результат выше, чем все ранее спроектированные модели машинного зрения семейства Inception. Система NASNet показала результат как минимум на 1,2 процентных пункта выше, чем все известные нейросети машинного зрения, включая самые последние результаты из работ, ещё не опубликованных в научной прессе, но уже выложенных на сайте препринтов arXiv.org.

Исследователи подчёркивают, что NASNet можно масштабировать и, следовательно, приспособить для работы на системах со слабыми вычислительными ресурсами без особой потери точности. Нейросеть способна работать даже на мобильном телефоне со слабым CPU с ограниченным ресурсом памяти. Авторы говорят, что миниатюрная версия NASNet демонстрирует точность 74%, что на 3,1 процентных пункта лучше, чем самые качественные известные нейросети для мобильных платформ.

Когда усвоенные признаки из классификатора ImageNet перенесли на распознавание объектов и совместили с фреймворком Faster-RCNN, то в задаче распознавания объектов COCO система показала наилучшие результаты как в большой модели, так и в уменьшенном варианте для мобильных платформ. Большая модель показала результат 43,1% mAP, что на 4 процентных пункта лучше, чем у ближайшего конкурента.

Авторы открыли исходный код NASNet в репозиториях Slim и Object Detection для TensorFlow, так что каждый может сам испытать новую нейросеть в работе.

Научная статья опубликована 1 декабря 2017 года на сайте препринтов arXiv.org (arXiv:1707.07012v3, третья версия).

habr.com

Google представила инструмент для создания ИИ. Он доступен даже школьникам / Habr

Google упростила машинное обучения для тех, кто не имел дела с разработкой. На смену Teachable Machine — сайту, который знакомил пользователей с основами создания ИИ, пришел Teachable Machine 2.0, где нейронные сети можно обучить одним нажатием кнопки.

Первая версия позволяла с использованием веб-камеры наблюдать, как компьютер учится распознавать шаблоны и закономерности в изображениях.

См. также: «Квантовая ставка Google на ИИ – и что она означает для всего человечества»

Теперь же пользователь может с помощью веб-камеры и микрофона на своем ПК без написания кода обучать нейронные сети и экспортировать их в сторонние приложения, носители или на веб-сайты. Вторая версия может распознавать звуки и позы.

Для тех, кто решил попробовать себя в обучении ИИ, представлена инструкция:


В компании отметили, что первая версия Teachable Machine стал популярным инструментом. Ее задействовали в сфере образования, чтобы научить школьников основам обучения ИИ. А эксперт по доступным технологиям Стив Солинг применил инструмент, чтобы облегчить общение для людей с нарушениями речи.
См. также: «10 самых важных вех в развитии ИИ на сегодняшний день»

Google предложила пользователям загрузить свои файлы или создать их при помощи микрофона или веб-камеры. Teachable Machine 2.0 по нажатию кнопки начнет обучать модель на основании предоставленных ей примеров. Вся информация сохранится исключительно на ПК, если проект не загружать на Google Диск.
См. также: «Способности есть, а разума нет: задачи, с которыми ИИ не справляется»

В компании подчеркнули, что обновленный инструмент позволит использовать ИИ более широко.

Ранее Fujitsu представила технологию распознавания выражения лица на основе ИИ. Компания утверждает, что технология помогает выявить даже едва уловимые эмоциональные изменения, в том числе нервную улыбку или замешательство.

Нейросети внедряют и в сфере игр. Так, платформа для соревнований FACEIT сообщила, что «ИИ-админа» Minerva, который отслеживает токсичных игроков, а также вычисляет оскорбления, с августа проанализировал свыше 200 млн сообщений в чате и признал токсичными 7 млн; выписал 90 000 предупреждений и 20 000 банов за оскорбления и спам.

Применяют ИИ и для развлечений. Например, нейросеть Nvidia обучили заменять домашнее животное на любое другое. Инструмент GanAnimals позволяет увидеть выражение морды и позу своего любимца на другом животном благодаря технологии генеративно-состязательной сети, новой технике искусственного интеллекта, которая противопоставляет одну нейронную сеть другой.

habr.com

Google представила «объяснимый» ИИ (Explainable AI) / Habr

При использовании систем с искусственным интеллектом у конечных заказчиков часто возникает практически фундаментальная проблема — им сложно понять, как именно искусственный интеллект (ИИ) принимает свои решения. Так как специалистам компаний, которые купили эту «черную» коробочку и загрузили в нее большой объем данных, зачастую очень трудно, если не невозможно, разобраться в тонкостях работы ИИ. Тем более, что алгоритмы для этого программного продукта писали сторонние разработчики, которые не заложили в его функционал более тонкие настройки и триггеры, которые бы при нештатной работе ИИ позволяли бы быстро откорректировать параметры и исправить ситуацию без остановки работы системы и обращения в техническую поддержку.

В конце этой недели на специально посвященном разработке ИИ мероприятии в Лондоне подразделение облачных вычислений Google представило новый облачный продукт, который должен предоставить компании преимущество над разработками своих конкурентов — Microsoft и Amazon, которые доминируют в сфере облачных применений ИИ. Этот новый продукт в Google Cloud назвали «объяснимый» ИИ (Explainable AI).

Десятки тысяч компаний по всему миру ежедневно используют облачные продукты и решения Google Cloud AI, которые предоставляют их пользователям новые возможности и помогают оперативно решать их текущие задачи. В Google стремятся внедрять новые разработки в ИИ и модернизировать его архитектуру в соответствии с принципами ИИ от Google. И вот теперь компания представила «объяснимый» ИИ, который помогает пользователям понять, как именно модель машинного обучения пришла к тем или иным своим выводам в ходе обработки данных.

Алгоритм «объяснимого» ИИ Google расширен для улучшения его интерпретируемости пользователями с помощью специальных модулей-пояснений. Пояснения количественно определяют вклад каждого элемента данных в выходные данные модели машинного обучения. Используя эти модули можно понять, почему модель приняла определенные решения, также эту информацию можно использовать для дальнейшей адаптации моделей машинного обучения.

Новый метод, используемый в алгоритме «объяснимого» ИИ Google имеет свои ограничения. Так, модули-пояснения раскрывают принцип работы моделей машинного обучения, полученных на основе исходных данных, но с их помощью нельзя понять о существовании каких-либо фундаментальных связей в конечной выборке данных. В Google стремятся сделать наиболее понятные и полезные методы для объяснения работы их ИИ доступными для клиентов, но в то же время не пытаются скрывать их ограничений.

Google на стадии предварительного тестирования предоставила алгоритм «объяснимого» ИИ некоторым компаниям, которые использовали его для систем обнаружения лиц и объектов. По факту тестирования этого продукта специалисты компаний смогли добиться прироста производительности существующих систем и найти некоторые потенциальные недостатки в ранее используемых ими моделях машинного обучения. Теперь само «мышление» алгоритмов ИИ стало для пользователей менее загадочным и, следовательно, более простым для понимания и внесения нужных изменений.

По словам профессора Эндрю Мура, главы подразделения Google Cloud AI, в компании планируют в ближайшее время расширить функционал алгоритма «объяснимого» ИИ, так как многие клиенты заинтересовались этим продуктом и хотят его использовать в своей инфраструктуре. Также подразделение Google Cloud AI будет и далее раскрывать детали многих своих других инструментов для конечных заказчиков, что поможет лучше объяснить их специалистам принципы работы этих продуктов и позволит донести концепции понимания результатов машинного обучения в более понятной форме. Тем самым в Google фактически хотят оставить позади эру машинного обучения систем клиентов с помощью ИИ из «черного ящика».

Документацию по «объяснимому» ИИ (Explainable AI) от Google можно почитать тут.

На данный момент сервис Explainable AI находится в стадии бета-тестирования (Explainable AI Beta) и доступен для ограниченного бесплатного использования.

В начале ноября 2019 года сообщалось, что Google обновила свой инструмент Teachable Machine до второй версии, который могут использовать даже школьники для изучения основ и понимания работы ИИ.

В январе 2019 года о новым подходе в компании Google к пониманию мышления машин рассказывала Бин Ким, исследователь из подразделения Google Brain. И вот сейчас в Google смогли создать инструментарий, позволяющий анализировать и исследовать параметры и факторы, на которые ИИ обращает внимание при решении задачи, а на какие нет, а также насколько высокие веса при решении задачи ИИ присваивает тем или иным факторам и как можно их изменить.

habr.com

Cloud AutoML / Google corporate blog / Habr

Привет, Хабр! Сегодня информацией делится Джиа Ли, глава департамента R&D, Cloud AI. Джиа с командой сделали ИИ легким в применении и доступным даже для неспециалистов. Надеемся, что теперь ИИ придет в каждый бизнес, как некогда пришел компьютер в каждый дом, и читаем, как выглядит и что умеет Cloud AutoML.

Когда мы с Фэй-Фэй (Cloud AI, главный научный сотрудник) год назад присоединились к Google Cloud, нашей целью стало сделать ИИ доступным для максимального количества разработчиков, исследователей, предпринимателей и бизнеса. Наша команда по разработке ИИ для Google Cloud много сделала для достижения этой цели. В 2017 г. мы представили Google Cloud Machine Learning Engine, чтобы помочь разработчикам в этой сфере создавать модели, способные работать с данными любого типа и размера. Мы показали, как современные сервисы машинного обучения, например, разные API, в том числе Vision, Speech, NLP, Translation и DialogFlow, созданные на базе предварительно обученных моделей, могут помочь масштабировать и ускорить бизнес-приложения. Kaggle, наше сообщество специалистов по обработке данных и исследователей машинного обучения, выросло до более чем миллиона участников. И сейчас сервисами Google Cloud, в которых применяется ИИ, пользуется более 10 000 компаний, в том числе Box, Rolls Royce Marine, Kewpie и Ocado.

Но мы способны на большее. Сейчас только у небольшого количества компаний в мире достаточно сотрудников и бюджета, чтобы заниматься развитием машинного обучения и ИИ. Очень немногие могут создавать продвинутые модели машинного обучения. И даже если ваша компания работает с инженерами в области ИИ и ML, вам все равно нужно будет выстроить трудоемкий процесс разработки собственной пользовательской модели машинного обучения. И, хотя для выполнения определенных задач Google уже предлагает API на базе предварительно обученных моделей, для того, чтобы ИИ стал доступен всем, ещё многое предстоит сделать.

Чтобы заполнить этот пробел, мы представляем Cloud AutoML – продукт, который сделает ИИ доступным для любого бизнеса. Благодаря Cloud AutoML у бизнеса с небольшой экспертизой в области машинного обучения появилась возможность создавать собственные уникальные модели с использованием продвинутых методик Google, например learning2learn и трансферного обучения. Мы надеемся, что благодаря Cloud AutoML специалисты в области ИИ смогут работать эффективнее, осваивать новые сферы применения своих знаний и помогать менее опытным разработчикам создавать на базе ИИ собственные мощные системы, о которых раньше можно было только мечтать.


Небольшая gif'ка о том как работает Cloud AutoML

Первым продуктом Cloud AutoML, который мы представляем, станет Cloud AutoML Vision. С его помощью вы можете использовать простой интерфейс с функцией перетаскивания, чтобы загружать изображения, обучать модели и управлять ими, а затем и использовать эти модели непосредственно в Google Cloud. Первые результаты показали значительное улучшение в распознавании изображений в сравнении с предыдущими моделями, которые мы раньше использовали. Запросить доступ к Cloud AutoML Vision можно через эту форму.

Преимущества Cloud AutoML Vision перед обычными API с машинным обучением:


  • Высокая точность. В CloudAutoML Vision используются передовые методики Google по распознаванию изображений, включая трансферное обучение и поисковые технологии с использованием нейронных сетей, благодаря которым удалось повысить эффективность работы и уменьшить количество ошибок классификации в таких известных открытых массивах данных, как ImageNet, CIFAR и др. Даже если у вас недостаточно экспертизы в машинном обучении, создать более точную модель будет быстрее, чем самостоятельно ее кастомизировать.
  • Быстрый расчет готовой к использованию модели. С помощью Cloud AutoML вы можете за несколько минут создать простую модель в приложении, поддерживающем ИИ, или построить полную, готовую к использованию модель менее чем за день.
  • Простота использования. С помощью простого графического интерфейса AutoML Vision вы можете задать нужные данные, а затем преобразовать их в качественную модель, подходящую для ваших нужд.

AutoMLVision – первый из продуктов Cloud AutoML, который упростит применение машинного обучения в различных бизнесах. Это результат тесного сотрудничества команд Google Brain и Machine Perception. И хотя мы еще только начали работать над доступностью ИИ, нас очень вдохновляет, что более 10 000 клиентов уже пользуются продуктами Cloud AI. Мы надеемся, что Cloud AutoML поможет гораздо большему количеству компаний оценить возможности ИИ.

Если вам интересно попробовать AutoML Vision, вы можете запросить доступ через специальную форму


Ссылки на исследования и научные статьи:

[1] Learning Transferable Architectures for Scalable Image Recognition, Barret Zoph, Vijay Vasudevan, Jonathon Shlens, and Quoc V. Le. Arxiv, 2017.

[2] Progressive Neural Architecture Search,Chenxi Liu, Barret Zoph, Jonathon Shlens, Wei Hua, Li-Jia Li, Li Fei-Fei, Alan Yuille, Jonathan Huang, Kevin Murphy, Arxiv, 2017

[3] Large-Scale Evolution of Image Classifiers, Esteban Real, Sherry Moore, Andrew Selle, Saurabh Saxena, Yutaka Leon Suematsu, Quoc Le, Alex Kurakin. International Conference on Machine Learning, 2017.

[4] Neural Architecture Search with Reinforcement Learning, Barret Zoph, Quoc V. Le. International Conference on Learning Representations, 2017.

[5] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning, Christian Szegedy, Sergey Ioffe, Vincent Vanhoucke, and Alex Alemi. AAAI, 2017.

[6] Bayesian Optimization for a Better Dessert,Benjamin Solnik, Daniel Golovin,Greg Kochanski,John Elliot Karro,Subhodeep Moitra,D. Sculley. NIPS, Workshop on Bayesian Optimization, 2017

habr.com

Конец игры: как Google искусственный интеллект внедрял | Технологии

Последствием сбоев стали массовые жалобы разработчиков на большие потери в установка приложения новыми пользователями из магазина приложений — снизился так называемый органический трафик. У некоторых это цифра достигала 90% от дневного объема новых пользователей. Проблема коснулась не только российских компаний, но и зарубежных. Проблему обсуждают на многих форумах, например Reddit.

Например, сбой произошел в сервисе встроенного поиска приложений, наиболее значимого источника новых органических пользователей в магазине приложений, на который приходится более 50% всех установок приложений. Сервис перестал выдавать правильную поисковую выдачу, произошло зацикливание на первых 16-20 приложений, остальные 230+ приложений в каждом поисковом запросе исчезли из поиска и перестали получать пользователей.

Пример уменьшения показов у приложения Get over it PvP: Hammer hit:

При этом упала и конверсия (количество установок, деленное на количество показов приложения) в установку с 15,5% до 11,8% (очевидно, пошла нецелевая аудитория, а это показывает на сбой поиска и Similar apps).

Пример падения установок у приложения Hyperloop:

«Примерно 20 июня начался спад в установках, а 22-го они резко обвалились. Не отображаются данные по источникам трафика, по оценкам (последние за 1 июня)», — описал хронологию сбоя индивидуальный разработчик приложения Hyperloop Антон Слюсарь. Он также добавил, что лишился возможности проводить A/B тесты, предположив, что это произошло из-за отсутствия данных по трафику. При этом конверсия проектов упала в 3 раза (либо статистика выдавала неверные данные). Со стороны разработчика никаких значительных изменений для таких событий не вносилось.

На данный момент серьезные сбои в работе Google Play устранены, по крайней мере поиск работает, как это было раньше. Тем, у кого продолжаются падения установок, стоит еще подождать, когда устаканятся все сервисы, особенно Similar apps, от которого зависит качество приходящего органического трафика, и начнет снова отображаться статистика.

К сожалению, представители Google на момент подготовки материала не предоставили информации о сбоях внутри Google Play, но при этом поделились результатами внедрения новых рекомендательных алгоритмов приложений, основанных на машинном обучении.

Светлые надежды

«Google внедряет технологии машинного обучения в Google Play для формирования наиболее точных персонализированных рекомендаций мобильных приложений, что уже привело к росту конверсии в установку мобильных приложений на 3,3%», — сообщил 6 июля руководитель исследовательского подразделения ИИ Google Чи Хуаи-хсин.

Основания на такой позитивный исход у качественных приложений есть. Как рассказал гендиректор и основатель KB Production (приложения «Фиксики» и «Маша и Медведь») Виталий Козлов, с 19 июня некоторые проекты его компании «буквально провалились по установкам, а некоторые, наоборот, выросли в несколько раз и продолжают расти».

В результате анализ основных показателей различных игр не выявил конкретных факторов, которые оказывают влияние на установки приложений в Google Play. Козлов предположил, что ИИ учитывает несколько факторов: «Вероятно, речь идет о сочетании некоего количества внутренних метрик проекта, которые «Гугл» видит через свои системы. Предположительно, рост наблюдается в более качественных приложениях, в которых есть ценность и глубина для пользователя, возможно, имеет вес монетизация через внутриигровые покупки».

Из этого он сделал вывод, что Google в новом алгоритме рекомендаций пытается решить проблему продвижения более качественных игр и приложений. Козлов считает, что в перспективе это хороший тренд для потребителя, который будет получать рекомендации более качественных игр и приложений. Из замечаний он отметил, что в детских приложениях основные показатели отличаются в худшую сторону по сравнению со взрослыми проектами из-за особенностей поведения детской аудитории. «Не совсем ясно, учитывается ли этот момент в новом алгоритме или нет», — высказал озабоченность нововведениями Козлов.

Итоги для разработчиков и пользователей

Новые, более сильные алгоритмы рекомендаций смогут решить три текущиех проблемы:

1. Более качественные приложения будут получать больше пользователей, что стимулирует их дальнейший рост и рост всей экосистемы мобильных приложений в целом.

2. Произойдет размытие уровня доходов между приложениями «гигантами» и остальными. Текущая статистика говорит, что 1% приложений зарабатывает 95% всего дохода. С новым алгоритмом рекомендаций, основанных на персональных потребностях пользователей, доля «гигантов» должна немного уменьшится.

3. Исчезнет серое продвижение, основанное на накрутках рейтинга и количества установок для удержания приложений в топах категорий и поиска. Для конечного пользователя и действительно качественных приложений это хорошо. Потребитель получит то приложение, которое будет закрывать потребность здесь и сейчас, разработчик получит наиболее качественную аудиторию для дальнейшей монетизации, а также не будет тратить бюджеты на продвижение серыми методами с целью удерживать позиции, пока менее качественные приложения за счет своих бюджетов и серого продвижения занимают места в топах. Бюджет будет направлен на более официальные и измеримые источники трафика.

Механизмы ранжирования Google улучшает регулярно. Возможно, при обучении ИИ происходят столь бурные смены параметров, что не знаешь, куда унесет какую программу. Разработчикам стоит быть готовым к тому, что иногда их приложения резко теряют популярность. Не стоит сразу дергаться. Если это произошло резко и без видимых причин, возможно, стоит переждать очередные «учения» и дождаться, пока ИИ придет в себя.

Со стороны интернет-компании хотелось бы чуть больше открытости и информирования о таких процессах, чтобы понимать, что «буря» скоро закончится.

www.forbes.ru

Восемь потрясающих игр с искусственным интеллектом от компании Google / Habr


«Нарисуй кошку за 30 секунд!.. О, я знаю, это кошка… А может быть, нет» — примерно в таком формате выдаёт результат распознавания рисунков нейросеть Quick, Draw!

Quick, Draw! — одна из новых игр, которую выпустили разработчики Google в рамках проекта A.I. Experiments. Здесь публикуются прикольные игрушки, которые позволяют даже ребёнку поиграть с искусственным интеллектом. Но есть игры и для взрослых.

Кроме удовольствия от игры и развлечения, эксперименты A.I. Experiments дают ещё и некоторое понимание того, на что способны нейросети и как их можно использовать на практике. Не только для развлечений.


aiexperiments.withgoogle.com/giorgio-cam


Первая игра на сайте A.I. Experiments. Вероятно, самая интересная, по мнению разработчиков. Поместите объект перед объективом камеры на смартфоне или ПК, а нейросеть мгновенно составит стишок по итогу результата распознавания — и положит его под музыку! Иногда результат очень смешной. Особенно если навести камеру на необычные объекты.

В данном проекте используются программы MaryTTS, Tone.js, и Google Cloud Vision API. Исходный код Giorgio Cam опубликован, как и всех других игр на проекте.


quickdraw.withgoogle.com


В игре Quick, Draw! искусственный интеллект даёт задание. Человек пытается быстро нарисовать, например, пальцем на планшете, а ИИ определяет, что изображено на рисунке. Получается весело, особенно если вы не очень умеете рисовать.

Что важно, нейросеть обучают следить за направлением движения пальца/курсора. За счёт этого она гораздо лучше распознаёт образцы.


aiexperiments.withgoogle.com/drum-machine


Infinite Drum Machine показывает карту, на которой разные звуки инструментов размещены в соответствии со степенью их схожести. Если проводить мышкой по этому облаку, то звуки воспроизводятся по очереди. Если какой-то звук понравился, то размещаем его на драм-машине с четырьмя дорожками. Ну а затем запускаем на воспроизведение. Такое приложение стало бы хитом в Google Play. Впрочем, как и остальные игры на сайте A.I. Experiments.

Как сказано в описании, при разработке использовалась техника t-SNE, то есть нелинейного снижения размерности и визуализации многомерных переменных (t-distributed stochastic neighbor embedding). Алгоритм вычисляет цифровой отпечаток каждого звука и размещает его в многомерном пространстве, в соотношении с другими отпечатками. Для взаимодействия с человеком многомерное пространство пришлось сплющить до двухмерного.


aiexperiments.withgoogle.com/bird-sounds


Как и в предыдущей игре, здесь система с помощью техники t-SNE организовала по степени схожести тысячи звуков. Только звуки не инструментов, а птичьих голосов. Орнитологи десятилетиями собирали эту коллекцию.
aiexperiments.withgoogle.com/thing-translator


«Переводчик вещей» переводит с одного языка на другой не слова, а предметы. Он буквально произносит вслух, как звучит любой предмет на выбранном вами языке.

Это всего лишь один пример того, что можно сделать, используя программные интерфейсы машинного обучения Google (Cloud Vision API + Translate API) — даже ничего не зная о машинном обучении.


aiexperiments.withgoogle.com/ai-duet


Ещё одна интересная музыкальная игра от Google. Вы начинаете играть мелодию — а компьютер продолжает её за вас, используя наиболее красивое и логичное продолжение.

Как несложно догадаться, при обучении нейросети воспроизводились тысячи существующих мелодий. ИИ постепенно начал понимать ноты и распознавать гармонию в мелодическом рисунке. Понимать, в каких местах мелодия должна менять направление, в каком ритме продолжать мелодию и т.д. Он постепенно сам составил карту наиболее популярных, то есть гармоничных последовательностей и переходов.

Для максимального кайфа к компьютеру, конечно, желательно подключить MIDI-клавиатуру. Тогда с ИИ можно организовать полноценный композиторский дуэт, играя мелодию по очереди. Он продолжает начатое вами, а вы подыгрываете его варианту.


aiexperiments.withgoogle.com/visualizing-high-dimensional-space


Этот эксперимент помогает понять, что творится в «мозгах» искусственного интеллекта. Программа визуализирует это на экране. Именно здесь можно своими глазами увидеть многомерное пространство, которое упоминалось ранее, и понять, как работает волшебная техника t-SNE. Каким образом организуются данные в пространствах, где количество измерений больше трёх.

Одна из авторов объясняет в демонстрационном видеоролике, что даже людей можно представить в виде многомерных объектов в многомерном пространстве. Это легко. В одном измерении у нас параметр «дата рождения» — и в этом измерении мы связаны с другими такими же многомерными объектами (людьми). В следующем измерении у нас параметр «место работы» — в этом измерении совершенно другие взаимосвязи. И так далее. Абсолютно все люди на планете входят в эту многомерную сеть. Такое же многомерное пространство строится для значений слов, для изображений, для мелодий и для любых других данных. Всё это потом используется в реальных приложениях, когда нейросеть обучается распознавать образы, понимать значения отдельных слов в пространстве смыслов.

Разработанная Google техника визуализации будет полезна всем разработчикам, которые работают с многомерными пространствами, t-SNE и нейросетями.


aiexperiments.withgoogle.com/what-neural-nets-see


Ещё один эксперимент, который показывает внутренности «компьютерного мозга». В данном случае речь идёт не об измерениях многомерного пространства, а о слоях нейросети, каждый из которых реагирует на определённые сигналы. При последовательной обработке многими слоями нейросети, где каждый следующий слой обрабатывает результат предыдущего, ИИ начинает распознавать фичи всё более высокого уровня.

И помните, чем больше вы играете с искусственным интеллектом Google — тем быстрее он обучается, используя ваши рисунки и наблюдая за поведением. К сожалению, люди могут не только обучить, но и испортить ИИ. Например, из-за неграмотности многие люди рисуют ураган в виде торнадо. И постепенно нейросеть откажется признавать ураганом рисунок тропического циклона, а будет считать ураганом только рисунок торнадо. В общем, всё как в жизни.

habr.com

Разбор стратегии Google: ставка на искусственный интеллект,

Перевод от vc.ru 47-страничного доклада аналитической компании CB Insights о новых проектах Google.

Следующий крупный анонс Google может быть связан с одной из новых приоритетных для компании направлений: облако, здравоохранение или транспорт. Это глобальные массовые рынки, которые хорошо взаимодействуют с ИИ-технологиями.

Компания стремится поддерживать своё превосходство в области рекламы и поиска, что составляет большую часть её доходов. Но пользователи постепенно переходят с десктопов на мобильные устройства и голосовые помощники конкурентов, потому показывать рекламу становится сложнее.

По мере роста конкуренции в мобильной сфере и на рынке голосовых ассистентов, а также проблем, связанных с конфиденциальностью и обработкой данных, корпорация была вынуждена изменить стратегию развития.

Чтобы защитить основной источник доходов, Alphabet (материнская компания Google) пытается интегрировать свои услуги и технологии во все аспекты цифровой жизни пользователя.

Компания ищет новые способы заработка на крупных корпоративных рынках: облачных вычислениях и услугах. Alphabet планирует использовать свои наработки в искусственном интеллекте и машинном обучении в качестве универсального сервиса для потребителей и предприятий.

Структура Alphabet

Корпорация разделяется на Google — основной бизнес, и ряд дочерних компаний, которые Alphabet называет «другими ставками». Большая часть бизнеса Google — доходы от рекламы, которые генерируются через поисковик и другие сайты, связанные с ним. Кроме поиска и рекламы компания получает доход от облачных, потребительских и аппаратных продуктов, Google Maps и YouTube.

Структура Alphabet

Для Alphabet «другие ставки» — экспериментальные продукты. Они не приносят существенной прибыли. К ним относятся:

  • Google Ventures (GV) и capitalG — инвестиционные инструменты;
  • Waymo — беспилотные автомобили;
  • Verily and Calico — компании здравоохранения;
  • Alphabet Access & Energy — телекоммуникационные и энергетические проекты;
  • Sidewalk Labs — разработка инноваций в городской среде;
  • DeepMind — исследовательское подразделение по разработке нейронных сетей и искусственного интеллекта. Приобретено в 2014 году;
  • Chronicle — отделение по кибербезопасности, разрабатывает secure-продукты для облачного бизнеса;
  • Project Loon — дочерняя компания, занимается проблемами доступа в интернет в отдаленных районах мира;
  • Project Wing — разработка службы беспилотной доставки;
  • Google X — исследовательский центр, ориентированный на технологии, «улучшающие мир».

Большинство дочерних компаний направлено на поддержку и защиту рекламного бизнеса.

Компания увеличивает траты на приобретение трафика (traffic acquisition costs — TAC) — это самые большие затраты, связанные с рекламой и поисковым сервисом. Антимонопольная служба оштрафовала корпорацию на $5 млрд за принуждение производителей смартфонов предустанавливать Google Chrome на устройства.

Также растёт конкуренция со стороны Amazon, Microsoft и Apple — компании ищут способ монетизации сбора и обработки данных. Поэтому Google развивает дочерние проекты, чтобы сохранить бизнес и расширить возможности компании.

Укрепление позиций в области искусственного интеллекта

Искусственный интеллект — основное направление Alphabet в долгосрочной перспективе. ИИ — ядро, которое проходит через поиск и рекламу, облако, беспилотники, здравоохранение и «другие ставки» компании.

Что происходит сейчас

В презентации новой линейки смартфонов Google Pixel в 2017 году генеральный директор Сундар Пичаи подчеркнул важность искусственного интеллекта для технологического рынка, обозначив переход с Mobile-first к AI-first. С тех пор ИИ стал центром внимания корпорации в инвестициях, приобретениях и внутренних расходах.

Сундар Пичаи. Фото: Engadget

Инвестиции Google

Компания запустила два проекта, связанных с ИИ: Gradient Ventures и Google Assistant Investment Program (GAIP). GAIP запущена в мае 2018 года. Программа финансирует стартапы, расширяющие возможности «Ассистента».

Gradient Ventures запустили в июле 2017 года. В отличие от GV и capitalG, которые работают отдельно под корпоративной структурой Alphabet, Gradient Ventures — часть Google. Тем не менее фонд планирует стать независимой компанией, как только нарастит инвестиционный темп.

Gradient работает на рынке США и инвестирует в продукты на ранних стадиях разработки. Но недавно Gradient профинансировала канадский медицинский стартап, использующий ИИ для ускорения открытий в области медицины и биологии.

Также компания увеличивает расходы на исследования и разработки, связанные с поиском и машинным обучением — в 2017 году компания потратила $16,6 млрд. Это больше, чем тратит каждый конкурент: Microsoft, Facebook или Apple.

Траты Google на исследования в 2017 году

Приобретения

Компания не только финансирует, но и приобретает ИИ-стартапы. В начале 2014 года она купила DeepMind за $600 млн — стартап занимается разработкой игрового искусственного интеллекта. ИИ DeepMind победил чемпиона мира по игре в Go и сейчас тренируется играть в Dota 2 против киберспортсменов.

Траты на ИИ-стартапы

В 2017 году Google приобрела индийский стартап Halli Labs, ориентированный на системы глубокого обучения и машинного обучения. Также она купила белорусскую компанию AIMatter, которая занимается компьютерной визуализацией — нейронная сеть использует ИИ для обработки изображений.

В ноябре 2017 года корпорация купила компанию Banter для создания платформы обработки естественного языка в корпоративных облачных сервисах, например, в Google Hangouts.

Запуски продуктов

Компания понимает важность голосовых помощников: растёт конкуренция со стороны Amazon и Apple. Каждый голосовой запрос, который отправляется в Siri и Alexa уходит от поисковой платформы Google Search.

«Умный» домашний хаб от Google и Lenovo

По словам Сундара Пичаи, они работают с основными производителями в США, чтобы охватить большой спектр устройств.: от посудомоечных машин до систем безопасности. Также компания наращивает производство собственных устройств под линейкой «Made by Google». Она включает в себя смартфоны Google Pixel, ноутбуки Chromebook, устройства для дома Google Home.

В сентябре 2017 года Google приобрела компанию HTC за $1,1 млрд, чтобы получить доступ к инженерным разработкам и производственным линиям на Тайване.

Патенты

Основным ядром для исследований возможностей ИИ и машинного обучения является Google AI, ранее известный под названием Google Research. Его переименовали, чтобы отразить интерес компании к новым технологиям.

В Google AI входит команда команда Google Brain, которая возглавляет разработку библиотеки с открытым кодом TensorFlow. Команда также улучшает возможности конвертации естественного языка в голосовые поисковые запросы. А для основного подразделения в Google Brain разработали систему, повышающую эффективность использования энергии в энергоёмких центрах обработки данных.

Google Brain тесно сотрудничает с дочерними компаниями Alphabet, среди которых подразделение по разработке беспилотных аппаратов Waymo. Для неё разработчики создали систему обнаружения пешеходов и автомобилей, основанную на нейронных сетях.

С 2016 года наблюдается всплеск патентной активности, связанной с ИИ и машинным обучением

Google сосредоточена на сложных системах глубокого машинного обучения, которые позволяют генерировать прогнозы с использованием искусственной нейронной сети, «вдохновлённой» работой человеческого мозга. Алгоритмы глубокого обучения не требует корректировок от инженеров и способны самостоятельно определять точность прогнозов.

Акцент компании на глубоком обучении можно увидеть по ключевым словам, которые она использует. «Нейронная сеть» была впервые упомянута в 2015 году и с тех пор стала одним из трёх наиболее часто упоминаемых терминов. Также компания сосредоточена на распознавании речи и обработке естественного языка — она опережает остальные компании по числу зарегистрированных патентов в этой области.

Упоминание фразы «нейронная сеть» с 2013 года по 2017 год

С 2017 года Google регистрирует патенты, связанные с распознаванием жестов. В октябре 2017 года корпорация подала патентную заявку на «радиолокационное распознавание жестов и передачу данных». Технология позволяет управлять устройствами с помощью жестов. Это может быть частичным видением компанией «умного» дома, который управляется человеком, а не машиной.

Патенты Google по распознаванию жестов

Куда дальше пойдёт Google

Компания пересматривает подход к развитию бизнеса, интегрируя ИИ во все продукты. Она «хочет помочь пользователям добиться лучших результатов» с помощью комбинации поискового движка и голосового помощника. К примеру, в мае 2018 года компания рассказала о будущих возможностях Google Assistant — голосовой системе, которая может звонить от лица пользователя. Аналогичный патент был зарегистрирован в 2017 году, и аналогов у него практически нет.

Патент на «радиолокационное распознавание жестов и передачу данных»

Видение корпорации — доминирование на рынке умных устройств. Она как разрабатывает, так и выпускает устройства, уменьшая собственные затраты на производство и оптимизирует их под свои разработки.

Также Google вернула Nest в аппаратное подразделение. Корпорация заинтересована в интеграции голосового помощника в свои продукты, чтобы использовать больше каналов для рекламы и предоставления информации потребителям.

Патенты Google по распознаванию речи

Почему Google отдаёт приоритет ИИ

Искусственный интеллект влияет на практически все предприятия Alphabet и является точкой роста крупных отраслей. Чем быстрее и лучше Google сможет масштабировать ИИ-ассистента в собственные продукты — от мобильных устройств до Google Home, тем лучше будет плацдарм для развития рекламного и поискового бизнесов.

Рынок искусственного интеллекта и машинного обучения трудно измерить, так как технология распространена повсеместно.

Ожидается, что рынок цифровых помощников достигнет $12 млрд к 2024 году. Если устройства для «умного» дома от Google будут пользоваться спросом, то к 2022 году рынок достигнет $122 млрд. «Умный» голосовой помощник, который будет находиться везде, сможет удержать доминирование поисковой платформы компании.

По словам генерального директора Сундара Пичаи, Search и Assistant — «сердце» бизнеса компании, оба сервиса будут связаны между собой в будущем.

Увеличение доли рынка облачных технологий

В 2018 году Google заняла третье место среди облачных провайдеров, уступая Microsoft и Amazon. Чтобы укрепить свои позиции, корпорация провела несколько инвестиций, приобретений и реорганизаций.

По итогам 4 квартала 2017 года компания объявила, что ежеквартальная прибыль облачного подразделения составляет $1 млрд. В 2017 году она заключила в три раза больше сделок стоимостью от $1 млн, чем в 2016 году. Набором облачных приложений G Suite пользуются более 4 млн клиентов.

Инвестиции

Увеличение штата инженеров в облачном бизнесе Google

Google увеличивает штат инженеров и стратегических директоров в сфере облачных вычислений четыре квартала подряд. Сундар Пичаи объявил об увеличении капиталовложений для создания облачного бизнеса: деньги идут на центры обработки данных, покупку зданий и транспорта и развитие технологий. Расходы на «облака» в Google превысили расходы Microsoft и Amazon.

Расходы Google на облачный бизнес

Через инвестиционные фонды компания развивает «облачные» стартапы. В марте 2017 года она участвовала в раунде инвестиций в облачное хранилище Avere Systems, но Microsoft выкупила компанию в январе 2018 года.

Приобретения

Google перестала тратить деньги на AR, VR и освоение космоса и сконцентрировалась на облаках. В 2018 году компания приобрела несколько компаний, работающие с облачными хранилищами — Cask Data, Velostrata и Xively.

Купленные компании по работе с облачными хранилищами

Запуск продуктов

Изначально Google развивала корпоративное направление, сосредоточившись на потребителях и студентах, но не смогла добиться успеха в этом сегменте. Сейчас компания исправляет это: наняла экс-генерального директора компании VMware Диану Грин для запуска корпоративных услуг для предприятий — G Suite, и заключила партнёрства с инфраструктурными компаниями Cisco, Salesforce и SAP.

На конференции Google Cloud Next в июле 2018 года компания анонсировала новые продукты и услуги. К примеру, Google Cloud Services — семейство облачных сервисов, которое позволяет устанавливать облачную платформу Google на собственных серверах и периферийных устройствах. Такой механизм распространён в компаниях, где используется сочетание частных и публичных облачных сервисов.

Google Edge EPU

Также Google анонсировала чип Edge TPU, который предназначен для управления большими рабочими нагрузками на предприятиях и выполняет процессы машинного обучения на устройствах «Интернета вещей».

Совместно с Blockchain Digital Asset и Block Apps корпорация анонсировала интеграцию технологии блокчейн в свою облачную платформу.

Почему это важно для Google

Предприятия постоянно генерируют всё больше данных, которые нужно обрабатывать и, как следствие, компании нуждаются в дополнительных вычислительных мощностях.

Google видит возможность использования своих технологий в других областях, к примеру, электронной коммерции, контенте, финансовых услугах и здравоохранении, предлагая компаниям облачный сервис для развития бизнеса.

Ещё одна важная сторона облаков — кибербезопасность. Единое облако, которое использует предприятие, позволят быстрее находить уязвимости в системах и закрывать их.

Размер рынка

Присутствие Google в облачной индустрии стимулирует дальнейшее развитие рынка облачных вычислений, которые, как ожидается, достигнут $513 млрд к 2022 году, и облачных хранилищ, которые могут достичь $90 млрд к 2022 году.

Сетевая инфраструктура и квантовые компьютеры

Google активно инвестирует в развитие сетевой инфраструктуры для обработки вычислений на более высоком уровне. Одна из главных статей расходов Google связана с увеличением вычислительной мощности, которую требуют сложные алгоритмы машинного обучения.

Расходы на инфраструктуру

Что происходит сейчас

Google построила сеть центров обработки данных для поддержки облачного бизнеса. В 2018 году у компании открыто 15 центров обработки данных: восемь в США, четыре в Европе, два в Азии и один в Южной Америке.

Компания разработала проект Fiber, предоставляющий широкополосный интернет для предприятий и жителей отдалённых городов. Но его масштабирование оказалось слишком затратным, и компания остановила развитие Fiber.

Также корпорация инвестирует в проекты, связанные с прокладкой магистральных кабелей в океанах. В июле 2018 года компания объявила о проекте частного подводного кабеля, который пересечёт Атлантический океан. Google Durant — первая разработка в сфере прокладки трансатлантических кабелей от компании, не связанной с телекоммуникациями. Google считает, что разработка увеличит пропускную способность передачи данных и улучшит соединение Google Cloud.

Google Durant

Развитие облачного сервиса привлекло Netflix и Spotify — они отказались от услуг Amazon Web Services и Microsoft Azure в пользу Google Cloud Platform.

Инвестиции в вычислительную мощность нацелены на долгосрочное использование — корпорация разрабатывает технологии квантовых вычислений, которые будут значительно быстрее обычных компьютеров.

В письме основателя Google Сергея Брина в 2017 году говорилось о том, что квантовые компьютеры могут быстрее решать специализированные задачи, но это очень сложно реализовать. К примеру, чтобы эмулировать работу прототипа квантового компьютера в 72 кубита требуются миллионы обычных компьютеров.

Компания разрабатывает технологии квантового компьютера вместе с IBM и Intel. Для этого образована команда Google Quantum, которая работает с Google AI. Она проектирует квантовые процессоры и разрабатывает квантовые алгоритмы.

В июле 2018 года разработчики Quantum запустили программную платформу Cirq с открытым исходным кодом. Cirq позволяет пользователям запускать квантовые алгоритмы на симуляторе Google.

Бабочка Хофштадтера. Показывает, как будут себя вести электроны в симулированном магнитном поле

Квантовые компьютеры используют кубиты — сложные информационные единицы, которые могут находиться в состоянии суперпозиции, — одновременно представлять собой 0 и 1, в отличие от стандартных бит информации. Google также разрабатывает «железо» для квантовых вычислений — чип Bristlecone содержит рекордное количество кубитов.

Google не упоминает квантовые технологии в отчётах. Компания уделяет внимание вычислительному оборудованию для машинного обучения — TPU. В феврале 2018 года компания анонсировала бета-версию TPU для Google Cloud Platform. По заявлению разработчиков, TPU быстрее и энергоэффективнее современных CPU и GPU.

Почему это важно для Google

Чтобы увеличивать возможности в области машинного обучения и облачных вычислений, компании нужно развивать инфраструктуру для их поддержки. Согласно техническим требованиям к инфраструктуре, Google должна удваивать пропускную способность сети каждый год, чтобы поддерживать основные направления деятельности.

Оптоволоконные кабели обычно использовались для телефонной линии. Но в 2017 году цифровой контент и облачные вычисления заняли 77% трафика данных, передаваемых через Атлантический океан, и 60% через Тихий океан. Google инвестирует в подводные оптоволоконные кабели для подключения к районам, где растёт потребление интернет-трафика, таким как Китай.

Защита рекламного бизнеса от конкурентов

Amazon активно конкурирует в области электронной коммерции — Google потерял около 60% кликов по рекламным объявлениям. Amazon и Apple потратили миллиарды долларов на развлекательный контент, чтобы сделать свои платформы привлекательными. Это может ослабить позиции поисковика в предоставлении рекламных услуг на различных платформах.

Google направляет усилия на восстановление и предотвращение потерь в рекламном подразделении. В марте 2018 года компания интегрировала торговые предложения розничных магазинов во все платформы: в поиск, в голосового ассистента и в смартфоны. Тесты показывают, пользователи начали покупать на 30% больше.

Google Express

В 2017 году корпорация заключила соглашение с крупными розничными сетями по интеграции своего сервиса доставки Google Express. С помощью сервиса пользователи могут покупать сразу в нескольких розничных сетях. Если стоимость заказа превышает $35 — доставка бесплатная. Чем больше розничных продавцов сотрудничает с поисковиком, тем сильнее интегрируются в них облачные сервисы корпорации.

Интеграция электронной коммерции в поисковик сдерживает снижение аудитории Google Search и уход пользователей к Amazon. Корпорация развивает и контент: Google Play обзавёлся музыкой, журналами, книгами, фильмами и ТВ-программами, а на YouTube появились платные каналы и интеграция покупки товара, показанного на видео. Развлекательное направление — прямой конкурент сервису Amazon Prime.

В 2018 году Google больше говорит о YouTube, чем о поисковике

Электронная коммерция — одно из важных направлений, так как оно напрямую связано с рекламным и облачным бизнесами, а также позволяет собирать больше данных о пользователях для улучшения рекламных предложений.

Развитие на рынках Индии, Юго-Восточной Азии и Китая

В

dev.by

ИИ Google построил собственный ИИ, превосходящий любой из разработанных людьми

AutoML — искусственный интеллект, способный создавать собственный ИИ, — разработал систему компьютерного зрения, которая, как говорят в Google, превосходит все схожие существующие системы.

В мае 2017 года исследователи из Google Brain представили AutoML — искусственный интеллект, способный генерировать собственные ИИ. Недавно стало известно, что AutoML построил систему, которая превосходит «конкурентов», разработанных людьми. Об этом сообщает портал Futurism.

Специалисты из Google автоматизировали разработку моделей машинного обучения с помощью обучения с подкреплением. AutoML действует как управляющая нейросеть, которая разрабатывает дочернюю нейросеть для специализированной задачи. Для этой дочерней сети (которую исследователи назвали NASNet) в задачу входило распознавание объектов — людей, машин, светофоров, багажа и т. д. — на видео в реальном времени.

При этом AutoML оценивает работу NASNеt и использует эту информацию для улучшения дочерней сети; этот процесс повторяется тысячи раз. Когда инженеры протестировали NASNet на наборах изображений ImageNet и COCO, она превзошла все существующие системы компьютерного зрения.

Согласно исследователям из Google, NASNet успешно предугадывала изображения в контрольной выборке ImageNet в 82,7% случаев. Это на 1,2% лучше, чем прошлый рекорд. При этом система также оказалась на 4% эффективней, с 43,1% средней точности (mAP). Кроме того, менее затратная версия NASNet превзошла лучшие схожие модели для мобильных платформ на 3,1%.

Google Research

Существует множество возможных вариантов применения AutoML и NASNet. Точные, эффективные алгоритмы компьютерного зрения могут быть использованы для создания сложных ИИ-роботов или, например, для помощи слабовидящим людям. Такие алгоритмы могут также помочь в совершенствовании технологий автономного вождения: чем быстрее беспилотный автомобиль распознает объекты на своем пути, тем быстрее он реагирует.

При этом, конечно, возникают этические вопросы, связанные с опасениями по поводу ИИ: что, если AutoML будет создавать системы с такой скоростью, что общество просто за ними не поспеет? Впрочем, многие крупные компании стараются учитывать проблемы безопасности ИИ. Например, Amazon, Facebook, Apple и некоторые другие корпорации являются членами Партнерства по развитию ИИ (Partnership on AI to Benefit People and Society). Институт инженеров и электротехники (IEE) же предложил этические стандарты для ИИ, а DeepMind, например, анонсировал создание группы, которая будет заниматься моральными и этическими вопросами, связанными с применениями искусственного интеллекта.

www.popmech.ru

Business Insider (США): 13 невероятных произведений искусства, созданных искусственным интеллектом | Общество | ИноСМИ

Искусственный интеллект (ИИ) корпорации «Гугл» создал совершенно психоделические картины.

Пытаясь разобраться в том, каким образом искусственный интеллект воспринимает и интерпретирует окружающий мир, эксперты компании «Гугл» начали в июне процесс, который получил название «инцепционизм» (inceptionism).

Цель инцепционизма состояла в том, чтобы понять, каким образом нейронные сети ИИ компании «Гугл» решают классификационные задачи. Это нужно было для того, чтобы инженеры получили возможность продолжить работу над совершенствованием системы. Однако необычным результатом этого проекта стало создание изображений, которые похожи на галлюцинации, возникающие в случае приема серьезной дозы наркотиков.

Этот проект мгновенно вызвал большой интерес среди программистов и художников, и поэтому руководство «Гугла» решило сделать открытым свой код, получивший название «Глубокий сон» (DeepDream), для того, чтобы все желающие получили возможность создавать свои собственные причудливые картины.

Сам процесс инцепционизма может проходить по одному из двух возможных вариантов. В первом случае в нейронные сети компании «Гугл» загружается изображение, после чего ИИ получает задание найти в нем дополнительные детали.

Так, например, «Гугл» направляет в свою нейронную сеть изображение дерева. Поскольку данная нейронная сеть настроена на то, чтобы искать строения в загружаемом материале, она в результате выдает изображение приземистого зеленого дома.

Однако второй вариант, вероятно, является более увлекательным. В нейронную сеть вводится определенное изображение, и ей самой предоставляться право решить, что она видит.

Politico
Nature
Специалисты «Гугл» ввели в нейронную сеть изображение неба, а она увидела там птиц!

Если пойти по второму пути, то результат работы нейронной сети будет зависеть от того, через какое количество уровней пройдет загруженное изображение. Сеть ИИ «Гугл» имеет от 10 до 30 уровней. Первый уровень, или уровень ввода, рассматривает края и углы изображения.

Прошедшие через первый уровень изображения получают дополнительные спиралевидные формы или мазки, однако в целом оригинальное изображение не меняется.

Что касается промежуточных уровней, то там внимание будет направлено на основные формы и компоненты, например, на листья.

Чем больше уровней, через которые проходит изображение, тем больше оно становится психоделическим.

Но именно после прохождение последних уровней изображение действительно становится причудливым. Последний уровень ищет уже более сложные вещи — такие, как целые строения.

Нейронная сеть создала картину, на которой изображено смешение зеленых и синих арок.

После прохождения всех 30 уровней конечное изображение может оказаться очень странным.

Или довольно банальным.

Художник из Стамбула Мемо Аткен (Memo Akten) выставляет вот такую картину. Первоначально это была сделанная с орбиты фотография Центра правительственной связи (Government Communications Headquarters) в Соединенном Королевстве, а затем полученное изображение прошло через искусственные нейронные сети компании «Гугл».

А другая картина получила название «Мечты под звуки саксофона» (Saxophone Dreams), ее автором является скульптор и сотрудник «Гугла» Майк Тика (Mike Tyka).

Такого рода произведения искусства в будущем станут более привычными. Лондонский университет сегодня предлагает курс по «Машинному обучению и искусству» (Machine Learning and Art), и Нью-Йоркский университет (New York University) тоже предлагает нечто подобное.

Промежуточные слои будут выискивать базовые формы и элементы, например, листья. То, что вы видите ниже (и все остальные изображения далее), будет выставлено на аукционе.

© MIT Computer Science and AI Laboratory / GoogleГалерея фотографий. Нажмите на фотографию, чтобы посмотреть все иллюстрации

Но по-настоящему причудливым результат становится, когда изображение подвергается обработке последних слоев. Эти слои ищут на нем сложные вещи, вроде целого здания.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

Это изображение просто невероятно. Сотрудники Google загрузили в свою систему ИИ фотографию произвольного визуального шума, и вот что она выдала.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

А вот другое изображение, созданное ИИ на основе произвольного визуального шума.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

И вот еще! На этом изображении мы видим море голубых пагод.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

Пройдя обработку всех 30 слоев, изображение в финале может оказаться очень чудным.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

Или довольно однообразным.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

Мемо Актен (Memo Akten), художник из Стамбула, выставляет это изображение на аукцион. До того, как пройти обработку искусственной нейронной сети Google, это было спутниковой фотографией штаб-квартиры правительства Великобритании.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

А это называется «Саксофонные мечты», его создал скульптор и сотрудник Google Майк Тайка (Mike Tyka).

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

Этот вид творчества будет становиться все более популярным. Лондонский университет сейчас предлагает курс «Машинное обучение и искусство». В Нью-Йоркском университете тоже есть нечто подобное.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

Все средства, собранные от продажи изображений на аукционе, пойдут в фонд Gray Area Foundation.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

Всего на аукционе будет выставлено 29 изображений.

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

Удачной охоты на искусство!

© MIT Computer Science and AI Laboratory / GoogleИзображение, созданное при помощи искусственного интеллекта Google DeepDream

 

Материалы ИноСМИ содержат оценки исключительно зарубежных СМИ и не отражают позицию редакции ИноСМИ.

inosmi.ru

Искусственный интеллект от Google предлагает сыграть в «Крокодила»

Если вам всегда было интересно, что творится в нейронах у нейронных сетей, то Google наконец-то сможет вам это объяснить. Компания выпустила подборку экспериментальных сервисов, которые показывают, на что способен современный искусственный интеллект.

Наиболее интересный из них — Quick, Draw! — предлагает сыграть в некое подобие «Крокодила». Ваша задача — за 20 секунд успеть нарисовать заданный объект, например морковь, велосипед, мяч, лицо и так далее. За это же время программа должна распознать, что именно вы попытались изобразить. Пока вы выводите курсором корявые линии, нейросеть накидывает варианты, до тех пор, пока не опознает правильный.

При этом, как и положено нейросети, она обучается, опираясь на рисунки других пользователей. И чем больше рисунков ИИ видит, тем быстрее у него получается найти верный ответ. Например, вот в этих каракулях нейросеть за несколько секунд признала крокодила. А вы бы смогли?

Ещё один забавный сервис называется Giorgio Cam. Он умеет идентифицировать предметы, которые видит в камере. Здесь результаты не столь впечатляющие, и зачастую ИИ ошибается. Впрочем, отсутствие точности компенсируется подачей. Процесс определения предмета сопровождается задорной электронной музыкой, а варианты ответа нейросеть ритмично укладывает на бит. Выглядит это всё довольно криповато, но завораживающе.

В целом ИИ пока что довольно примитивен и, очевидно, не способен придумать эффективный план по захвату человечества. Но это пока.

Посмотреть все развлекательные эксперименты Google на поприще создания искусственного интеллекта вы сможете здесь.

lifehacker.ru

Как и зачем Google создаёт искусственный интеллект

Компания Google открыла в Цюрихе новый исследовательский центр Google Research, который будет заниматься машинным интеллектом. Теперь это один из крупнейших центров исследований, связанный с разработкой искусственного интеллекта за пределами США. Его открытие связано с новой стратегией Google, которая предполагает активное внедрение машинного интеллекта в сервисы и приложения. Уже сегодня компания использует наработки в этой области в таких продуктах, как Translate и Photos. А на конференции Google I/O 2016 были представлены мессенджер Allo и устройство умного дома Google Home, в которых также используется машинный интеллект. С открытием нового исследовательского центра в Цюрихе, Google планирует совершить значительный прорыв в этой области. Нам удалось побывать на открытии этого центра и узнать о том, как и для чего компания разрабатывает искусственный интеллект.

Как Google создаёт искусственный интеллект?

Открывшийся в Цюрихе исследовательский центр будет заниматься разработкой в трёх ключевых для искусственного интеллекта областях: машинное обучение, машинное восприятие, а также обработка и понимание естественной речи. Все они необходимы для того, чтобы создать компьютеры следующего поколения, которые смогут учиться от людей и окружающего их мира.

Машинное обучение

Машинный или искусственный интеллект часто путают с машинным обучением, и хотя без второго не может быть первого, они основаны немного на разных принципах. Само по себе понятие «искусственный интеллект» предполагает создание компьютера, который думает, в то время как «машинное обучение» — это разработка компьютеров, которые могут учиться. «Запрограммировать компьютер, чтобы он был умным, может быть сложнее, чем запрограммировать компьютер, который учится, чтобы быть умным» — объясняет разницу Грег Коррадо (Greg Corrado), старший научный исследователь Google по машинному обучению.

Работу машинного обучения сегодня может ощутить на себе каждый пользователь электронной почты Gmail. Если раньше спам-фильтр сервиса следовал строгим правилам с ключевыми словами, то сегодня он учится на основе примеров. Отфильтровывая почту, он становится всё лучше и лучше. Это один из самых простых примеров использования машинного обучения, но сегодня Google уже создаёт более сложные самообучающиеся системы.

Для этого компания применяет три способа машинного обучения:

1. Обучение с учителем — это обучение на примерах, на манер того, как спам-фильтр Gmail фильтрует почту, получая всё новые и новые примеры спам-рассылок. Единственная проблема с этим способом: для того, чтобы он был эффективным, нужно иметь большое количество готовых примеров.

2. Обучение без учителя — это кластеризация данных, компьютеру предоставляются объекты без описания и он пытается найти между ними внутренние закономерности, зависимости и взаимосвязи. Так как данные изначально не имеют обозначений, то для системы нет сигнала ошибки или награды, и она не знает правильного решения.

3. Обучение с подкреплением — этот метод связан с «обучением с учителем», но здесь данные не просто вводятся в компьютер, а используются для решения задач. Если решение правильное, то система получает позитивный отклик, который запоминает, подкрепляя тем самым свои знания. Если же решение неверное, то компьютер получает негативный отклик, и должен найти другой способ решения задачи.

Сегодня Google в основном использует для своих сервисом метод «обучение с учителем», тем не менее, в компании отмечают, что «обучение с подкреплением» может иметь ещё больший потенциал. Именно комбинация этих двух методов была использована для создания искусственного интеллекта AlphaGo, который смог победить профессиональных игроков в игру го. Сначала компьютер со счётом 5-0 обыграл чемпиона Европы по го Фань Хуэя (2-ой дан), а потом сыграл с Ли Седолем, игроком 9 дана (самый высокий ранг в го), и опять финальный счёт оказался 4-1 не в пользу человека.

Почему победа искусственного интеллекта в игре го так важна для развития машинного обучения? Дело в том, что сама по себе игра очень сложная для компьютера. В го используется доска гобан 19х19 линий, на которую один игрок кладёт чёрные, а другой — белые камни, в попытке захватить как можно большую площадь доски. В отличие от шахмат, где каждая фигура имеет чётко заданную позицию и ходы, в го игроки ограничены только доской. Поэтому во время игры они используют не только знания, но также интуицию. Для компьютера дополнительной сложностью является огромное количество возможных позиций (10^170), а также ему тяжело оценить, кто выигрывает игру.

Поэтому для AlphaGo были разработаны две нейросети. Первую назвали «сетью значения», она оценивает позицию камней на поле числами от -1 до 1, чтобы определить, какие камни лидируют: белые (-1) или чёрные(1). Если позиция сбалансирована, и каждый игрок может победить, то значение будет близко к 0. Нейросеть сканирует доску и оценивает позицию камней, после чего начинает понимать насколько выгодно расположены белые и чёрные камни. Вторую нейросеть назвали «сетью политик». На основе экспертных данных о ходах в го она составляет карту, определяя какие именно ходы в этой позиции будут наиболее удачными.

Таким образом, «сеть значения» позволяет AlphaGo понимать позицию камней на доске и определять, кто выигрывает, а «сеть политик» упрощает алгоритму поиска подбор возможных вариантов хода, так как ограничивает его в зависимости от позиции камней.

Перед тем как продолжить, важно разобрать, что же такое «нейросеть»? К сожалению, сегодня не существует единого формального определения «искусственной нейронной сети». Если попробовать изложить его простыми словами, то нейросеть — это ряд математических моделей, которые созданы по принципу работы биологических нейронных сетей. Искусственные нейроны (простые процессоры) соединяются между собой, получают сигнал, обрабатывают его и отправляют дальше, следующему нейрону. Каждый нейрон — это простая математическая функция, но работая вместе, они позволяют решать сложные задачи.

Как тренировались нейросети для AlphaGo?

«Мы начали с данных профессиональных игроков в го. Так как игры в основном записывают, то у нас было очень много пар: позиция плюс ход, которым она была достигнута. Одна игра даёт нам где-то 300 таких пар. Каждый ход в такой игре профессиональный, так как сделан экспертом. Мы использовали «обучение с учителем», чтобы научить нейросеть предугадывать, какой бы ход сделал профессиональный игрок в этой позиции. Так была создана «сеть политик». Дальше мы позволили нейросети играть против себя, причём как с позиции чёрных, так и белых камней. Результат этих игр мы загружали обратно в нейросеть. Это уже «обучение с подкреплением», оно пока не так хорошо исследовано, но мы считаем, что это будущее машинного обучения. Дальше, благодаря игре нейросети против себя самой, мы получили большой объём данных о позиции камней на доске, а также исходе игр. На их основе мы тренировали «сеть значения», которая научилась понимать, при каких позициях выигрывают чёрные камни, а при каких белые. Оценка — это очень важный параметр для создания игровой программы и машинного обучения в целом, ведь вам нужен способ определить прогресс в игре» — рассказывает Тор Грэпель (Thore Graepel), учёный-исследователь в проекте Google DeepMind, который разработал AlphaGo.

Несмотря на то, что AlphaGo обыграл профессиональных игроков в го и легко обыгрывает другие искусственные интеллекты, разработанные для этой игры, не только это стало выдающимся достижением данной системы. Во второй игре с Ли Седолем AlphaGo сделал очень необычный 37 ход на 5 линии, который изначально не казался удачным, но потом позволил компьютеру захватить эту часть доски. Дело в том, что в экспертной информации, которую загружали в AlphaGo, не было подобных ходов, и можно считать, что это было одно из первых проявлений креативности в исполнении компьютера.

Сегодня для машинного обучения Google использует библиотеку открытого программного обеспечения TensorFlow. Это API второго поколения, который работает для исследований, а также для коммерческих продуктов Google, в которых используется машинное обучение, среди них поиск, распознавание речи, Gmail и Photos.

Машинное восприятие

Ещё одним важным направлением для развития искусственного интеллекта является машинное восприятие. Несмотря на то, что за последнее десятилетие компьютеры сильно продвинулись в распознавании звуков, музыки и рукописного текста, им всё ещё тяжело даётся распознавание изображений и видео. Зрительная система человека без проблем распознаёт изображения, в каждом большом полушарии нашего мозга есть первичная зрительная кора (зрительная зона V1), которая содержит 140 млн нейронов с десятками миллиардов соединений между ними. И, тем не менее, мозг человека дополнительно использует экстрастриарную зрительную кору (зоны V2, V3, V4 и V5) для распознавания изображений. Поэтому для нас не составляет большой проблемы увидеть серого кота, который лежит на сером ковре. Но для компьютера это очень сложная задача.

Раньше Google осуществлял каталогизацию фотографий по описаниям, пользователю нужно было добавлять метки к снимкам, чтобы потом их можно было сгруппировать или найти. Сегодня в сервисе Google Photos работает более продвинутое распознавание изображений на основе «свёрточной нейронной сети». Эта архитектура, разработанная учёным Яном Лекуном, обладает одним из лучших алгоритмов по распознаванию изображений. Если не углубляться в детали, то она представляет собой многослойную структуру искусственных нейронов, каждый слой которой принимает на вход только небольшой участок введённого изображения. С помощью проекта Deep Dream сегодня любой желающий может оценить, как именно свёрточная нейронная сеть видит изображения.

Для обучения своей нейронной сети Google использует открытые базы данных с изображениями. Например, в 2012 году в Google научили нейросеть распознавать изображения котов, используя 10 млн кадров с котами из видео на YouTube.

Обработка и понимание естественной речи

Для того чтобы компьютер понимал не просто голосовые команды, но и естественную речь, в Google используют рекуррентные нейронные сети.

Традиционное распознавание речи разбивает звуки на небольшие фрагменты по 10 миллисекунд аудио. Каждый такой фрагмент анализируется на содержание частот, при этом полученный вектор характеристик проходит через акустическую модель, которая выводит распределение вероятностей по всем звукам. Дальше в сочетании с другими характеристиками речи, через модель произношения, система связывает последовательность звуков правильных слов в языке и в модели, определяя, насколько вероятно данное слово в языке, который используется. В конце языковая модель анализирует полученные слова и фразу целиком, пробуя оценить, возможна ли такая последовательность слов в этом языке. Но по некоторым словам в фонетической записи сложно определить, где заканчивается одна буква и начинается другая, а это очень важно для правильного распознавания.

Теперь в Google используют акустическую модель на основе рекуррентной нейронной сети с архитектурой «долгой кратковременной памяти». Простыми словами, эта нейросеть лучше других умеет запоминать информацию, что позволило обучить её распознаванию фонем во фразе, а это значительно улучшило качество системы распознавания. Поэтому сегодня распознавание голоса на Android работает практически в режиме реального времени.

Искусственный интеллект: помощник или угроза?

Этическая сторона использования искусственного интеллекта всегда находится на повестке дня, признают в Google. Тем не менее, в компании пока не считают, что мы достаточно близки к созданию компьютеров, у которых есть самосознание, чтобы предметно обсуждать этот вопрос. «Компьютеры учатся медленно» — утверждает Грег Коррадо. Пока Google может построить искусственный интеллект, который хорошо справляется с одной задачей, например с игрой го, как AlphaGo. Но для полноценного искусственного интеллекта понадобятся многократно большие вычислительные мощности. Сегодня же мы видим, что производительность процессоров замедляется, мы практически подошли к пределу «Закона Мура», и хотя это отчасти компенсируется повышением производительности видеокарт и появлению специализированных процессоров, пока этого всё равно недостаточно. Кроме этого, ещё одной преградой является отсутствие достаточного количества экспертной информации, которую можно было бы использовать для машинного обучения. Все эти, и не только, проблемы человечество может решить в течение 20, 50 или 100 лет, а может не решить никогда, никто не может дать точный прогноз. Соответственно, искусственный интеллект, который мы видим в фильмах, возможно, будет сильно отличаться от того, что мы в итоге получим.

Помощник на все руки и будущее поиска Google

Google пока ставит перед собой более реалистичную цель — создать виртуальных ассистентов на основе искусственного интеллекта. Сегодня уже существуют такие виртуальные помощники как Siri или Google Now, но они очень ограничены и оторваны от реальности, в которой находится пользователь. Что же хочет сделать Google? В компании считают, что виртуальный ассистент должен понимать окружающий мир, положение пользователя в этом мире, а также опираться на актуальный контекст в общении.

«Представьте, что у вас есть невероятно умный ассистент, и вы говорите ему: изучи эту область и расскажи мне, что ты думаешь. Вот, что мы пытаемся создать. В моём случае я бы хотел сказать ассистенту: покажи мне самые интересные и релевантные вещи, которых я ещё не знаю» — рассказывает Эрик Шмидт (Eric Schmidt), глава совета директоров компании Alphabet, которой принадлежит Google.

Таким образом, в Google видят искусственный интеллект в качестве нового инструмента, который сможет расширить возможности человека, путём предоставления ему новых знаний. Хорошим примером тут может послужить AlphaGo, который игроки в го воспринимают в качестве возможности повысить свой уровень. Ведь если тренироваться против искусственного интеллекта, который уже превышает максимальный ранг в игре, то это может вывести её на новый уровень.

itc.ua


Смотрите также



© 2010- GutenBlog.ru Карта сайта, XML.