Электронная библиотека » Робин Ли » » онлайн чтение - страница 8


  • Текст добавлен: 8 мая 2021, 11:48


Автор книги: Робин Ли


Жанр: Зарубежная образовательная литература, Наука и Образование


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 8 (всего у книги 24 страниц) [доступный отрывок для чтения: 8 страниц]

Шрифт:
- 100% +
Развитие нейронной сети и глубокого обучения

Традиционный искусственный интеллект опирался на метод ручного ввода. Такая модель была эффективна только для решения проблем с четкими правилами. Например, игра в шахматы искусственного интеллекта с чемпионом Каспаровым. Однако проблему распознавания картин, которую человек может решить еще в младенческом возрасте, ИИ осилить не в состоянии. Так как в ней нет четких правил, есть только смутное представление. Преимущества нейронных сетей в том, что людям не нужно устанавливать правила для машины. Она будет выявлять их самостоятельно по шаблонам из огромного количества исходных данных.

Как следует из названия, нейронная сеть напоминает человеческий мозг. Она состоит из отдельных нейронов, связанных друг с другом в рамках сети. Один нейрон решает только простейшую проблему. Но объединившиеся в многоуровневое целое, они способны справиться и со сложными задачами.

Джеффри Хинтон считал, что традиционные методы машинного обучения неэффективны в решении действительно сложных проблем, так как используют только один слой чип-сети. Основная идея глубокого обучения заключается в повышении эффективности нейронной сети за счет увеличения количества слоев и в упрощении поиска решения за счет поэтапного ввода данных. Иными словами, сложная задача решается поэтапно, разделенная на несколько слоев. Результат, полученный на уровне одного слоя, передается на следующий для дальнейшей обработки.

С помощью слоев нейронных сетей машина находит простые шаблоны для решения задачи – шаблоны в шаблонах. В качестве примера приведем технологию распознавания лиц. Первый слой нейронной сети фокусируется на некоторых областях изображения и распознает отдельные фигуры – глаза, нос, рот и т. д. Затем идентифицированные предметы переходят на следующий слой. Он определяет, что выявленные предметы могут принадлежать взрослому человеку. Говоря математическим языком, многослойная нейронная сеть разделяется на CNN (сверточная нейронная сеть) с данными о пространстве и RNN (рекуррентная нейронная сеть) с данными о времени.

CNN часто используются для распознавания изображений. Как описано выше, на первом уровне сети решается только одна «маленькая задача» – идентифицировать локальный модуль на изображении, такой как квадрат, треугольник или круг. На этом уровне вводится большое количество данных изображения, только чтобы слой нейронов определил «край» основного изображения, то есть ничего рядом с пикселем не было. Каждый из последующих слоев решает задачу более высокого уровня, черпая информацию из предыдущего слоя. Этот метод имитирует работу человеческого глаза. Наш глаз объединяет информацию, отбрасывает второстепенные детали и приоритезирует определенные характерные закономерности. Если несколько мелких квадратов, треугольников и один круг объединяются и формируют лицо, то человеческий глаз сначала обратит внимание на него, а не на прочие детали вне зависимости от того, в какой части изображения оно находится.

RNN часто используются для распознавания речи и обработки естественного языка. Поскольку речь и язык – это данные, которые зависят от времени. Значение следующего предложения неразрывно связано с предыдущим предложением. И сеть RNN может запоминать информацию. Предположим, нам нужно разработать языковую модель и использовать предыдущие предложения для прогнозирования следующих слов. Исходные данные: «Я родился в Китае в 1976 году. Мое высшее образование – математика. Я свободно говорю на _______». Для человека очевидно, что пропущенное слово – «китайском». Компьютерные сети должны быть в состоянии прийти к такому же выводу. Для этого потребуется вычленить информацию из предыдущего предложения, воспользовавшись временным измерением нейронной сети.

Глубокая нейронная сеть оптимизирует скорость машинного обучения и открывает новые возможности для развития технологии искусственного интеллекта. Она позволила нам достичь значительных успехов в распознавании изображений, речи, машинном переводе и т. д. Голосовой ввод стал гораздо быстрее, чем ввод текста. Машинный перевод позволил нам понимать информацию на иностранном языке. А распознавание изображений может точно найти конкретного человека на множестве фотографий и отличить взрослого от подростка. А если фотография сделана расплывчато, то мы можем восстановить ее – сделать изображение четким и точным.

Искусственный интеллект, в основе которого лежит глубокое обучение, существенно отличается от предыдущей версии ИИ. Но логика его работы очень напоминает то, что делаем мы: сначала получаем результат, а затем определяем шаблон, по которому он был получен. Этот процесс называется обучением.

Мы можем объяснить основные способы мышления машин, основанные на глубоком обучении, с помощью простых математических знаний.

Для иллюстрации можно использовать простую функцию.

Вспомним, как мы раньше решали математические задачи. Обычно у нас есть формула (функция), куда необходимо ввести данные, чтобы получить результат. Возьмем в качестве примера функцию: y = ax + b. Если y = 2x + 1 и известно, что x = 1, то y будет равен 3. Здесь x – это «вход», а полученный y – «выход».

Математические способности более высокого порядка – это возможность вычислить входные значения при знании функции и выхода. То есть при известных y=2x+1, где y=5, нам необходимо будет найти х.

Еще один шаг вперед – способности машинного обучения в случае, где мы не знаем значения коэффициентов a, b, но знаем значения y и x. То есть при известных «входе» и «выходе» необходимо найти коэффициенты функции. В функции y=ax+b нам просто нужно знать значения двух наборов x, y, чтобы подтвердить a и b.

Предположим теперь, что у нас есть набор входных и выходных данных, но мы не знаем функцию. Для решения нам потребуется конструктор. Например, известно, что x=2, y = 5, и требуется рассчитать f(x). Это невозможно сделать в тех случаях, когда входные и выходные данные невелики. f(x) может быть 2x+1, или 1x+3, или даже x2+1 и т. п. Только если имеется достаточное количество значений x и y, математики смогут «продвинуться к решению», постоянно корректируя вес формулы.

Проблема в том, что данные, генерируемые в современных производстве и жизни, очень сложны. Функции, которые можно вычислить на их основе, будут содержать «колоссальную энергию». И человек уже не способен справиться с этой задачей, но может передать ее компьютеру. Функция подгонки очень проста. Нейронная сеть глубокого обучения имитирует нервные узлы человеческого мозга, каждый из которых фактически является регулятором функции, а бесчисленные функции пересекаются друг с другом. С помощью различных методов, таких как математическая матрица, оптимизация и регулярные выражения, процесс глубинного обучения корректирует вес каждого функционального коэффициента, и в случае, если данные достаточны и принцип конструкции подходит, эволюционирующие функции будут все более точно соответствовать большинству данных. Мы можем использовать этот набор функций, чтобы предсказать то, что еще не произошло. Этот процесс мы называем «тренировкой».

Ведущая команда специалистов Google обучила компьютерную систему распознавать кошек.

При использовании устаревшего искусственного интеллекта для начала требовалось дать детальное описание кошки: острые уши, круглые глаза, прямые усы, четыре ноги, длинный хвост… Затем необходимо было преобразовать характеристики в функции, ввести их в компьютер и загрузить изображение кошки в качестве примера. Компьютер разделял элементы на картинке по категориям, а затем сравнивал их с исходным данными, где были описаны острые уши, круглые глаза, прямые усы, четыре ноги, длинный хвост и другие характеристики кошки.

Ученые сделали так, чтобы не было необходимости описывать функциями характеристики кошки, и компьютеры писали их сами. Они «накормили» компьютер большим количеством фотографий, чтобы он мог понять: кошка это или нет. В нейронной сети существует множество путей распознавания кошки, так же как в человеческом мозге. Каждый путь дает свои результаты. Правильный ответ помечался зеленым цветом, неправильный – красным. После более чем достаточного числа попыток в 100 000 различных фотографий с кошками, правильные или взвешенные нейронные сети были преобразованы в технологию распознавания (комплекс функциональных связей). Ученые больше не будут комментировать результат распознавания, а кошка будет всегда идентифицироваться верно. Чем больше вводить обучающих данных, тем сложнее, но точнее набор полученных функций.

Это «контролируемое обучение», которое зависит от большого количества данных. Ву Энда возглавлял программу идентификации кошки, которая бы позволила узнать животное с нуля. После того, как исследователи показали нейронной сети несколько миллионов статических снимков кошки, она выработала стабильную модель распознавания. И теперь, как и все дети, система может без труда опознать кошку.

Кварк Вэй Ле, ученик Ву Энда, опубликовал статью, в которой доказал, что машинное обучение может идентифицировать уникальные данные и создавать собственные модели решения задач. Способности технологии машинного обучения вовсе не ограничиваются распознаванием кошек.

Более 20 лет назад Кевин Келли в научной книге «Из-под контроля» рассказал об «эффекте колонии пчел». Там же он предсказал появление новых технологий, таких как распределенные вычисления, хотя, возможно, был незнаком с принципами машинного обучения. Он отметил, что движение каждой пчелы случайно, но колония пчел всегда летит в одном направлении. «Эффект колонии пчел» можно представить следующим образом: действия (входы) большого числа пчел объединены в одно общее движение (выход), а логика (функция) находится в середине этого процесса. Информационное движение в компьютерных нейронных сетях похоже на сбор пыльцы роем пчел. В их, казалось бы, безумной траектории полета, распознается и идентифицируется лицо кошки. У Baidu гораздо больше возможностей в распознавании кошек, чем у людей. ИИ может даже точно разграничить разные породы.

Для людей машинное обучение представляет собой «черный ящик». И некоторые всерьез обеспокоены тем, что этот ящик может представлять опасность для человека. Ведь мы не знаем, как и о чем думает машина. Глубокое обучение может устроить нам сюрприз…

Прошлое без глубокого обучения

Инженер Лю Ян из команды по развитию распознавания речи Baidu отметил одну интересную вещь. Когда члены команды тестировали программу распознавания речи дома, они пропевали, а не произносили слова. При этом текст был точно идентифицирован. Удивительно, что ни одной другой компании не удалось обучить этому функцию распознавания речи. Команда Baidu не ставила перед собой цель научить машину узнавать песню. Они не знают, как это произошло. Напрашивается вывод, что возможности глубокого обучения достаточно велики, чтобы машина получила этот удивительный навык.

Люди, как правило, знают об изменениях в мире. В тот период, когда технология глубокого обучения еще не начала использоваться, казалось, что мир в полном порядке. Некоторые недостатки и проблемы воспринимались как должное. Чжоу Кехуа, серийный убийца, более десяти лет находился в розыске. Чтобы напасть на его след, отдел общественной безопасности мобилизовал почти все камеры видеонаблюдения. А как в то время обрабатывали видео? Невооруженным глазом! Некоторые полицейские даже падали в обморок, пока просматривали сотни или даже тысячи часов видео. Визуальное распознавание, основанное на методах глубокого обучения, изменит это. В настоящее время передовые системы мониторинга имеют сильную поддержку искусственного интеллекта. После обучения массивами данных машины смогут мгновенно распознавать лица, номерные знаки, модели автомобилей и т. д., чем существенно облегчат поиск людей. Нужно будет просто дать компьютеру несколько фотографий подозреваемого, и нейронная сеть быстро найдет материал, связанный с ним. Компания Yushi Technology, занимающаяся производством оборудования для обеспечения безопасности, разработала систему смарт-камер, которая в сочетании с картой Baidu может быстро определить траекторию движения подозреваемого или его транспортного средства.

Глубокое обучение изменило нашу жизнь там, где большинство этого даже не замечают. Чтобы поддерживать обновление картографической информации, сборочный автомобиль выезжает на дорогу. Обычно в нем работают два человека, а процесс сбора делится на две части – внутреннюю и внешнюю. Внешняя работа заключается в том, чтобы записывать информацию обо всех вещах на пути. Первый сотрудник несет ответственность за видеозапись с качественным звуком. Каждый раз, проходя мимо определенного места, необходимо отметить, например, что там есть светофор, четыре полосы движения, левый поворот, поворот вправо, дорога для продолжения движения прямо… Это традиционный способ сбора картографической информации. То есть необходимо просто записывать на видео все, что есть вокруг, а затем отправить данные в центр обработки. Персонал центра обработки данных зарегистрирует новые данные, сравнит со старыми и нанесет элементы на карту. Довольно трудоемкий рабочий процесс.

С умной технологией распознавания изображения мы можем обучить машину определять светофоры, повороты, разметку и другие элементы дороги. А после этого при записи очередного панорамного изображения получить все необходимые данные для того, чтобы была возможность сразу же внести их на карту. Это значительно экономит время и силы, а также повышает эффективность и точность данных.

Помимо алгоритмов программного обеспечения у глубокого обучения есть еще одно преимущество. В истории есть много примеров, когда изобретение находило применение в абсолютно неожиданных областях. Например, нитроглицерину, который сначала использовался в качестве взрывчатого вещества, нашли применение при оказании первой помощи при сердечных заболеваниях… В процессе глубокого обучения функция GPU тоже изменилась. Изначально графические процессоры были видеокартами для визуализации изображений и ускорения графических вычислений, а потом стали основным оборудованием для глубокого обучения. Графические чипы обладают более мощными вычислительными возможностями с плавающей точкой, чем CPU. Поэтому матричные данные, используемые для обработки изображений, идеально подходят для вычисления данных в области машинного обучения. Когда команда Ву Энда впервые использовала GPU для машинного обучения, немногие уловили суть. Сегодня это стало мейнстримом.

Но самое глубокое обучение все еще в поисковых системах.

Поисковик: судьба искусственного интеллекта на волоске

Для сегодняшних китайских интернет-пользователей Baidu стал привычкой. Но раньше его фокусировка на области искусственного интеллекта вызывала некоторое замешательство. Электроэнергия, игры, социальные сети, коммуникация… Все что угодно: от создания ПК до изобретения мобильных устройств и интернета. Почему Baidu занимается только искусственным интеллектом?

Многие люди думают, что компания Baidu выбрала сферу искусственного интеллекта. Но на самом деле, это искусственный интеллект выбрал Baidu. Если Baidu не будет следовать избранной миссии, то это будет не только потеря для компании, но и для Китая и даже мира.

Все начинается с поисковой системы

Поисковая система для пользователя – всего лишь инструмент, который может помочь им найти необходимую информацию. Для сайта, предоставляющего контент, поисковая система – это среда, которая помогает передавать контент нуждающимся пользователям. Во-первых, поисковая система должна «слышать» потребности пользователя, понимать из ключевых слов запроса, что именно он хочет найти. Во-вторых, она должна из огромного количества контента выбрать то, что лучше всего соответствует требованиям пользователя.

Давайте разберем этот процесс так же, как концептуальную модель глубокого обучения. Вход, выход и даже каждое изменение в поиске можно рассматривать как обучение для поисковых систем. Итак, кто скажет поисковой системе, хорош или плох результат? Пользователь. Клик – это ответ. Если пользователь не воспользовался результатами, отображенными на первой странице, и перешел ко второй, значит система допустила ошибку.

Поисковая система не только повышает точность результатов поиска, ориентируясь на предпочтения пользователей, но и учится отличать «плохие» веб-страницы от «хороших». Привыкает выбирать страницы, как это делают люди. Изначально поисковик анализировал только заголовки, ключевые слова, описания и некоторые другие элементы страницы. Теперь такие поисковые системы, как Baidu, могут определять степень правдивости информации, количество рекламы и выбирают страницы, которые действительно обладают ценностью для пользователя.

Получение информации через поисковую систему – это процесс диалога между человеком и машиной. В отличие от предыдущих человеко-компьютерных взаимодействий, этот процесс основан на «естественном языке». Распознавание изображений, распознавание речи, обработка естественного языка являются основными технологиями поисковых систем.

Ван Хайфэн считает, что нам необходимы новые возможности и способы мышления, чтобы расширить способность мыслить и приобретать знания. Это уже выходит за рамки наших способностей видеть, слышать, говорить и действовать. Язык является одной из самых важных характеристик, которая отличает человека от других живых существ. Видеть, слышать и действовать могут почти все животные. И у некоторых из них эти способности развиты сильнее, чем у людей. Но язык уникален. Знание, основанное на языке, также уникально.

Во все времена человечество фиксировало свои знания. Они записывались и передавались в виде языка. А инструменты, используемые для записей, постоянно совершенствовались: от оракула, бумаги до современного интернета. Таким образом, как Baidu, так и Google считают, что обработка естественного языка является очень сложной задачей для будущего искусственного интеллекта. Распознавание речи, например преобразование голоса в текст или слова в звук, решает только проблему преобразования одного сигнала в другой. Это не является языком. А именно язык неразрывно связан с человеческим мышлением и знанием.

Такие проекты, как AlphaGo, стали потрясающим изобретением для обычных людей. И мы считаем, что это настоящий успех. Но мы не можем игнорировать его особенности: пространство закрыто и специфично, а система работает только на основе полной информации и ясных правил. Игра в шахматы может использоваться в системах с искусственным интеллектом, обученных ходам. Обработка естественного языка – более сложная задача. Для Go нет никаких сложностей, пока данные и вычислительная мощность имеются в достаточном количестве. В языке неопределенностей слишком много, например семантическое разнообразие.

Для того, чтобы компьютеры могли «понимать» и генерировать человеческий язык, ученые проделали большую работу. В Baidu на основе массивов данных, машинном обучении и лингвистике была создана карта знаний, построена система вопросов и ответов машинного перевода и конструирования диалога, а также проанализирована способность распознавать эмоции.

Только в «Сети знаний» (Knowledge Graph) можно выделить три категории функций: граф сущностей, граф внимания и граф намерений.

В «Сети знаний» каждый узел является сущностью, каждый объект имеет несколько атрибутов, связь между узлами – это связь между объектами. В настоящее время физическая карта Baidu содержит сотни миллионов объектов, десятки миллиардов атрибутов и сотни миллиардов связей, которые были извлечены из большого количества структурированных и неструктурированных данных.

Теперь давайте рассмотрим пример, если кто-то ищет: «Бывший муж бывшей жены отца папы».

Отношения между персонажами, содержащиеся в этой фразе, очень сложны, но наша система рассуждений может легко проанализировать отношения между сущностями и в конечном итоге получить правильный ответ.

Технология обработки естественного языка Baidu может анализировать грамматически сложные конструкции и определять неоднозначность предложений, а не только искать буквальное соответствие.

Бывший муж бывшей жены отца Цзинтун Доу опубликовал новость на сайте FayeWong.

Бывший муж Вэй Доу, родившийся 14 октября 1969 года в Пекине, Китай, певец, экспериментальный музыкант. В 1988 году он присоединился к Черной пантере.

Япэн Ли Ли Япэн и родился 27 сентября 1971 года в округе Шуймогоу, Урумчи, Синьцзян. Окончил Центральную академию драмы в 1994 году.


Рис. 3-5. Диаграмма взаимоотношений 1


Еще один пример: кто сын Лин Сычэна; Лин Сычэн чей сын.


Рис. 3-6. Диаграмма взаимоотношений 2


Если мы используем традиционные методы поиска по ключевым словам, то получим почти идентичные результаты. Однако после семантического анализа машина может обнаружить, что семантика этих двух предложений совершенно разная, и, соответственно, из «Сети знаний» может быть извлечен совершенно другой ответ.

Существует также третье предложение: кто родители Лян Цичэн. Буквально это отличается от второго предложения, но после семантического анализа машина обнаружит, что два предложения ищут один и тот же объект.

Глубокая технология обучения еще больше повышает способность к обработке естественного языка. С 2013 года Baidu использует модель DNN в поисковых системах. Эта модель пережила несколько десятков обновлений и сейчас использует семантический анализ для поиска. Это очень важная особенность. Не только результаты поиска стали более релевантными. Улучшилось положение и с пониманием, восприятием проблем и запросов, и с машинным переводом.

Техническая основа для поиска – техническая основа и для искусственного интеллекта. Например, Чжан Якин, который отвечает за облачную работу Baidu, считает, что поиск – это самое крупное приложение для облачных вычислений. Без облака нет возможностей получить хороший результат. Baidu рождается в облаке.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации