Текст книги "Миварное понимание смысла через концепты"
Автор книги: Олег Варламов
Жанр: Компьютеры: прочее, Компьютеры
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 1 (всего у книги 2 страниц) [доступный отрывок для чтения: 1 страниц]
О.О. Варламов
Миварные технологии создания логического искусственного интеллекта: логическая обработка с линейной вычислительной сложностью более 3 миллионов продукций и возможность понимания смысла через моделирование большого контекста
Введение
Проблема создания интеллектуальных систем и логического искусственного интеллекта (ИИ) является актуальной и важной. Этой тематике посвящено большое количество научных работ [Поспелов, 1989], [Люгер, 2005], [Джарратано и др., 2007], [Варламов, 2002], [Когаловский, 2005], [Кузнецов, 2009], [Санду и др., 2010]. Миварный подход позволяет предложить новые модели и методы обработки информации и управления [Варламов и др., 2010], [Варламов, 2002], [Варламов, 2011], [Мивар, 2011], [Санду и др., 2010]. Под системами искусственного интеллекта будем понимать активные самообучающиеся логически рассуждающие системы. Ранее были разработаны технологии создания экспертных систем по узконаправленным предметным областям. Это обусловлено сложностями формализованного описания предметных областей и тем, что из-за факториальной вычислительной сложности системы логического вывода не могли обрабатывать много объектов/правил [Кузнецов, 2009], [Поспелов, 1989], [Люгер, 2005]. Для реализации экспертных систем, основанных на знаниях, используются продукции, логика предикатов и др. [Джарратано и др., 2007]. В то же время, получили развитие «интеллектуальные пакеты прикладных программ» (ИППП), которые позволяли решать в автоматизированном режиме задачи в разных областях, где требовались вычисления и конструирование алгоритмов решения задач. Технологии ИППП развиваются в миварах, сервисно-ориентированных архитектурах.
Российский фундаментальный инновационный миварный подход [Варламов, 2002], [Варламов, 2003], [Варламов, 2011], [Мивар, 2011], [Санду и др., 2010] позволяет использовать эволюционные базы данных и правил для формирования единого глобального пространства накопления и обработки информации. Миварный подход позволит создать мультипредметные экспертные системы и перейти к реальной обработке больших контекстов, представляющих собой информационные модели сложных предметных областей. Уже сейчас мивары обрабатывают более 3,5 миллионов продукций. На основе миварных сетей можно создавать сложные и сверхбольшие информационные модели. Это позволит работать с адекватными контекстами и, в ближайшей перспективе позволит компьютерам "понимать смысл информации". Следовательно, тема данной работы актуальна и перспективна.
1. Миварный подход
В миварном подходе объединяются базы данных, вычисления, сервисы и логика. Мивары изначально были рассчитаны на многомерное и эволюционное представление информации для создания различных интеллектуальных систем, включая глобальные системы обучения, обработки информации и тренажеры [Варламов, 2002], [Варламов, 2003], [Варламов, 2011], [Мивар, 2011], [Санду и др., 2010]. Информатика занимается 5 основными процессами: сбор, передача, накопление, обработка и представление информации. В настоящее время мивары из этих 5 процессов реализует два: накопление и обработку информации, а миварный подход включает две основные технологии.
1) Миварная технология накопления информации – это способ создания глобальных эволюционных баз данных и правил (знаний) с изменяемой структурой на основе адаптивного дискретного миварного информационного пространства унифицированного представления данных и правил, базирующегося на трех основных понятиях «вещь, свойство, отношение» (полученных на основе гносеологии и работ Райбекаса А.Я.).
2) Миварная технология обработки информации – это способ решения логико-вычислительных задач путем создания системы логического вывода или «конструирования алгоритмов из модулей, сервисов или процедур» на основе активной обучаемой миварной логико-вычислительной сети правил («миварная сеть» – «MIVAR net») с линейной вычислительной сложностью.
Миварная технология накопления информации предназначена для хранения любой информации с возможным эволюционным изменением структуры и без ограничений по объему и формам представления. Миварная технология обработки информации предназначена для обработки информации, включая логический вывод, вычислительные процедуры и сервисы. Фактически, миварные сети позволяют развить продукционный подход и создать автоматическую обучаемую логически рассуждающую систему реального времени. Миварное представление логики позволило перейти от однодольных графов продукций к многодольным сетям и выполнять все операции с линейной сложностью.
Мивары быстрее, чем продукции, потому что:
1) в продукциях за основу поиска были взяты правила, которые перебирались для поиска решения, что порождало полный перебор, факториальную сложность и циклы (рисунок 1);
2) в миварных сетях явно выделены две доли: "правила" и "объекты" ("переменные"), а за основу поиска алгоритма логического вывода взяты именно "объекты", которые могут иметь только одно значение и их можно найти только один раз, что исключает циклы и полный перебор (рисунок 1);
3) Миварная сеть может быть задана двухмерной матрицей (рисунок 2), в которой каждое правило знает все свои входные и выходные объекты, а каждый объект, соответственно, знает все свои правила и свои роли в них ("вход" или "выход"), что позволяет избежать перебора и постепенно выявляя новые известные объекты через соответствующие правила, постоянно сокращать размерность исходной миварной матрицы обеспечивая линейную вычислительную сложность логического вывода относительно общего количества правил в матрице.
При поиске логического вывода в миварной сети, как показано на рисунке 3, заданные объекты как бы "вытягивают" на следующем уровне свои соответствующие правила, которые затем "вытягивают" соответствующие полученные объекты. Такое "вытягивание" миварами может быть реализовано и "сверху-вниз", и "снизу-вверх", и одновременно от "дано" и от "найти". При этом нет никакого перебора и каждое правило, и каждый объект используется и ищется только один раз. В худшем случае, если есть решение, то будет задействована вся логическая сеть путем такого "вытягивания" с линейной вычислительной сложностью. Если в процессе логического вывода входных данных не будет хватать, то по мере исчерпания всех "запускаемых" правил (т.е. правил у которых известны все входные объекты) процесс остановится и сообщит о нехватке входных данных.
Рисунок 1 – Переход от однодольных графов продукций («Правила») к двудольным графам миварных сетей («Объекты; Правила»)
Рисунок 2 – Формирование матрицы миварной сети
Рисунок 3 – Формирование двудольной миварной сети на основе потока входных данных объектов, типа «Дано» (сверху) и «Найти» (снизу)
В отличие от традиционных подходов, разделяющих хранение в базах данных, логический вывод и вычислительную обработку, миварный подход позволяет создавать многомерные и эволюционные системы, обрабатывающие информацию в реальном масштабе времени с совмещением логических выводов и вычислительной обработки. Миварный подход – это новый подход для разработки интеллектуальных систем и, в ближайшей перспективе, для создания систем логического искусственного интеллекта [Варламов, 2002], [Варламов, 2003], [Варламов, 2011], [Мивар, 2011], [Санду и др., 2010].
2. Выделение трех уровней исследований в области ИИ
На основе системного анализа выделены 3 основных уровня исследований в области создания искусственного интеллекта.
1. Рефлексивный ДО-интеллектуальный уровень – «инстинкты, рефлексы». Нейросети и им подобные методы подобны инстинктивным реакциям, рефлексам и т.п., когда надо мгновенно выполнить некое действие. Образно говоря, если представить систему принятия решения в виде «черного ящика», то на рефлексивном уровне нас интересуют только «входы и выходы» такого ящика – главное, чтобы все эти реакции были правильными и быстрыми. Получается, что мы не пытаемся понять устройство «черного ящика», а только моделируем его работу с целью правильного определения внешних воздействий и поведения системы принятия решений. В основе подобных исследований лежат различные методы статистики, которые имеют ограничения по их применению. Отметим, что этот уровень встречается у животных.
2. Логический интеллектуальный уровень. Под этим уровнем будем понимать традиционные логические системы, реализованные в экспертных системах и т.д. Важным отличием от рефлексивного уровня является то, что изучается не поведение, а само устройство «черного ящика». Мы пытаемся «залезть внутрь черного ящика» и смоделировать его, т.е. раскрыть секрет черного ящика и понять его логическую структуру. Термин «интеллект» ближе к логическому осознанному мышлению, когда человек понимает что и как он делает. Это гораздо медленнее, чем рефлексы и реакции, но зато больше универсальности. Здесь – познание, а нейросети – это диагностика и непосредственное управление. Отметим, что миварный подход работает именно на логическом уровне исследований.
3. Неформализуемый НАД-интеллектуальный уровень. В последнее время уделяется внимание вопросам сознания, совести и т.п. свойствам интеллектуальных систем. Эти проблемы явно выходят за пределы «логического осознанного мышления», т.к. даже человек эти процессы не осознает и не всегда может формализовать. Сюда можно отнести и разнообразные эмоции, чувства, мораль и подобные вопросы. Есть позиция: «давайте сначала сделаем хотя бы „логический интеллект“, а уж потом займемся вопросами его совести и эмоций». Но, если есть ученые, которым важны и интересны проблемы, которые возникнут сразу после создания ИИ, то этим тоже нужно заниматься. На данном уровне исследований в настоящее время исследуется много неформализуемых задач. Причем, по некоторым предпосылкам, вполне может оказаться, что часть задач принципиально нельзя формализовать или придется работать с бесконечными множествами описания различных предметных областей. В настоящий момент этот уровень изучен меньше других, он является наиболее абстрактным. Учитывая успехи на других уровнях исследований ИИ, вопросы взаимодействия, защиты человечества от роботов и ИИ надо решать заранее, ибо делать это потом будет или уже поздно, или некому. Актуальность и важность этому уровню добавляет и то, что миварный подход уже позволил создать работающие программные комплексы, которые автоматически создают алгоритмы [Варламов и др., 2010], [Варламов, 2002], [Варламов, 2011], [Мивар, 2011], [Санду и др., 2010] и являются прототипом обучаемого логического искусственного интеллекта.
3. Практические реализации миваров
В настоящее время разработано уже несколько программных комплексов на основе миварного подхода [Варламов, 2011], [Мивар, 2011], [Санду и др., 2010]. Прежде всего, развивается проект создания мультипредметных экспертных систем на основе программного комплекса УДАВ с переходом к глобальной миварной активной Интернет-энциклопедии. УДАВ (Универсальный делатель алгоритмов Варламова) предназначен для решения сложных логико-вычислительных задач в реальном времени путем «конструирования алгоритмов» или «поиска маршрута логического вывода» с линейной вычислительной сложностью. Это не простой поиск информации или выполнение жестких алгоритмов, а именно интеллектуальное решение задач с построением алгоритмов, активными запросами недостающей информации и поиском решений.
Результаты практических исследований и экспериментов. В настоящее время, наибольшую трудность представляет описание предметной области в виде миварной сети. Поэтому для проведения вычислительных экспериментов был создан специальный программный комплекс, основанный на программе УДАВ. В тестовом комплексе реализован генератор миварных матриц описания предметных областей. Например, в процессе экспериментов были созданы миварные матрицы размерности 1 170 007 объектов на 3 510 015 правил. Программе задается количество объектов – переменных. Далее генератор матриц сам генерирует простые арифметические правила для введенного количества объектов. Например, следующие: a+b=c и/или c-b=a и/или c-a=b.
Генератор матриц выполняет формирование матрицы и сохраняет ее в специальный файл. Затем тестовая программа считывает тестовую матрицу и начинает обработку. Для однозначности и адекватности проводимых сравнений все генерируемые матрицы в определенном смысле являются подобными. Пользователь может сам сгенерировать матрицы или изменить созданные. Такие эксперименты тоже были проведены. В конце своей работы тестовая программа строит граф решения: наверху рисуются исходные данные, а в внизу объект, который искали. Генератор настроен таким образом, чтобы решение всегда существовало, а его нахождение требовало пропорционального увеличения числа шагов искомого алгоритма решения задачи. Время работы программы определяется по внутренним часам компьютера и может сильно зависеть от общей нагрузки и параллельно выполняемых задач. Время решения задач выводится в милисекундах (ms). Было рекомендовано запускать тестовую программу с определенным шагом увеличения объектов и в относительно равнозначных условиях внешней загрузки компьютера. Выявлено, что основным ограничением является ресурс оперативной памяти компьютера и корректность работы с ней операционной системы.
Для проведения тестов были задействованы различные компьютеры, начиная от простейших нетбуков с оперативной памятью 512 Мб и до небольших серверов с процессорами Intel 3,8 Ггц и оперативной памятью 4 Гб. Количество ядер не влияло на скорость работы, т.к. основные тесты проводились с использованием однопоточной программы. Использовались два семейства операционных систем: Windows и Mac OS. На семействе ОС Windows получены следующие результаты: до 150 000 объектов и 450 000 правил. Время решения составляло от нескольких милисекунд до 47 минут.
Наибольший интерес представляют эксперименты, проведенные на ноутбуке MacBook, операционная система Mac OS X версии 10.6.7, процессор Intel Core 2DUO с частотой 2 Ггц и с оперативной памятью DDR3 объемом 4 Гб. На этом ноутбуке в различные периоды времени были проведены тестовые испытания двух версий тестовой программы: В1 и В2. Результаты испытаний приведены на рисунке 4. Итак, на обычном серийном ноутбуке MacBook неоптимизированная тестовая программа УДАВ, написанная на языке ЯВА (не самом быстром языке), обрабатывает миварные матрицы размерности 1 миллион объектов на 3,5 миллиона правил примерно за 3 часа.
Испытания на максимальное значение получили следующий результат: 1 170 007 объектов – переменных, 3 510 015 правил и время решения 12 239 183 милисекунды, что примерно равно 200 минутам. Для сравнения приведем следующие оценки: система управления атомными станциями оперирует всего 20 000 правил; описание всей программы средней школы и технического ВУЗа потребует около 300 правил на каждую научную область и в сумме не превысит 100 000 правил. Напомним, что продукции и предикатные системы не могли работать и с сотней правил.
Рисунок 4 – Результаты экспериментов на MacBook
Коботаевым Н.С. была создана многопоточная версия УДАВ на языке C++ и с MPI для систем с распределенной памятью. На рисунке 5 приведены результаты при суммарном количестве процессов N=8, NS = 3, NC=4, C = 3. Время выполнения задач прямо пропорционально количеству правил.
Рисунок 5 – Результаты экспериментов на MPI
Эксперименты проведены на 15 компьютерах. Для каждого значения количества объектов проводилось более 10 однотипных испытания в примерно одинаковых условиях. Расчеты показали, что ошибка измерения времени работы программы не превышала 3 %. Все проведенные эксперименты подтвердили линейную вычислительную сложность логического вывода и/или автоматического конструирования алгоритмов на основе миваров.
Миварный подход не отвергает существующие научные достижения и различные модели, а позволяет объединить их в единую систему для достижения принципиально новых возможностей по обработке и накоплению информации. Современные "технические средства" в виде ГРИД и облачных вычислений позволяют проводить параллельную обработку и решать требуемые задачи с одновременным использованием различных моделей и программных комплексов. Миварный подход позволяет параллельно решать эти задачи, объединять полученные результаты и обеспечивает реальное время логической обработки и автоматического конструирования алгоритмов в сложных случаях.
4. Этапы обработки информации
Выделяют три основных этапа миварной обработки информации:
1) формирование миварной матрицы описания предметной области;
2) работа с матрицей и конструирование алгоритма решения заданной задачи;
3) по полученному алгоритму выполнение всех вычислений и нахождение ответа.
Первый этап – формирование матрицы является по существу этапом синтеза концептуальной модели предметной области и ее формализации в виде продукционных правил с переходом к миварным сетям формата:
«входные объекты => правила+процедуры => выходные объекты».
В настоящее время именно этот этап является наиболее сложным и требует участия человека-специалиста для создания миварной модели предметной области. С точки зрения обучения важно, что на основе второго этапа УДАВ выполняет "объяснения" для обучаемого, показывает и обосновывает ход решения. Преимущества миварного подхода: 1) скорость: линейная вычислительная сложность и реальное время; 2) универсальность: решение логических и вычислительных задач; 3) эволюция: адаптивное описание и непрерывное решение задач; 4) управление потоком входных данных и оперативная диагностика; 5) активная работа с запросами или уточнениями входных данных на эволюционной сети правил и объектов (обучение).
Рассмотрим этапы миварной обработки на практическом примере. Решение задач треугольников в области геометрии является хорошим тестовым примером для экспертных систем с логическим выводом. Считается, что логический вывод это полно-переборная задача с факториальной вычислительной сложностью, которая зависит от количества правил. Область "Геометрия. Треугольники" хорошо изучена и описана в учебниках. В нашем случае мы взяли 39 объектов-переменных (углы, стороны, высоты и т.д.), которые описываются 177 правилами – зависимостями одних объектов от других. Решение задач состоит в том, что по заданному набору входных параметров ("дано") надо найти выходные параметры ("найти"). Ученику известны все уравнения и зависимости в этой области. Тогда под каждую "задачу" надо составить алгоритм ее решения, затем вычислить и получить из "дано" требуемые "найти". Известно 2 метода решения: 1) логическим выводом строить алгоритмы и 2) сформировать матрицу всех алгоритмов для любых наборов "дано" и "найти". В первом случае вычислительная сложность определяется количеством правил, т.е. 177! (факториал). Для второго случая под каждый набор входных и выходных данных требуется до 39! строк матрицы. Оба варианта не осуществимы на практике. Есть третий вариант: миварные сети, которые управляются потоком входных данных и могут автоматически конструировать алгоритмы с линейной вычислительной сложностью логического вывода. Носов А.В. реализовал миварный метод в программе "УДАВ", которая решает все задачи для 39 объектов и 177 правил в реальном времени.
На основе опроса преподавателей средней школы был выявлен наиболее удобный интерфейс проекта, показанный на рисунках 6-10 сначала задают "дано" и "найти", затем программа формирует (автоматически конструирует) алгоритм решения, вычисляет переменные и рисует алгоритм решения задачи. На рисунке 6 показано задание исходных данных цифрами в столбце "значение" и выделение "галочками" требуемых значений в столбце "найти". В нашем примере заданы 3 высоты – строки Р15, Р16 и Р17, а найти надо параметры в строках: Р1 (угол А), Р4 (сторона А), Р24 (площадь треугольника), Р25 (расстояние от точки пересечения медианой стороны а до точки пересечения медиан Ма0) и Р39 (расстояние от точки пересечения медиан до стороны С). На рисунке 7 показаны результаты работы программы по решению заданной задачи: все полученные значения показаны в столбце "значение". Далее, на рисунках 8, 9 и 10 показаны результаты работы программы по автоматическому конструированию алгоритма решения заданной задачи: в окне "Графический вывод работы логики" показан алгоритм решения задачи, который разбит на 3 фрагмента. На рисунке 8 показаны результаты работы программы по решению заданной задачи: в окне "Графический вывод работы логики" показан алгоритм решения задачи – фрагмент номер 1 (начало алгоритма). На рисунке 9 показаны результаты работы программы по решению заданной задачи: в окне "Графический вывод работы логики" показан алгоритм решения задачи – фрагмент номер 2 (середина алгоритма). На рисунке 10 показаны результаты работы программы по решению заданной задачи: в окне "Графический вывод работы логики" показан алгоритм решения задачи – фрагмент номер 3 (конец алгоритма).
Практическая польза: преподаватель может готовить индивидуальные задания и проверять контрольные задания, а ученики сами получают объяснения в программе. Таким образом, Миварная экспертная система "УДАВ. Геометрия" в реальном времени решает все задачи для 39 объектов и 177 правил, что помогает и учителям, и ученикам.
Рисунок 6 – Задание исходных данных цифрами в столбце «значение» и выделение «галочками» требуемых значений в столбце «найти»
Рисунок 7 – Результаты работы программы по решению заданной задачи: все полученные значения показаны в столбце «значение»
Рисунок 8 – Результаты работы (начало алгоритма)
Рисунок 9 – Результаты работы (середина алгоритма)
Рисунок 10 – Результаты работы (конец алгоритма)
На основе миварных технологий реализуются инновационные проекты [Варламов, 2011], [Мивар, 2011]. На Конкурсе русских инноваций наши проекты принимают участие в номинациях «Белая книга», «Перспективный проект» и «Инновационный проект». Наши проекты в области создания искусственного интеллекта, разработки миварной информационной инфраструктуры российской электроэнергетики и другие доходили до Второго тура и становились финалистами Конкурса русских инноваций в разные годы.
Внимание! Это не конец книги.
Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?