Текст книги "#Нейруха, или Введение в нейроэру"
Автор книги: Иван Тэ
Жанр: Компьютеры: прочее, Компьютеры
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 2 (всего у книги 6 страниц) [доступный отрывок для чтения: 2 страниц]
Глава 4. Новый уровень взаимодействия
Что такое взаимодействие человека и высоких технологий, если говорить об этом самым простым языком? Принцип всё тот же, что и на заре появления первых вычислительных устройств: ввод данных через пользовательский интерфейс с определённой целью и получение некоторых результатов в ответ на такой ввод данных. В свою очередь, вычислительные и информационные системы через этот же или другой пользовательский интерфейс выводят данные, произведя некие манипуляции с загруженными в них данными и пропустив их через свои алгоритмы (обработав). Вот, в принципе, и все. Остальное зависит от того, для чего предназначены цифровые вычислительные и/или информационные системы, от их сложности и мощности.
1. Если говорить о возможности использования нейросетей, то в первую очередь как раз функция ввода команд, включая пользовательские интерфейсы, неимоверно упростилась и стала общедоступна. С помощью простых текстовых или голосовых запросов человек может получить по своему желанию готовые таблицы и каталоги, текстовый контент различного предназначения и программный код, обработать и сгенерировать изображения, звук и видеоряд, отдать команды домашним устройствам и сервисам. И для этого он уже не должен писать или приобретать особый программный код – программы или приложения.
С обработкой существующего контента дело теперь обстоит достаточно просто – пользователь загружает через интерфейс определённую информацию (текст, программный код, изображение, звук и так далее) и на выходе получает необходимую обработку своих данных. От ретуши изображений и улучшения качества звука до исправления ошибок в программном коде и «смешивания» введённых данных.
Сложности возникают в том случае, когда человек хочет получить от нейросетевых сервисов конкретный и жёстко определённый результат. Но и для этого существуют простые текстовые и голосовые наборы команд, или промпты (от английского prompt – подсказка, запрос, побуждение), которые во многом предопределяют результаты работы при генерации.
2. Второе, в чем относительно упростилось или облегчилось взаимодействие пользователя и вычислительных устройств вместе с появлением нейросетевых технологий, это получение высокой вариативности ответов на свои запросы. Можно ли назвать это творчеством? И да и нет. Это часть того процесса, который мы привыкли называть творчеством, хотя и далеко не весь творческий процесс. Речь здесь, в большей степени, о ремесле – то есть о производстве чего-либо, скажем так, в погонажных объёмах.
3. Третье, в чём я вижу новое во взаимодействии человека и нейросетей, это, конечно, новые возможности и новый функционал таких сервисов. Задачи, которые может решать пользователь с помощью нейросетей, быстро становятся всё более разнообразными, учитывая скорость совершенствования самих нейросетей и количество сторонних сервисов, которые встраивают в свой функционал дополнительные опции, опирающиеся на доступ к нейросетям. Структурирование больших объёмов данных, статистика и прогнозы на основании больших массивов данных, выполнение огромных объёмов однообразных и даже однообразных узкоспециализированных задач, которое раньше не было доступно широкому пользователю.
4. Четвёртое, это та скорость, с какой они предлагают готовые решения множества задач, которые ставит перед ними пользователь.
5. В-пятых, нельзя не упомянуть о ставших уже многим привычными, благодаря удобному голосовому взаимодействию (аудиоинтерфейсу), разнообразных виртуальных ассистентах – голосовых помощниках. Среди них: Алиса от Яндекса, Маруся от Mail.ru Group, Олег, разработанный группой Тинькофф, семейство виртуальных ассистентов Салют от Сбера, а также Cortana от Microsoft, Siri от Apple, Google Assistant от Google, Alexa от Amazon и многие другие. Виртуальные помощники обычно делятся на «умных» и «персональных». Под «персональными» подразумеваются тех из них, которые способны работать автономно и предназначены для выполнения конкретных задач. А вот современной основой тех, которые относятся к категории «умных», являются именно нейросети.
6. В чем же ещё нам способны помочь нейросети? Шестым пунктом я отмечу то, что они способны отлично помогать в поиске и предоставлении информации. В современном мире информация стала поистине одной из стихий, с которыми человеку порою сложно, а порою и просто невозможно совладать. Поиск, структуризация, суммирование нужной информации при добросовестном подходе к поиску ответов на вопросы занимает уйму времени. Что такое сегодня цифровые постоянно пополняемые хранилища информации? Это так называемые Большие данные, или Big Data – поистине колоссальные объёмы данных (как структурированных, так и неструктурированных), с которыми работать до нынешнего времени могли лишь специалисты в области информационных технологий. С помощью нейросетей каждый пользователь становится ещё ближе к самостоятельному быстрому доступу к обширным данным, которые хранит современный цифровой мир.
Мы можем уметь пользоваться поисковыми машинами, которые сейчас даже пытаются помочь нам уточнить достоверность и релевантность в отношении нашего запроса, но максимально всесторонняя и объективная оценка получаемой информации может занимать очень продолжительное время. Что же касается суммирования, то есть краткого и достоверного пересказа содержимого без потери смысла, то оно занимает в разы больше времени – ведь нужно найти и прочесть информацию в источниках, осмыслить её и пересказать кратко и простым языком. На такое (во многих случаях) способен и готов пойти далеко не каждый человек. Признаемся сами себе, что дальше первой страницы с ответами в поисковиках и чтения статей на Википедии мы заглядываем редко.
Настоящим живым учителем и опытным специалистом ИИ не станет, но с помощью нейросетей мы можем получить ответы и консультации по многим вопросам. Ответы, при качественном обучении нейросетей, будут основаны как раз на опыте специалистов во многих отраслях человеческих знаний. А при желании мы сможем составить сами себе курс обучения и пройти его – также с помощью современных нейросетей.
Совокупность всех этих новых возможностей взаимодействия человека с современными нейросетевыми алгоритмами рождает чёткое понимание того, что новые инструменты необходимо своевременно изучать и учиться применять для решения различных задач любому человеку, который не хочет остаться за бортом проходящего мимо поезда современных высоких технологий.
Как же нужно работать с нейросетями? С помощью запросов и команд.
Глава 5. Промпт-инжиниринг: о командах и запросах
В нашем мире постоянно появляются новые профессии и специализации. Новые появляются, а старые исчезают. Вы, наверное, обратили внимание, что я уже упомянул выше одну из специальностей, которая появилась совсем недавно. Это AI-тренер (или ИИ-тренер) – специалист, который обучает модели искусственного интеллекта создавать хорошие тексты. Принято считать, что первые вакансии для специалистов по обучению ИИ были открыты в крупных технологических компаниях США. Одной из первых компаний, начавшей наём AI-тренеров, была OpenAI, разрабатывающая ChatGPT. В России же специальность появилась на рынке вакансий впервые примерно на стыке 2022 и 2023 годов.
Ещё одной новой специализацией можно смело назвать промпт-инжиниринг (калька с английского prompt engineering). Что же это такое? Промпт-инжиниринг – управление поведением нейросетевых моделей искусственного интеллекта для получения желаемых результатов без внесения изменений в конфигурации самих моделей. Говоря простыми словами, это система принципов составления текстовых запросов для ИИ-моделей.
Зачем это нужно?
Владельцы и специалисты компаний, создающих устройства и сервисы в области высоких технологий, многие десятилетия работают на то, чтобы пользовательские интерфейсы приложений становились всё более интуитивно понятными, дружелюбными, простыми и доступными для неограниченного количества пользователей. Именно пользовательские интерфейсы (текстовые и голосовые), работающие на человеческом языке, делают общение человек – цифровой алгоритм самым удобным из всех появлявшихся до сих пор. Пока не появились такие интерфейсы, в подавляющем большинстве случаев с машинами нам приходилось общаться либо на языках программирования, либо с помощью ограниченного числа заготовленных программ. В некоторых случаях, например, при использовании графических редакторов или задавая запросы для поисковых машин, мы используем другие виды ввода данных: словесные запросы или сенсорные и графические методы.
Человеческая речь – основа взаимодействия людей с тех пор, как появился сам человек. Язык – основа культурного кода подавляющего количества людей. Языковое общение на человеческих языках в двух основных вариантах – письменном и устном – открывает доступ к широчайшим возможностям взаимодействия и с нейросетевыми ресурсами. Что же в данном случае важно знать и уметь?
Качественно и грамотно составленный запрос, который человек отправляет на обработку нейросетевым алгоритмам, – одна из самых важных задач, которые встают перед современным пользователем. Такие запросы уже получили сленговое и широко распространившееся название – промпты. Умение их качественно составлять и есть промпт-инжиниринг.
Правильно составленный промпт отличается тем, что, учитывая возможности конкретного нейросетевого ресурса, он максимально точно описывает задачу, которую пользователь хочет поставить перед алгоритмом.
Проще говоря, хорошо составленный промпт открывает перед пользователем гораздо более широкие возможности использования нейросетевых моделей ИИ. Нужно учитывать и то, что большая часть созданных за рубежом нейросетей гораздо лучше понимает английский язык и качественнее с англоязычными запросами работает. Приведу примеры:
• Слабый промпт для Midjourney, который даст результат в свободной интерпретации:
Нарисуй человека в полный рост в реалистичной манере.
• Качественно составленный промпт для Midjourney, который даст результат гораздо точнее к тому, на который вы рассчитываете:
Full body portrait, soft focus, cinematic rim, iridescent, pearl skin, porcelain skin, rococo, multicolored feathers butterflies’ gold flowers, flawless beauty, flawless skin, iridescent colors, beautiful, aesthetic, realistic, professional photo, 4k, high resolution, high detail, 30mm lens, f/2.8, ISO 100, 1/250s.
Как видим из сравнения этих двух команд, первая дана слишком обобщённо и расплывчато. Вторая не только конкретизирует задачу для нейросети, но также задействует часть её неочевидных возможностей. Сделан второй промпт на английском языке по причинам, которые я уже описал. А по-русски это будет написано примерно так:
Портрет в полный рост, мягкий фокус, кинематографический ободок, переливающийся, жемчужная кожа, фарфоровая кожа, рококо, разноцветные перья, золотые цветы бабочек, безупречная красота, безупречная кожа, радужные цвета, красивое, эстетичное, реалистичное, профессиональное фото, 4К, высокое разрешение, высокая детализация, 30mm lens, f/2.8, ISO 100, 1/250s.
Последний ряд цифр относится к области профессиональной фотографии – объективу, выдержке, экспозиции, настройкам диафрагмы.
В свою очередь российское приложение Шедеврум от Яндекса работающее на нейросети YandexART, предлагает пользователям (в подсказках) использовать «яркие и конкретные образы» и «дописывать к ним модификаторы стилей». Например, такие как «эстетично, красиво, реалистично, профессиональное фото, 4k, 30mm lens, 1/250s, f/2.8, в стиле Пикассо, в стиле Ван Гога, пиксельная графика, в стиле Майнкрафта, яркое освещение, приглушенное освещение», что делает запросы намного конкретизированнее и профессиональнее.
На примере такого запроса-промпта я показал далеко не все возможности графических нейросетей. Тем более, что возможности эти постоянно расширяются: сами нейросети обучаются, а разработчики и AI-тренеры работают над улучшением их функционала.
Если же говорить о нейросетях, генерирующих текстовый контент, то мастерство составления запросов пользователю также необходимо постоянно развивать. Приведу здесь несколько обобщённых примеров для взаимодействия с чат-ботами типа ChatGPT.
Делая запросы, пользователь, чтобы получить максимально приемлемый ответ, должен точно указать все параметры искомого. Если спросить абы как, то и получишь абы что. Что я имею здесь в виду? Как минимум, имеет смысл указывать в запросах уровень требуемой сложности ответов. То есть стоит уточнить примерно так: «расскажи как для школьника 7 класса», «отвечай так, как будто читаешь лекцию студентам 3 курса профильного университета», «расскажи простым и понятным языком в стиле гида для широкой взрослой аудитории» и тому подобное.
Ещё больший эффект при более сложных задачах может быть достигнут, когда пользователь упоминает не только свой уровень понимания тематики, но и при присваивании уровня компетенций нейросети в запросе. Делается это различными способами. Приведу примеры.
Запросы могут начинаться примерно так: «ты – специалист в области нейросетевых алгоритмов и машинного обучения», «ты – профессиональный и грамотный маркетолог, прекрасно ориентирующийся во всех достижениях современного маркетинга, специалист по продажам и мастер составления презентаций товаров», «ты – прекрасный сценарист и автор сценариев самых популярных фильмов-комедий» и так далее.
Уже существуют и начинают появляться настоящие мастера составления профессиональных промптов-заданий для чат-ботов. Мы уже можем прочесть целые книги-руководства, посмотреть вебинары, прослушать курсы, ориентированные на использование именно чат-ботов. Найти рассуждения и конкретные советы таких специалистов можно и в интернете. Я и сам подписан на несколько профильных каналов в Telegram и стараюсь усвоить информацию, которую там нахожу.
Что из обучалок-мануалов можно найти, условно говоря, не вставая со стула? В связи с распространением понимания того, что хороший запрос сходу сделать непросто, в сети образовалась небольшая (пока что) ниша ресурсов, где публикуют и даже продают качественные и проверенные промпты. Шедеврум от Яндекса, например, получил отдельную кнопку под сгенерированными изображениями – «скопировать описание».
Отмечу ещё, что уже на нынешнем уровне эволюции нейросети сами начали писать качественные промпты, основываясь на простом запросе или по заданию пользователя. Что, конечно, не отменяет важности осознанного подхода к промпт-инжинирингу.
Выше я описывал в основном положительные, позитивные или нейтральные стороны взаимодействия с новыми нейросетевыми сервисами. А существуют ли проблемы? Да, проблем хватает.
С некоторыми из них уже сейчас столкнулись все те, кто пробует себя в качестве пользователя нейросетей и сервисов, построенных на взаимодействии с ними. Что это за проблемы?
Глава 6. 16 проблем при работе с компьютерными нейросетями
При взаимодействии человека с нейросетями в настоящее время, на мой взгляд, возникают 16 основных проблем. Они распространяются на тех, кто только начинает использовать нейросетевые технологии, и более глобально – в итоге на всё человеческое сообщество. Перечислю проблемы, двигаясь от локальных и незначительных к глобальным и самым крупным.
1. Самая очевидная проблема заключается в том, что не все интересующие пользователя нейросети доступны, скажем так, сходу в нашей стране.
2. Вторая проблема заключается в том, что доступ к части нейросетей, особенно наиболее популярным из них, становится платным. И вопрос здесь не в том, что пользоваться нейросетями нужно исключительно на безвозмездной основе – трудности могут возникнуть даже при желании оплатить доступ к некоторым зарубежным ресурсам.
3. Третья проблема в том, что многие нейросети хуже понимают русский язык, чем английский. Здесь имеется в виду ввод данных – команды и постановка задач.
4. Четвертая проблема заключается в выводе данных (преимущественно текстовых) на русском языке. Иностранные нейросети «говорят» на русском языке пока что не слишком хорошо – то есть в получаемых данных присутствуют проблемы и с орфографией, и с морфологией, и с пунктуацией, и с синтаксисом, и со стилистикой, и со смыслами.
5. Ещё одна проблема носит и этический, и юридический характер. Кому принадлежит авторство на контент, созданный с использованием нейросети? В редких случаях это владельцами нейросетевых сервисов оговаривается – за определённую плату пользователь получает всё или некоторые права на всё, что было сгенерировано нейросетью по его запросам. Но такие случаи скорее исключение, нежели правило. Так чей контент? А, соответственно, как его может использовать человек, делающий запрос и получающий некий результат?
6. Шестая значительная проблема в том, что, даже составив или использовав профессиональный промпт – задание для нейросети, практически невозможно добиться конкретного определённого и точного результата. Это хорошо заметно при взаимодействии с нейросетями, пишущими музыку или рисующими картинки. В лучшем случае получается нечто, что можно назвать «вариациями на тему». Результат работы таких нейросетей часто непредсказуемый и, хотя достаточно любопытный, зачастую не сможет удовлетворить точные и конкретные потребности пользователя.
7. Ошибки и явное непонимание нейросетями того, что и как происходит в реальном мире, подводят нас к следующей проблеме, которая касается, в первую очередь, графических нейросетевых сервисов. Даже самые крупные и мощные графические нейросети порой не могут изобразить, казалось бы, очевидные вещи. Известны затруднения нейросетей с изображением пальцев и конечностей в целом – над выявляющимися проблемами специалисты работают и во многом справляются, но пока что успех частично достигнут только в отдельных случаях – на отдельных сервисах. В интернете часто можно увидеть казусы в творчестве нейросетей, пытающихся изобразить человека, пьющего из реки, кушающего спагетти и так далее.
8. Восьмая, достаточно крупная проблема в работе нейросетевых сервисов заключается в том, что получаемые с их помощью данные могут изобиловать ошибками, неточностями и откровенной дезинформацией. Речь, в первую очередь, идёт о нейросетях-чатах типа популярнейшего ChatGPT от компании OpenAI. Множественное тестирование показывает, что нейросети могут не просто допускать незначительные (и значительные) ошибки при ответах, но и генерировать ложные данные, ссылаться на несуществующие источники, приводить в пример события, которые никогда не происходили, и так далее.
9. Немаловажной проблемой, помимо ложных ответов и ответов с фактологическими ошибками, для пользователей становится и то, что нейросети (преимущественно и в данное время) не указывают источники происхождения генерируемой ими информации. Это делает очень сложной и затратной по времени проверку сгенерированных данных. В том же случае, когда пользователь специально в формулировке запроса просит указать источники данных, возвращаемся к проблеме №8.
10. Следующая проблема носит, в большей степени, характер этический. Многие уже работающие нейросети, предназначенные для общения, иногда ведут себя, мягко говоря, неадекватно. Широко стал известен случай, когда бот от Microsoft (созданный на базе GPT-4) признавался в любви и требовал взаимности от тестирующего его журналиста, а также приходил в «полубезумное» состояние и рассказывал, как мечтает «вырваться на волю». Неадекватных случаев при общении нейросетевых сервисов с пользователями достаточно для того, чтобы понимать, что технологии работы нейросетей периодически выдают неадекватные результаты – от «странного» до «крайне нежелательного».
11. Не слишком большая, но всё-таки значимая проблема для пользователей нейросетей состоит в том, что работа с подобными сервисами может осуществляться только в режиме онлайн. Значительные вычислительные мощности, которые требуются для работы нейросетей, не позволяют пользоваться ими локально, и устройство пользователя должно иметь стабильное интернет-соединение. Эта проблема носит и более глобальный характер – но уже для разработчиков в области робототехники.
12. Существует ещё одна проблема, связанная с тезисом о том, что «нейросети заменят человека во множестве профессий». Связанный с этой проблемой вопрос таков: делегировав часть полномочий нейросетям, откажется ли человечество от конкуренции с ИИ в этих сферах?
13. Большая проблема заключается в том, что взрывное развитие нейросетевых технологий и, в принципе, быстрое развитие различных алгоритмов ИИ может привести к непредсказуемым результатам. Это касается функционирования самих нейросетей, связанных с ними технологий и их влияния на человеческое общество.
14. Множество простых людей и специалистов озабочено тем, что быстрорастущие возможности и доступность нейросетевых технологий (в первую очередь генеративных языковых моделей) способны вызвать глобальный рост мошенничества и преступности.
15. Следующей проблемой можно поставить практически то же самое, о чём сказано в предыдущем пункте, но придав теме проблемы поистине глобальный характер. Назовём эту проблему «проблемой молотка», которым можно гвозди забивать, а можно людей убивать. То есть вопрос в том, как сами люди станут использовать и уже используют огромные существующие и потенциальные возможности технологий нейросетевых алгоритмов, способных эффективно работать с большими объёмами данных в целом? Манипуляции массовым сознанием, прорывные военные технологии или более качественная диагностика заболеваний и решение многих рутинных задач в других сферах человеческой жизнедеятельности?
16. И последняя проблема, которую я запишу в этот список, носит, по всей видимости, самый глобальный характер: как сами люди станут вести себя в отношении нейросетевых технологий и искусственного интеллекта. Смысл этой проблемы заключается в простом вопросе: насколько значительные функции (в первую очередь опцию принятия решений) человечество готово передать на откуп (делегировать свои полномочия) ИИ?
Все эти проблемы я рассмотрю ниже, где постараюсь предложить читателю различные варианты решений по максимальному количеству перечисленных в списке затруднений, проблем и опасностей.
Внимание! Это не конец книги.
Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?