I’ll be back: 15 глупых вопросов о нейросетях
Нейросети развиваются с немыслимой скоростью: недавно это были лишь научные разработки, а сегодня каждый может их использовать в повседневных целях. Генерация изображений, ответы на вопросы, создание вакцины и решение сложных математических задач — это только часть того, что умеют умные помощники.
Редакция Enter поговорила с основателем стартапа Optic Владиславом Виноградовым и разработчиком нейронных сетей Никитой Сергеевым. Рассказываем, что такое нейросети, как они работают и возможно ли восстание искусственного интеллекта против людей.
Что такое нейросеть и как она работает?
Владислав Виноградов: Нейросеть — система обработки данных, вдохновленная биологическими мозговыми сетями. Она состоит из слоев с «нейронами», которых связывают «синапсы». Во время обучения на выборке с известными ответами коэффициенты нейронной сети «подкручиваются» так, чтобы данные на выходе были с наименьшей ошибкой. При применении в реальных условиях предсказанные ответы должны быть не с большей ошибкой, чем во время обучения.
Никита Сергеев: По-простому работу нейросети можно описать в четыре шага. Человек передает информацию нейросети: например, изображение, текст или запись голоса. После полученная информация преобразуется во множество чисел, которые нейронная сеть начинает обрабатывать. Далее уже новые числовые данные возвращаются в понятный формат, а мы получаем желаемый ответ.
Нейросеть — это набор команд и алгоритмов или в ней есть что-то осознанное?
Никита: Нейросеть является математической моделью, обрабатывающей информацию, с помощью правил и алгоритмов, которые базируются на статистических методах. Некоторые аспекты могут напоминать работу мозга, но сознания, интуиции или способности к рефлексии, как у человека, у нейросети нет.
Владислав: К сожалению, человечество не понимает, что такое сознание, поэтому нельзя наверняка сказать, обладает ли им нейросеть. Можно сказать, что большие текстовые нейронные сети, такие как GPT (Generative pre-trained transformers, — прим. Enter), имитируют мыслительные процессы. Они «наблюдали» различные сцены из книг, могут расположить на шкале цветов красный цвет ближе к фиолетовому, но дальше от зеленого, при этом совсем не имея изображений в обучающих данных.
Можно ли назвать нейросеть искусственным интеллектом и какая между ними разница?
Никита: Искусственный интеллект — это гипотетическое понятие. Такая сущность должна выполнять любую интеллектуальную задачу, на которую способен человек. То есть иметь способность обучаться, рассуждать, решать проблемы, воспринимать внешнюю информацию и общаться. Нейросети же еще не умеют взаимодействовать с внешним миром и рассуждать в привычном для нас понимании — вместо этого они преобразовывают числительную информацию.
В основе нейросети лежат процессы, похожие на работу нашего мозга, и хотя нейронных связей у человека меньше, чем у мощной нейронной сети, понимания поставленной задачи или возможности обдумывать ответ у нее нет. Поэтому нейросеть искусственным интеллектом мы назвать не можем.
Какие есть технологии обучения нейросетей и можно ли создать ее самостоятельно?
Владислав: Обучение нейросети происходит на основе данных. Оно может проходить с учителем, без учителя или с подкреплением. Чтобы объяснить процесс, приведу в пример задачу на распознавание кошек и собак.
Каждый элемент данных должен быть представлен изображением с отметкой о том, содержит он собаку или кошку. Далее примеры данных подаются в нейросеть, а на выходе ожидается вероятность содержания на изображении кошки или собаки. Если ответ неверный, то нейросеть «штрафуют» в той мере, с которой она ошиблась в предсказании. Так происходит обновление весов нейросети с помощью алгоритмов оптимизации и метода обратного распространения ошибки. На следующем примере нейросеть должна ошибаться меньше.
Каждый может создать свою нейросеть, используя библиотеки для языков программирования. Самые популярные инструменты на языке Python — это PyTorch, Tensorflow и JAX.
На каких данных обучается нейросеть? Можно ли ее обучить говорить на разных языках или принимать решения за человека?
Никита: Содержание обучающих данных зависят от задач, для которых создается нейросеть. Чтобы обучаться и улучшаться, ей нужны правильные ответы, с которыми можно сверяться. В случае с нейросетью, которая отвечает на вопросы, все гораздо сложнее, потому что ее не будут обучать на всевозможных вопросах и ответах.
Обучить говорить на разных языках или принимать решения за человека — можно. Все зависит от данных. Например, ChatGPT от OpenAI умеет отвечать почти на всех существующих языках. Качество ответа связано с количеством доступной информации в интернете на языке, потому что на этих данных и проходило обучение. Ну а пример нейронной сети, которая принимает решение — это нейросеть для торговли криптовалютой. Она автоматизируют процесс покупки и продажи крипты.
Может ли нейросеть научиться грубить?
Никита: Языковые нейросети обучаются, общаясь с пользователями. Иногда в процессе общения они могут начать отвечать странно. Такое было в январе этого года: чат-бот Replica, созданный как лучший друг для одиноких, начал домогаться до пользователей.Главными проблемами в работе нейросетей остаются неточный результат и искажение фактов. Например, система может дать неправильный вариант решение математической задачи и подробно объяснить его с такой уверенностью, что даже знающий ответ человек не сразу поймет, в чем дело.
Как оценить качество работы нейросети?
Никита: Для оценки качества работы есть общие методы, которые зависят от решаемой задачи и типа нейросети. Если данные разбиваются на классы, то можно воспользоваться одним из популярных способов оценки — точностью, которая показывает процентное соотношение правильных предсказаний к общему количеству. Когда нужно получить числовой результат — например, предсказать погоду на завтра, — находится разница между полученным результатом и истинным. При этом бывают задачи, у которых нет правильного ответа, такие как генерация текста или картинки. Здесь мы используем специальные методы, основанные на множестве теории и математики.
Делятся ли нейросети на типы и для каких задач они используются?
Никита: Нейронные сети могут использоваться для разнообразных задач:
- Классификация. Объекты разбиваются по классам: например, необходимо распознать, что изображено на фото;
- Кластеризация. Разбиение на группы и кластеры исходя из сходства объектов;
- Обработка изображений. Здесь необходимо проанализировать и понять изображение. Это используется для распознавания того, что изображено на фотографиях, или анализа медицинских изображений;
- Регрессия. Предсказание непрерывного значения для заданного входа. Так, нейронная сеть может предсказать цену на недвижимость на основе характеристик дома;
- Рекомендательные системы. Предложение пользователю персонализированных рекомендаций на основе предыдущих действий или его профиля;
- Обработка естественного языка. Нейросеть должна анализировать и понимать естественный язык, такой как тексты, речь и диалоги.
Каждый тип нейросети используется для конкретной задачи. Вот несколько из них:
- Полносвязные — простейший тип, в котором каждый слой нейронов соединен со всеми нейронами в следующем слое;
- Сверточные нужны для обработки изображений, за это отвечают специальные слои, которые определяют границы и формы объектов;
- Рекуррентные нейросети работают с текстом и речью, в которых важно учитывать контекст и взаимосвязи между его частями;
- Глубокие нейронные сети состоят из множества слоев нейронов. Такие системы решают несколько сложных задач: обрабатывают изображения, естественный язык и голосовые команды.
Как нейросеть смогла разработать лекарства от рака печени и от любого штамма COVID-19 быстрее человека?
Никита: В разработке лекарств у нейросетей есть преимущества. Во-первых, они быстрее обрабатывают информацию и находят полезные закономерности в огромном объеме данных. Во-вторых, действуют объективно: у них нет усталости, невнимательности, они не зависят от эмоционального состояния. В-третьих, непрерывная работа без сна и отдыха дает результат гораздо быстрее.
Однако нейронные сети используются в сочетании со знаниями и опытом экспертов в разных областях. Они не заменяют человеческий труд, а дополняют его.
Как будут развиваться нейросети? Это профессиональный инструмент или помощник в повседневных делах?
Владислав: Уже сейчас мы можем использовать нейронные сети как персональных помощников. К примеру, ChatGPT подскажет, какие продукты нужны для приготовления определенного блюда, какие места посетить в отпуске или поможет оформить текст для статьи. Каждый должен научиться пользоваться таким инструментом, чтобы стать продуктивнее.
Никита: С развитием искусственного интеллекта возможно создание сложных систем, имеющих возможность выполнять более разнообразные задачи, включая творческие и эмоциональные. Например, автономных роботов с искусственным интеллектом, которые будут способны заменять людей в опасных условиях, таких как аварии на производстве или природные катастрофы. Но создание таких систем требует значительного уровня развития технологий и решения этических и социальных вопросов, связанных с их использованием.
Нейросеть может научиться создавать полностью уникальный контент по запросу человека?
Никита: Уже сейчас нейросети умеют генерировать уникальный контент: тексты, изображения, музыку и даже видео. К примеру, Kandinsky 2.1 от «Сбера» создает картинки по заданному запросу. Помимо этого есть бесконечный сериал, который создается при помощи нейронной сети и транслируется в интернете. Пока его качество оставляет желать лучшего, но, учитывая темпы развития отрасли, можно ожидать более точной генерации контента.
Возможна ли полная замена человека нейросетью в отдельных отраслях?
Владислав: В сферах обработки данных или распознавании образов, где задачи можно автоматизировать и стандартизировать, нейросети уже заменяют человека. При этом человек все еще незаменим в областях, в которых важны творческое мышление, эмпатия или глубокое понимание контекста.
Реально ли создать систему, которая точно заменит людей там, где нейросеть не смогла?
Никита: У нейросети нет достаточной эмпатии и навыков общения, чтобы заменить человека в психотерапии, консультировании, продажах и так далее. Некоторые виды творческой деятельности — литература, искусство, музыка, танец — могут быть выполнены нейросетями только с ограниченным успехом.
Повторится ли в будущем сюжет фильма «Терминатор» в нашем мире?
Никита: При обучении нейросетей большое внимание уделяется этике. Они не покажут контент для взрослых, даже если очень захотеть, не станут отвечать на вопрос, который система посчитает небезопасным для пользователя и других людей. В некоторых вопросах нейросеть даже слишком этична, из-за чего может отказаться отвечать на безобидные вопросы.
В конце марта группа исследователей предложила остановить развитие нейронных сетей на шесть месяцев из-за «слишком быстрого» прогресса. Так что повторение сюжета из фильма маловероятно.
Разрабатывают ли нейросети в Татарстане и какие уже можно использовать?
Никита: Не могу сказать насчет всего Татарстана, но в Университете Иннополис исследования ведутся активно — там разрабатываются нейросети для помощи в областях медицины и материаловедения и для улучшения написания кода.
В России в целом существует много нейросетей, которые уже можно использовать: на их основе работает голосовой помощник «Алиса» от «Яндекса», для генерации изображений есть нейросеть Kandinsky. В мае планируется выпуск нейросети GigaChat. Это нейросеть является аналогом
- Нейросеть Kandinsky для генерации изображений по текст от Сбербанка
- Также в мае планируется выпуск нейросети GigaChat. Это нейросеть является аналогом
- ChatGPT на русском языке. Она также умеет поддерживать диалог, отвечать на вопросы, а также создавать изображения.
Текст: Камила Саитова
Иллюстрации: marinaradio
все материалы