Чего ожидать от нейронных сетей в 2023 году?
Основное различие между классическим программным обеспечением и нейронными сетями заключается в том, что последние нужно «обучать». Именно благодаря этому они могут решать широкий спектр задач, таких как распознавание речи и создание изображений.
Нейронные сети представляют из себя очень актуальное направление, которое может автоматизировать многие бизнес-процессы в различных сферах, таких как медицина, маркетинг и производство. В данном обзоре мы рассмотрим основные тенденции и тренды в области нейронных сетей.
Нейронные сети находят применение в различных сферах жизни, особенно в тех, где требуется достичь уровня человеческой функциональности. В таких случаях отсутствует четкий алгоритм, который можно было бы реализовать с помощью скрипта. Входящая информация может быть разнообразной, поэтому нейронная сеть должна быть способна обработать любой возможный вариант.
В настоящее время крупные компании, учреждения здравоохранения и научные учреждения все больше используют нейронные сети. Однако создание эффективной технологии, способной функционировать в сложных условиях, требует мощного оборудования и большого объема информации. Поэтому не все компании могут позволить себе внедрение и использование нейронных сетей.
Основными задачами, решаемыми с помощью нейронных сетей, являются:
- Классификация. Нейронная сеть группирует объекты по конкретным классам, например, клиентов компании или аудитории по интересам. Также нейросети используются для фильтрации писем и рекламы. Эти примеры помогают понять, что такое задача классификации.
- Распознавание. Нейросети способны определить конкретный объект среди множества других, например, лицо на фотографии. Эта технология применяется в фильтрах для фотографий, поиске данных по фотографии, чтении текстовых файлов и т. д. Распознавание также является важной задачей в медицине, особенно в области диагностики.
- Прогнозирование. Нейросети получают информацию, на основе которой анализируют данные и делают прогнозы. Эта технология широко применяется в финансовом секторе и маркетинге, а также в поисковых системах. Программы с возможностью дописывать текст или дорисовывать картину также относятся к задачам прогнозирования.
- Генерация. С помощью нейронных сетей уже возможно создавать картины, музыку и решать другие сложные задачи. С каждым годом программы становятся умнее и способны выполнять все более сложные задачи.
Каждый год область применения нейронных сетей расширяется. Согласно докладу Allied Analytics, к 2023 году рыночный объем нейросетей достигнет 39 млрд. долларов, что почти в 6 раз превышает показатели 2016 года.
Биологические нейронные сети у людей представляют собой сложные взаимосвязи, которые обрабатывают информацию и помогают принимать решения. Технология нейросетей может выполнять аналогичные задачи, как и другие модели машинного обучения. Однако, основное отличие заключается в возможности программного обучения.
Одной из главных сложностей широкого распространения технологии является ее стоимость и процесс обучения, который требует больших объемов данных. Это позволяет нейросетям правильно анализировать и решать нужные задачи без прошлых ошибок. Алгоритм обучения нейросети включает несколько этапов:
- Предоставление обучающих данных, необходимых для выполнения задачи.
- Размер обучающих данных должен быть не менее десяти раз больше, чем объем нейронов.
- В процессе обучения машины используют числа и формулы вместо текста, чтобы научиться выполнять задачу.
Дальнейший этап работы с нейросетью — это преобразование данных, которые обрабатываются и передаются далее через математические формулы. Этот процесс можно сравнить с восприятием информации глазами человека, где нервный импульс передает сигнал в мозг для обработки и распознавания окружающего мира.
В случае с машинами, этот процесс осуществляется через математические коэффициенты. Далее информация обрабатывается и делаются выводы.
Нейросети применяются для аналитики, прогнозирования и определения объектов. Однако существует проблема «состязательной атаки», которая может привести к ложным результатам, когда нейронная сеть обманута. Ученые используют этот метод для проверки устойчивости нейросети к нестандартным ситуациям.
Разработчики и ученые отмечают несколько ключевых особенностей нейронных сетей, которые выходят за рамки их архитектуры и способа функционирования:
- Нейронные сети работают по автоматическим процессам и закрыты для понимания, как они принимают решения на основе изображений или текста. Главным фактором является правильная описанная структура и формула создателя. Аналогично человеку, никто не может точно определить, какие процессы происходят в мозгу при распознавании объектов. Однако любой может распознать кошку, независимо от породы, отсутствия шерсти или хвоста и других параметров. Нейронные сети работают по аналогии и автоматически принимают правильное решение на основе заданных параметров.
- Нейроны в нейронных сетях функционируют независимо друг от друга. Они получают данные от других нейронов, но внутри сети они не связаны. Если один из нейронов перестает работать, другие продолжат свою работу без нарушения общего процесса. Такая устойчивость присутствует и в биологических нейронных сетях. Главным недостатком такой независимости является то, что все решения сложные и иногда хаотичные, и предсказать их и оказать на них влияние почти невозможно.
- Независимость нейронов является ключевым фактором гибкости нейросетей, делая их более эффективными, чем другие виды машинного обучения. Архитектура нейросетей основана на принципах биологической нервной системы, таких как самообучение, способность адаптироваться к новым данным и игнорировать неважные детали. Благодаря этой гибкости, нейросети могут адаптироваться к широкому спектру обстоятельств и условий.
- Невозможно создать модель искусственного интеллекта, превосходящую человеческий мозг, поскольку мозг невозможно точно скопировать, а число нейронов в нем достигает 86 миллиардов. На данный момент не существует нейронной сети, которая могла бы приблизиться к этому количеству нейронов, поэтому даже современные разработки могут допускать ошибки, содержащие порядка 10 миллиардов нейронов.
При изучении возможных ошибок инновационных машин выделяются три основных фактора — забывчивость, переобучение и непредсказуемость. Эти проблемы также свойственны людям, поэтому возможно использование корректирующих методов для их решения.
Многие программы не могут адекватно реагировать на изменчивость ситуации, что приводит к забывчивости. Если ситуации постоянно меняются, искусственная нейросеть старается перестроиться под новое событие, что в результате приводит к снижению точности решений.
Нейросети позволяют машинам проводить качественный анализ входящей информации и устранять ошибки, связанные с человеческим фактором. Эксперты считают, что такие разработки должны облегчать жизнь людей, освобождая их от сложных и монотонных задач.
Однако, массовое и широкое использование этой инновации еще не наступило. На данный момент существует ряд трендов, которые могут привести к хорошей динамике в будущие пять лет.
GPT-3 на сегодняшний день считается самой продвинутой нейронной сетью на основе нейролингвистического программирования, которая способна создавать связные ответы на вопросы и общаться с людьми. Многие ожидают от искусственного интеллекта способности делать логические выводы, но на данный момент самые современные модели с большим объемом информации не могут понимать значения фраз или слов, которые они создают.
Обучение этих моделей требует большого количества данных и вычислений, что влечет за собой углеродный след. Еще одной проблемой является несовершенство данных, поскольку информация в сети часто искажена или манипулирована. В 2023 году перспективным направлением станет расширение области восприятия, включая возможность распознавать лица, изображения, отпечатки, голоса и звуки.
Ученые замечают, что искусственный интеллект пока не обладает достаточным уровнем эмоциональной составляющей и чувств, чтобы быть более близким к людям. Человек не только способен усвоить информацию и предложить решение, но и учитывать контекст, различные факторы и адаптироваться к изменяющейся среде.
Например, алгоритм AlphaGo от DeepMind может победить чемпиона мира в шахматах, но его стратегия не может выйти за пределы доски. Несмотря на продвинутые разработки, такие как GPT-3, нейросети должны продолжать развиваться. Главная задача ученых — создать мультимодальную систему, объединяющую сенсорное восприятие и распознавание текста для обработки данных и поиска решений.
Компания OpenAI недавно выпустила обновление для GPT-3, названное Codex, которое позволяет модели редактировать текст и вставлять его, а не только продолжать его. Такие модели могут ускорить работу редакторов.
Один из главных трендов на 2023 год — интеграция знаний об окружающем мире в языковые нейросети с помощью «Википедии» и аналогичных источников. Это позволит моделям использовать информацию не только из обучающих выборок, но и из фактологических источников при создании ответов. Примером такой модели является RETRO от DeepMind.
Модели, которые могут работать с текстом и картинками, стали очень популярными в 2021 году и эта тенденция продолжится и в 2023 году. К примеру, в 2022 году компания OpenAI представила сеть DaLL-E-2, которая может создавать реалистичные изображения фэнтези по небольшому текстовому описанию.
Качество изображений находится на максимально высоком уровне. Корпорация Google также представила свою модель Imagen сразу после OpenAI.
Такой тренд может оказаться полезным для цифровых дизайнеров и художников, так как они смогут быстро получать вдохновение и ускорять процесс создания уникальных картин.
Современные голосовые нейронные сети неотличимы от естественной речи и могут передавать интонацию и эмоции. Эта тенденция делает голосовых помощников более доступными в повседневной жизни. Такие программы уже широко используются в мобильных приложениях, умных технологиях и автомобилях, а также могут полноценно автоматизировать call-центры в B2B-сфере. Технология Text-To-Speech также может быть использована в медиа для создания аудиозаписей на основе текста.
Модель нейронной сети, которая способна распознавать объекты, лица и создавать изображения, становится все более популярной. Распознавание лиц уже много лет используется в видеонаблюдении, а нейросети успешно применяются в производственных процессах для определения объектов. Также нейронные сети помогают улучшить качество фотографий, сделанных на телефон.
В следующие 5-10 лет будут продолжать развиваться технологии метавселенных и виртуальной реальности, и нейронные сети окажутся необходимыми для создания 3D-персонажей с помощью компьютерного зрения, определения движений и мимики.
Компьютерное зрение нашло применение во многих сферах, в том числе в беспилотных аппаратах, где становится возможным замена водителей. Tesla — яркий пример автомобильного производителя, который достиг успеха в этой области. Успех распознавания лиц открывает возможности замены реальных продавцов на автоматизированные системы, как в случае с Amazon Go.
Технология также нашла свое применение в здравоохранении, где нейронные сети используются для анализа снимков МРТ и рентгенов, а также для поиска раковых опухолей. В косметологии эта модель используется для контроля состояния кожи и предоставления решений для борьбы со старением.
Использование компьютерного зрения на стройке будет продолжать расти и в 2023 году. Одной из причин этого является высокий уровень смертности на стройке по сравнению с другими отраслями. Статистика показывает, что количество смертей на стройке в 5 раз выше, чем на других рабочих местах.
Нейронные сети и машинное обучение могут помочь с этим, путем использования «умных» камер для обеспечения безопасности людей. Установка таких устройств на строительной площадке позволяет непрерывно транслировать видео на отдельные серверы. Этот видеопоток затем разбивается на кадры, после чего нейронные сети проводят анализ.
Эта технология может быстро обнаружить возгорание, определить нарушения использования защитной экипировки сотрудниками, обнаружить нарушения пропускного режима, отслеживать движение специализированного транспорта и многое другое.
На рынке уже есть несколько систем, которые могут идентифицировать конкретных сотрудников и предупреждать об опасностях через микрофон. Эта инновация позволяет застройщикам автоматизировать множество процессов, связанных с безопасностью персонала.
Нейронные сети по-прежнему остаются полезными в научной работе. Искусственный интеллект используется для решения задач в области генной инженерии, биологии, квантовой химии и математики. Например, модель AlphaFold от DeepMind смогла полностью предсказать структуру белка. В настоящее время графовые нейросети развиваются активно, и они могут использоваться для извлечения данных о связях между узлами и их свойствах.
Согласно исследованию IBM, большая часть информации в области медицины состоит из изображений, причем их количество продолжает расти в сравнении с другими медицинскими данными. Из-за этого использование нейронных сетей для обработки визуальной информации стало очень важным в медицине.
Применение технологии имеет ряд преимуществ, включая экономию времени и средств медицинских учреждений, а также определение области радиологии. После получения снимков, например МРТ, КТ, или других изображений, доктор должен начать анализ, который позволяет выявить отклонения и патологии. Для диагностики серьезных заболеваний требуется проводить несколько визуальных исследований.
Нейронные сети могут быстро анализировать изображения и обнаруживать патологии, такие как опухоли, которые доктор может не заметить. Подобная система позволяет выявлять закономерности и предоставлять медикам полную информацию об отклонениях. Это значительно упрощает работу медиков и экономит время.
Если у пациента есть несколько изображений, сделанных в разное время, искусственный интеллект может помочь в анализе динамики развития заболевания или лечения. Тестирование, проведенное в Google, показало, что анализ снимков, выполненный искусственным интеллектом, был более точным, чем у сертифицированных радиологов.
Машина обнаружила на 5% больше раковых опухолей, чем человек, и уменьшила количество ложных диагнозов на 11% при помощи нейронной сети.
В бизнесе большие потоки информации активно используют маркетологи. Среди главных областей применения Big Data в бизнесе — реклама, где нейронные сети помогают с покупкой рекламы и группировкой аудитории.
Несмотря на то, что спрос на такие решения на рынке в данный момент высок, к 2023 году и в течение следующих 5 лет ситуация может резко измениться и спрос на нейронные сети может вырасти в несколько раз. Этот фактор станет ключевым для успешной рекламной кампании и маркетинга в будущем.
Машины и алгоритмы могут значительно облегчить работу, освобождая людей от выполнения рутинных задач, и вместо этого они должны научиться работать с нейронными системами. Однако ситуация меняется, и в будущем нам предстоит столкнуться с несколькими изменениями.
Первое изменение касается объема данных, который растет на 30% каждый год, а люди ежедневно видят множество рекламных сообщений. В таких условиях маркетологам становится труднее завоевать свою аудиторию, поэтому их задача — найти узкий сегмент клиентов и донести до них информацию, приспособленную к их интересам.
Второе изменение — это необходимость персонализации коммуникаций. Современные пользователи хотят большего персонального взаимодействия, и, согласно отчету McKinsey, 80% клиентов предпочитают работать с компаниями, которые имеют персонализированный подход. Более того, 77% из них готовы платить больше за услуги и товары, предоставляемые такими компаниями.
Третье изменение — это создание закрытых рекламных вертикалей. Крупные корпорации, такие как Safari, Firefox и Chrome, ограничивают обмен информацией между аналитиками и площадками, скрывая данные клиентов. В 2023 году Chrome также начнет блокировать сторонние cookies. Это приведет к появлению нового типа рекламного рынка, где крупные компании станут монополистами.
Такие компании стремятся получить больше информации о клиентах вне своей экосистемы. Как следствие, экосистемы на базе браузера или социальной сети смогут собирать аналитику только на своем инструментарии, без доступа к данным на других площадках.
В 2023 году описанные выше тенденции могут привести к необходимости создания для каждой рекламной кампании большого количества креативов и сообщений, чтобы узким сегментам целевой аудитории было передано наиболее эффективное сообщение.
Чтобы добиться более высокой эффективности, необходимо будет перейти к персонализированному подходу, обращаясь к конкретным людям или группам. Использование нейронных сетей в этом процессе может значительно помочь, поэтому использование этого инновационного решения необходимо.
Маркетологи уже несколько лет работают над группировкой аудитории на различные сегменты для оптимизации рекламных кампаний. Однако, запуск рекламы для широкого возрастного диапазона, такого как 18-55 лет, становится все менее эффективным, поэтому маркетологи стараются делить этот диапазон на 3-5 более узких категорий.
Однако, такой подход не всегда применим из-за ограниченных возможностей создания контента и нехватки информации. В 2023 году эта проблема останется актуальной из-за тенденций к сегментации пользователей, диверсификации каналов и персонализации контента. Нейронные сети, которые способны создавать изображения из текста или фразы, помогут решить эту проблему.
Например, журнал Cosmopolitan уже использовал изображение, созданное машиной DALL-E 2, для своей обложки. Нейронные сети могут анализировать текстовое содержание, чтобы предоставлять наиболее релевантные варианты для разных целевых аудиторий и возрастных групп.
Часто люди создают SMS или изображения для рекламы на основе личного опыта и других факторов. Однако, нейросети могут предсказывать CTR (Click-Through Rate) таких сообщений для конкретного человека или группы лиц. Используя эту информацию, нейросеть может давать рекомендации для улучшения текста или изображения, а затем составлять алгоритмы для автоматического создания креативов и рекламных текстов.
Это упрощает процесс создания сотен сообщений, особенно для персонализированных предложений. Алгоритмы, созданные роботами, быстро адаптируются под конкретного клиента, что будет полезно не только в 2023 году, но и в будущем.
Ученые из Чикагского университета совместно с социологами и специалистами по обработке данных создали новый алгоритм, который предсказывает преступность, анализируя общедоступные данные о преступлениях с учетом временных и географических факторов.
С помощью нейросети возможно выявить взаимосвязи между преступлениями в различных частях города, которые не всегда очевидны для человека. Это новшество поможет повысить эффективность борьбы с преступностью и обеспечит безопасность граждан в будущем.
Люди, не имеющие опыта в сложных математических моделях, используют искусственные нейронные сети в настоящее время. Как только создатели осознали, что нейросети могут быть веселыми, рынок приложений для смартфонов начал заполняться приложениями для работы с изображениями, основанными на искусственных нейронных сетях. Это стало существенным инструментом в эпоху социальных сетей.
Приложения, такие как знаменитый FaceApp, могут не только порадовать, но и впечатлительно изменить внешность: применить профессиональный макияж, изменить волосы, корректировать черты лица и даже добавить эмоции и мимику. Кроме того, все это выглядит настолько реалистично, что трудно заметить подвох с первого взгляда.
Нейросети уже обладают значительным знанием о человеческих лицах. Они могут определить возраст, пол, настроение и даже спрогнозировать, как будет выглядеть лицо в старости, а также оживить статический образ. Фотография теперь может быть использована для идентификации человека, а китайские нейросети Megvii могут даже распознавать собак по носовым отпечаткам на изображениях.
Более того, нейросети могут обрабатывать не только изображения, но и звук. К примеру, Массачусетский технологический институт разработал нейросеть Speech2Face, которая определяет возраст, пол и национальность человека по голосу.
Может ли эта технология причинить вред человечеству? Существуют несколько актуальных проблем, которые нужно рассмотреть:
- Фейки. Благодаря возможностям нейросетей, теперь появились программы, которые позволяют заменять лица и даже время года на фото и видео. Например, нейросеть nvidia на основе генеративной состязательной сети GAN может создавать синтетические изображения. Также нейросеть может создать синтетический голос, полностью идентичный оригиналу на основе короткого фрагмента голоса.
- Трудности понимания. Когда процесс обучения нейросети завершается, человеку становится трудно понять, на каких основаниях она принимает решения. Например, до сих пор непонятно, как нейросети удалось обыграть лучшего игрока мира в Го.
- Оружие хакеров и мошенников. Некоторые опасаются, что хакеры смогут использовать возможности нейросетей для преодоления систем антивирусной защиты и создания нового поколения вредоносных программ. Нейросети также могут использоваться мошенниками, например, искусственный интеллект, способный имитировать общение с живым человеком и заполучать доверие.
- Безработица. Сегодня уже можно найти немало тестов на тему «заменят ли роботы, искусственный интеллект и нейросети вашу профессию». Искусственный интеллект может заменить дизайнеров, художников, моделей, копирайтеров, административных служащих среднего звена и т. д.
Нейросети пытаются сделать жизнь более индивидуализированной. Они предложат каждому из нас блюда, музыку, фильмы и литературу, которые соответствуют нашим вкусам, и в сериалах мы сможем выбирать сюжет. Netflix уже экспериментирует с этим.
Так как искусственный интеллект уже начал выполнять задачи, ранее возлагавшиеся на людей, миллионы высококвалифицированных специалистов могут потерять свои рабочие места постепенно. Работодателю будет проще запустить нейросеть, чем нанимать человека, ведь нейросети не уходят на пенсию, не страдают алкоголизмом и депрессией.
Однако искусственный интеллект по-прежнему не может полностью заменить человеческий мозг.
Антихайп пост: что могут нейронные сети, а что нет
Если спросить у молодежи что самое хайпонутое сейчас, ответ будет: биткоин, майнинг, спиннер ( куда же без них) и deep learning. Про последнее я и хотел бы поговорить, чтобы разбить весь хайп в пух и прах. Поговорить о том, что могут нейронные сети, а что нет. Постараюсь без сложных математических терминов, поехали!
Итак, начнем с самого начала. Что такого в этом Machine learning’е? Представьте процесс написания программы. У вас есть входные данные, вам надо получить выходные. Вы пишете алгоритм и получаете результат. В мл все по другому — у вас есть входные данные, вам надо получить алгоритм их обработки.
Миф №1. Искусственные нейронные сети копируют наш мозг
В корне неверно. В нашей головной помойке ( возьмем то, что у большинства ) по-мимо нейронов есть еще множество клеток, в том числе и различные нейромедиаторные рецепторы, которые реагируют на красивую телочку на улице стояком, а стрессовую ситуацию изменением восприятия.
Правда №1. Искусственные нейронные сети — это просто последовательность произведения матриц ( «табличек»).
Да, это действительно так. Передача импульса от начала до конца описывается произведением матриц. И не какой-то сложной, а самой простой — линейным уравнением.
Выход равен всего лишь этому!
out = activation(Wx + b)
activation — функция активации, может слышали такое понятие как «активация нейронов». Просто так сказать «изменяет вид» выходных значений, чтобы например незначительные сигналы были равны нулю, как пример.
x — вектор входных сигналов слоя, W — матрица весов, b — специальная штука называемая «нейронами смещения», поскольку не принимает на вход совсем ничего, а служит просто для упрощения нахождения решения ( дабы не говорить вам про смещения графиков 😉 ) она в данном случае не важна.
Все! Да да! 5 слоев будет просто 5 таких уравнений.
Нейронная сеть не может думать, это просто преобразования информации. В самом начале матрицы параметров инициализируются случайным образом, в итоге от входного вектора ( вектор — просто последовательность чисел вроде [1,2 4, 5, 4, 3, 2] ) в выходное значение. Все! Больше ничего. Совсем.
Выходное значение дальше сравнивается с правильным, а веса подгоняются так чтобы в следующий раз она дала более лучший результат. Это и есть процесс обучения, такой распиаренный. Как видите, скайнетом тут даже не пахнет!
Данная простейшая архитектура нейронных сетей используется для регрессии: предсказании чего-либо, например, курса валют ( 😉 ), или классификации, на распознавании рукописного текста дают точность близкую к 90%, а это самая простая модель! Естественно пойдут всякие разговоры про скайнет и прочую чепуху)
Миф №2. Нейронные сети могут творить.
В каком-то смысле это так. Они могут рисовать изображения, могут сочинять стихи, музыку. Но это все основано на той же самой подгонке матрицы, когда несколько входных данных комбинируются в один, а на выходе получается нечто среднее. Так, например, работают стилизаторы изображений, но это не творение. Они не творят, это по-сути плагиат. Это все равно, что если бы вы взяли кусок одного романа, впихнули в другой роман и назвали новым произведением.
Правда №2. Нейронные сети могут создавать стихи, общаться с человеком, делать качественный перевод
Да! Но это, опять же, не творение. Вы уже знаете как они обучаются, и понимаете что в этом нет ничего удивительного. Специальные модели ( именно так называются нейронные сети в научной среде ) обучают на входных данных, чтобы они выдавали соответствующий, нужный результат. Различия лишь в используемых архитектурах — сверточные сети для распознавания изображений, rnn/lstm — анализ последовательностей, и иже с ним.
Миф №3. Они появились недавно
Никак нет, сэр. Даже самые продвинутые архитектуры «современные», которые используются для распознавания речи, изображений, псевдотворения были изобретены в 20 веке. Удивлены? А нет ничего удивительного — компы то были слабыми. Нейронные сети чрезвычайно медленные из-за того самого процесса «подгонки» параметров.
Правда №3. Они могут находить новые закономерности и самообучаться.
Да, до этого мы расматривали обучение с учителем, когда был дан идеальный результат.
А существуют еще задача кластеризации — выделения общих признаков ( кластеров ) в какой-то куче навозного мусора, и работают они довольно годно, круче человека в сотни раз. Эх, вот где годнота-то!
А еще они могут выбрать отпехать красивую девчонку, вместо того чтобы сожрать морожку. Тут все просто. В искусственные нейронные сети взяли и добавили один из нейромедиаторов — дофамин, и теперь она ищет удовольствия. Эх, вот где надо бояться))))
Миф №4. Нейронные сети приведут к сильному искусственному интеллекту, сопоставимого с человеческим сознанием.
Нет, нет, и еще раз нет! Нейронные сети — это просто тупой и сухой линал, линейная алгебра, как угодно, но не интеллект. Это преобразования матриц, из одних в другие. Ничего более. Если и будет создан сильный ИИ, то нейронные сети будут небольшим винтиком.
Правда №4. Нейронные сети могут принимать решения.
Да, связано с это с так называемой техникой reinforcement learning, в которую как раз и добавили дофамин и нейронные сети. Она ищет наиболее выгодный исход и выбирает его. Так, например, AlphaGo победила чемпиона по самой сложной настольной азиатской игре — Го.
У меня все, оставляйте фидбеки разной сложности — постараюсь ответить.

Где лимит прогресса нейронных сетей? В чем будет затык, в аппаратной мощности?
ТС как-то все неимоверно упростил:
1. Современные NN уже больше, чем умножение матриц с активацией. Во-первых, уже не матриц, а тензоров. Во-вторых, куча не самых тривиальных трюков, начиная с batchnorm и resnet, заканчивая inception network. Поверх этого еще rmsprop или adam.
2. Говорить, что NN — только линейная алгебра просто неверно. По смыслу, это прежде всего, механизм приблежения многомерного распределения, то бишь теорвер. Принцип работы аппрокцимации — матан и геометрия, причем реально сложная.
3. NN могут именно творить, придумывать то, чего не было — под это даже термин есть generative models. Посмотри результаты GAN.
4. Наконец, NN не копирует, но во всю использует многие находки из нейробиологии. Кто бы стал вкладываться в convnet, если бы не эксперименты Хубела и Визела над котами.
Недавно попробовал сеть, которая ч/б, фотки раскрашивает.
Взял цветную семейную фотографию, отгрейскелил её, загрузил туда, и она раскрасила её довольно близко к оригиналу. Я был поражён.
До этого считал, что нейронные сети это фейк и развод.
Как "я" заработал 98 000 р за неделю
Решил я однажды благим делом заняться — дать возможность заработать деньжат лицам моложе 18 лет. Два племяша примчались сразу, даже не спрашивая про суть работы. Суть простая: сборка мебели на адресе клиента. Выдал им хорошие бошевские лёгкие шуруповерты и мы поехали на первый адрес. По пути им объяснил, что с первого заказа дам им тысячу каждому, независимо от объема выполненной работы. Чисто чтобы увидели, что можно своими руками за неделю заработать зарплату как на заводе за месяц. На первом адресе они успели собрать каждый по коробу из шестнадцати имеющихся на кухне. Все остальное время просто смотрели как я собираю и ставлю все по уровню. Кухню собрал за почти 9 часов. Заработал 12 000. Дал им в конце дня по тысяче и сказал быть завтра утром у меня. Утром никто не пришел. На мой звонок ответили, что этому долго обучаться, но за тысячу спасибо. Больше они не изъявляли желание собирать мебель, но охотно раздавали листовки прохожим за копейки на улице. Немного погодя звонит мне племянница. Ей 14 лет. Просится со мной на сборку по адресам. Я отказываю, но она парирует тем, что сама сколотила будку собаке на даче. Я вновь отказываю и объясняю, что она маленькая и слабая, даже шкаф не поднимет для навески на стену. Просится все равно и говорит, что даже денег не будет просить. Ну я сломался и решил один раз ее свозить, чтобы сама увидела и обломилась. На первом заказе успела тоже только один короб собрать, но быстро вникла как работать с уровнем и пару раз с осторожностью указала мне, где я ошибся. Я бы и сам заметил ошибку потом, но ее я похвалил и все же заплатил ей в конце дня. Постепенно она постигала все как губка и за лето работала со мной из расчета 30/70, затем 40/60. 50/50 отказывалась, мотивируя тем, что она делает заметно меньше работы. Я же был готов ей платить, только за то, что она просто умница. В сентябре пошла в школу и наши совместные работы прекратились. В середине сентября звонит и просит прийти в ее школу. Там она договорилась с завхозом, что я соберу парты, стулья и шкафчики для трёх первых классов. Обговорили сумму. Мне дали 10 дней на сборку. Вышли из школы, а племяшка говорит, что она сама соберёт все, а я ей нужен был чтобы завхоз видела, что этим будет заниматься взрослый. Я согласился, мне не жалко. В течении недели она все сделала. В выходные, после уроков приходила и собирала. Сначала по инструкции, а потом уже на автомате. Школа заплатила «мне» 98 000. Я приехал к ним домой и торжественно вручил ей все деньги, ещё и шурик навсегда ей отдал. Мама плачет от счастья, отец не верит, что такое возможно. Короче, пришлось попить с ними водочки в тот вечер, а утром пошли покупать комплектующие для «мощного» компа и всякие там мониторы, мышки, клавы.
Давайте запретим нейронные сети
Тема нейронных сетей волнует сейчас почти всех, кто рисует. За последние полгода прогресс выглядит для кого-то головокружительным, а для кого-то пугающим. В этой статье я хочу рассмотреть основные страхи, претензии и впечатления в целом по отношению к нейронным сетям среди творческих людей, профессия или хобби которых — создание визуальной эстетики.

В силу работы и персональных интересов мне приходится часто общаться с художниками. Обычно это профессиональные 3d и 2d художники из игровой индустрии или желающие попасть туда. Но также я много общаюсь с людьми из рекламы, кинопроизводства, театра, преподавателями в худ. учебных заведениях и другими.
Условно можно провести водораздел между двумя мнениями насчет нейросетей (здесь и далее я имею в виду “рисующие” нейросети): пренебрежение, начинающееся от безразличия и доходящее до отрицания или интерес, переходящий в восторг.
Надо запретить
Большинство испытывают откровенный страх по отношению к нейросетям, прикрывая его неприязнью или скепсисом. Их можно понять: неожиданно, за каких-то год-два нейросети эволюционировали от примитивных рисовалок до инструмента, отлично имитирующего профессионалов. В первом приближении кажется, что дальнейший прогресс в этом направлении будет и дальше столь стремительным. Это наводит на мысль, что навыки, на которые были потрачены годы, станут бесполезны, а работа человека обесценится.
Основные тезисы критиков – нейросети:
никогда не сравнятся с художниками, они плохо делают “то-то”;
воруют работы других художников, нарушая авторское право;
это не творчество, а просто копание в случайных картинках;
обесценивают труд художников, которые потратили годы на обучение;
это игрушка, не применимая на практике
отнимут работу у художников
Есть и другие, как правило производные или частные случаи выше озвученных. Если я что-то пропустил – дополните в комментариях.
Надо разобраться
На первый взгляд, аргументы справедливы, но давайте разберемся, почему все это совсем не так.
В основном критика звучит из уст людей, которые не прикасались еще к нейросетям, или попробовали ограниченные форматы, вроде миджорней (где количество бесплатных генераций ограничено). Те же, кто в полной мере погрузился в процесс, независимо от своей первоначальной позиции как правило отзываются положительно и даже восторженно. Чтобы в полной мере понять, надо попробовать, но страх или предвзятость могут стать непреодолимым барьером.
Нейросети никогда не сравняются с художниками, они плохо делают “то-то”
Это правда – прямо сейчас нейросети плохо “рисуют” руки, ошибаются в перспективе, склеивают объекты и допускают множество других очевидных ошибок. Однако стоит сравнить, что нейросети умели год назад и что умеют сейчас, и их доступность – сразу становится понятно, что прогресс не огромный, он фантастический.
DALL-E, 2021 год
Stable Diffusion, 2022 год
Новые специализированные модели, натренированные на отдельные стили, появляются каждый день. Новый функционал и инструментарий – с регулярностью в несколько месяцев. Нейросети умеют “додумывать” и дорисовывать картины, смешивать совершенно непохожие изображения, рисовать поверх любой картинки, используя ее как основу, угадывать что вы пытаетесь накалякать, имитировать стиль любого художника.
Нет никаких сомнений, что через 5 лет, а то и раньше, не будет ни одной художественной задачи, с которой не справятся нейронки.
Нейросети воруют работы других художников, нарушая авторское право
Дело в том, что нейронные сети не используют ни одного пикселя с тех работ, на которых их обучали, но они действительно могут очень точно подражать “стилю” любого художника. За этим, на первый взгляд, довольно просто углядеть плагиат, но доказать это будет очень не просто. Понятия “стиль” в правовой сфере нет, поэтому на “стиль” не распространяется право собственности и авторское право. Подражать любому стилю можно без ограничений, если вы создаете новое изображение. Плагиатом считает прямое использование чужого произведения или его фрагмента под своим именем. Нейросеть генерирует новые изображения. И технически, и визуально это легко доказать.
Несмотря на это, нейросети все еще находятся в некоторой “серой зоне” права, просто потому что каких-то громких разбирательств не было. Непонятно, кому действительно принадлежат изображения: художникам, сгенерировавшим их, тем, кто создал нейросеть или кто обучил и т.д. Поэтому сейчас лучший выход — использовать open source варианты, такие как stable diffusion. Как и в случае с коллажем, фотобашем, трассировкой и прочими производными произведениями – никто ничего сделать не сможет, да и не захочет. Если вы, конечно, не будете напрямую использовать образы, принадлежащие не вам.
Нейросети — это не творчество, а просто копание в случайных картинках
Есть опасность погрузиться в сложный философский вопрос “что такое творчество”, но я попробую кратко.
Творчество в широком смысле – создание чего-то нового из уже существующего. Не обязательно нового для всего мира, или отрасли, иногда нового чисто для себя. Неотъемлемой частью творчества является участие, т.е. творец должен буквально сам создавать.
Сторонникам озвученной выше идеи кажется, что процесс создания незатейливый – вбил запрос и получил картинку. Но на самом деле, уже сейчас это довольно хитроумный и неочевидный процесс. Как правило, у вас всегда есть идея или замысел, которые вы хотите воплотить с помощью нейронки. Например, сгенерировать жирного красного кота. На запрос: Fat Red Cat, получится что-то такое:

Сгенерировано для этой статьи с помощью Stable Diffusion
Но мы не такого кота себе представляли. Надо добавлять уточняющие слова. В ходе поиска вы можете прийти к монструозным конструкциям вроде: “Photo of Fat Red Cat in forest, art by Anders Zorn and John William Waterhouse, professional painting, beautiful, aesthetic, elegant, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, soft color, 3d, unreal” (я уж молчу про все возможные параметры)
И получить уже что-то такое:

Сгенерировано для этой статьи с помощью Stable Diffusion
И вот этот поиск соответствия своих ожиданий с возможностями инструмента ничем иным как творчеством не назовешь. И перебор “промптов”, это самое простое, что можно сделать. Можно обучить на разных стилях, генерить в одном, потом использовать как маску и перегенерить в другом, экспериментировать с форматом, что-то замазывать или обрезать в редакторе, склеивать получившиеся результаты. Навыков надо минимум, каждый может начать. Но чтобы получить удовлетворяющий (в первую очередь вас) результат, придется провести вполне себе осмысленный и творческий поиск, который может легко затянуться на часы.
Нейросети обесценивают труд художников, которые потратили годы на обучение
Вопросы этики всегда самые сложные. Но подумайте вот над чем: обесценивает ли фотография портретную живопись, а рисунки в фотошопе масляную?
Вы скажете: “нейронки тренируются на работах авторов”. Но что делают авторы? Они, как и нейронная сеть, поглощают информацию о мире вокруг, о любимых художниках, обрабатывают эти данные нейросетью своего мозга и через руку выдают на бумаге производное изображение. Вы скажете: “постой, это другое, это же человек делает”. А я скажу — физик тоже может проводить расчеты в голове, но давно доверяет это машине, потому что некоторые расчеты человеческому мозгу просто не подвластны из-за времени. Так же и нейронная сеть – еще один инструмент, которому художник делегирует часть своего обучения. Благодаря чему обязательно выдаст такие визуальные решения, которые ему были бы недоступны при традиционной форме обучения, просто из-за времени. Поэтому ни о каком обесценивании речь не идет, весь художественный опыт человечества сейчас собирается, чтобы калькулировать в будущем в такие произведения, которые сегодня человеку недоступны. Это ода труду художников прошлого и настоящего.
Нейросети — это игрушка, неприменимая на практике
Ну пока да, но это опять же вопрос времени. 17 ноября вышел проект, над которым я работал последние 2 года, и там, помимо прочего, использовались изображения, созданные нейросетями. Зайдите на артстейшн, и увидите как люди пока робко, но уже пробуют нейросети в работе.
Уже сегодня практично и удобно генерировать лица персонажей для концепт арта и иллюстраций, искать композиции, набрасывать скетчи дизайнов, добавлять детализации своим скетчам и т.д. Это вполне себе реальные задачи, закрываемые нейросетями прямо сейчас. Вот например, Xander Smith еще 2 года назад использовал нейронную сеть, чтобы подобрать варианты лица для концепта:

Xander Smith, Artbreeder
Нейросети отнимут работу у художников
И это единственное верное утверждение из всех озвученных. Они и правда “отнимут” работу у художников, но это произойдет не так как, представляют многие, слыша эту фразу. Это не будет буквальным замещением, массовыми увольнениями или неожиданным изменением всех существующих подходов. Просто постепенно, незаметно, художники сами, по своей воле, перейдут от стандартных инструментов к нейросетевым. Те, кто не захотят или не смогут, органично либо сменят род деятельности, сместятся на роли технических специалистов или руководителей или вообще переместятся в другую отрасль. А для кого-то ничего не поменяется и через 10 лет будет ниша, где в силу каких-то причин или обстоятельств будут востребованы традиционные методы и подходы, но с каждым годом таких мест и потребность в таких ролях будет все меньше и меньше, но на век сегодняшних консерваторов от мира творчества хватит.
Надо пользоваться
Подводя итоги – изучайте нейросети. В свое время великое традиционное искусство уступило место цифровому, благодаря чему было совершено множество открытий, были созданы целые отрасли и профессии. Эпоха нейросетей еще только в зачаточном состоянии.
Стоит вспомнить первые трехмерные игры:

Waze Mare, 1973 год
и посмотреть к чему они пришли сегодня:

God of War: Ragnarök, 2022 год
Это просто головокружительный прыжок. Несмотря на то, что математика, лежащая в основе нейросетей еще в 40-е годы прошлого века появилась, а концепцию еще Лем предлагал в 60-е, сегодня нейросети находятся на самом старте, и мы еще удивимся, насколько далеко сможем прыгнуть.
Нейросети: какие бывают, как их обучают и 10 онлайн нейросетей
![]()
Нейросеть или нейронная сеть — это компьютерный алгоритм, который имитирует поведение человеческого мозга при обработке данных. Сталкиваясь с незнакомым предметом, нейросеть, как и человек, изучает его, делает выводы и использует полученную информацию в дальнейшем.
Объясняем на примерах, как работают и учатся нейронные сети, чем они полезны и как связаны с глубоким обучением. В конце — подборка сервисов, чтобы самостоятельно попробовать нейросети в деле. Вы увидите, как искусственный интеллект генерирует тексты, рисует картины и даже делает музыку.
Нет времени читать статью? Найдите ее в нашем телеграм-канале и сохраните себе в «Избранном» на будущее.
Содержание статьи
Что такое нейросеть?
При стандартном подходе к программированию человек пишет алгоритмы для компьютеров, то есть сообщает им, что конкретно нужно сделать. В случае с нейронными сетями мы не говорим, как решить задачу, — они учатся это делать сам на основе разных данных.
Со временем нейросеть выявляет закономерности и генерирует на их основе и новые решения. При этом придумать что-то уникальное искусственный интеллект не может — он действует только в рамках той информации, которую изучил.
Пример нейронной сети — голосовые помощники Siri, Алиса, Маруся и другие. Со временем они начинают узнавать голос, понимают предпочтения и рекомендуют более подходящий контент.
Принцип работы нейросетей придумали еще в середине XX века, но у человечества было недостаточно информации, чтобы обучить модели. Нейронные сети стали активно использовать в 2010-х годах, когда появились большие объемы данных. С тех пор нейросети многому научились: они могут писать тексты, рисовать, читать вслух, делать видео и даже музыку.
Например, в сентябре 2022 года вышел журнал «РБК Стиль», обложки к которому нарисовала нейронная сеть. Искусственный интеллект проанализировал работы с выставки современного искусства Cosmoscow и сгенерировал изображение.
![]()
Обложка к журналу «РБК Стиль» №5, 2022 г. Автор — искусственный интеллект
В период обучения нейросеть может выдавать странные результаты. Например, в 2019 году робот-помощник Тинькофф Банка грубо ответил пользовательнице. Девушка пожаловалась на проблемы со входом в приложение по отпечатку, на что искусственный интеллект посоветовал ей отрезать пальцы. Так произошло из-за того, что нейросеть училась на языковом корпусе — большом объеме данных из разных источников. Какие-то тексты в корпусе были литературными, а какие-то — нет. Чтобы избежать таких ситуаций, тексты пришлось бы отбирать вручную, но это нереально.
Как работает нейросеть?
Нейронная сеть состоит из искусственных нейронов или узлов — небольших программ, которые производят расчеты. Таких узлов много, поэтому их объединяют в слои:
- входной, куда приходят данные;
- один или несколько скрытых, где производятся вычисления;
- выходной, где данные выходят наружу.
Каждый узел соединяется с соседними, их связь называется синапс и имеет определенный вес. Чем выше это значение, тем важнее связь между двумя узлами. Если выход любого узла превышает указанное значение, этот узел активируется и отправляет данные на следующий уровень сети. В противном случае данные не передаются дальше.
Мы подготовили наглядную схему, на которой видно принцип работы нейросети.
![]()
Разберем работу нейронной сети на примере. Допустим, мы хотим, чтобы нейросеть отличала картинку с собакой от картинки с кошкой — для этого нужно загрузить много фотографий этих животных. Нейросеть изучит каждое изображение и выдаст результат в виде двух чисел: первое будет показывать, насколько алгоритм уверен, что на картинке собака, а второе — что кошка. Если ответ неверный, нужно указать на ошибку — алгоритм всё пересчитает и запомнит.
Нейросеть не может генерировать уникальные результаты, потому что действует только на основе предыдущего опыта. Так, если в нашу нейросеть загрузить фотографию попугая, она ничего не поймет и идентифицирует его как кошку или собаку. Чтобы нейросеть узнавала еще и попугаев, ее нужно обучить дополнительно по тому же алгоритму.
Как обучить нейросеть?
Чтобы научить нейросеть, нужно много данных. Существуют даже отдельные системы, в которых информация размечена специально для искусственного интеллекта.
Вы наверняка встречали капчи от Google, на которых нужно выбрать светофоры, машины, корабли и прочее. Принято считать, что так сайт проверяет, кто делает запрос: робот или человек. Но это не единственное предназначение капчей. Попробуйте дать частично верный ответ, и система вас все равно пропустит.
Алгоритм нужен еще и для того, чтобы обучить нейросеть Google на конкретных примерах. Это способ собрать большой массив данных, на создание которого у работников ушло бы намного больше времени.
![]()
Google создал специальный сайт, где каждый желающий может обучить нейросеть, — Teachable Machine. С помощью сервиса можно научить искусственный интеллект распознавать звуки, позы и изображения. Готовую модель можно скачать на Google Диск в формате zip, чтобы потом вернуться и продолжить работу.
Мы научили нейросеть отличать яблоки от бананов: для этого мы загрузили несколько образцов, модель их изучила и смогла распознать яблоко с точностью 74%. Чтобы результаты были лучше, нужно дать нейросети больше фотографий.
![]()
Какие бывают нейросети?
Существует много типов нейронных сетей: они различаются по сложности, вариантам использования, структуре, а также по тому, как моделируются искусственные нейроны, и по связям между узлами. Самыми популярными считаются три типа нейросетей:
- персептрон (перцептрон),
- рекуррентные,
- сверточные.
Персептрон
Самая простая и самая старая форма нейронных сетей. Состоит из одного нейрона, который выполняет две операции: принимает входные данные и применяет к ним функцию активации — в результате получается вывод в двоичной системе.
Персептрон не содержит скрытых слоев и может использоваться только для тех задач, где нужно разделить данные на две классификации. Из-за своей простоты этот тип нейросетей уже почти не используют.
Существуют и более сложные многослойные персептроны, в которые добавляются дополнительные скрытые слои. Их используют для более сложных задач, таких как распознавание голоса.
![]()
Как работают персептрон и многослойный персептрон
Рекуррентные нейронные сети
Рекуррентные нейросети применяют для генерации текстов, обработки речи и перевода. Это сети с циклами, главная особенность которых — использование памяти. Модель будет перемещать данные вперед и возвращать их к предыдущим шагам, чтобы как можно лучше выполнить задачу.
Слои между входным и выходным слоями повторяются, поскольку данные зацикливаются и сохраняются — так сеть хранит информацию о всех доступных данных. Благодаря этому модели лучше понимают контекст входных данных и улучшают прогнозы выходных данных.
![]()
Сверточные нейронные сети
Чаще всего сверточные нейросети используют для классификации изображений, видео, распознавания объектов и лиц. Если обычная нейронная сеть состоит из трех типов слоев, то сверточная — из пяти:
- входной,
- сверточный,
- объединяющий,
- подключенный
- выходной.
Такие сети дают устойчивый результат, даже если изменить ракурс и масштаб фото. Каждый слой изучает определенную часть изображения, а на выходе соединяет все полученные данные.
Например, нам нужно распознать лицо по фотографии. На первом этапе нейросеть определяет простые очертания, на втором — группы краев, которые образуют фигуры, на третьем — глаза и нос. Сети нужно 5–6 уровней, чтобы собрать все эти черты в портрет человека.
![]()
Сверточная нейронная сеть рассматривает изображение по кусочкам
Как связаны нейросеть и умные устройства?
Нейросети позволяют обычным устройствам становиться умными. Например, современные камеры видеонаблюдения могут не только записывать видео, но и анализировать его: обнаруживать человека, фиксировать движение в кадре, распознавать лица.
А еще умные устройства — это отличная база для обучения нейросетей. Умные часы фиксируют жизненные показатели, колонки слушают наши разговоры, телефоны наблюдают за перемещениями. Эти и другие устройства отправляют данные на серверы компаний — в дальнейшем из информации получаются обученные алгоритмы.
Данные отправляют на серверы, так как в маленьких устройствах обычно недостаточно мощности и памяти для обучения. Попробуйте поговорить с голосовым помощником на смартфоне, когда у вас нет доступа к Интернету, — ничего не получится, потому что устройство только собирает данные, но не обрабатывает их. Ученые уже работают над тем, чтобы портативные устройства смогли обучаться сами, сохраняя конфиденциальность пользователя.
Нейросеть и глубокое обучение (deep learning) — в чем отличие?
Глубокое обучение — это подраздел машинного обучения, а нейронные сети составляют основу его алгоритмов. Слово «глубокий» относится к количеству скрытых слоев в нейронной сети, то есть к ее глубине. По сути, каждая нейронная сеть с более чем тремя слоями, включая входной и выходной, может считаться моделью глубокого обучения.
Проще всего понять отличия нейросетей от глубокого обучения, если рассмотреть их структуру.