Искусственный интеллект: что это такое и как работает
Искусственный интеллект или AI — это раздел компьютерных наук, занимающийся созданием машин или программ, которые могут думать и учиться, имитируя человеческий разум. Разбираемся, как работает технология, какие изменения она привносит в нашу реальность и где активно используется.
История создания ИИ
Искусственный интеллект впервые получил признание в науке в 1956 году на летней конференции в Дартмутском колледже. Его презентовал математик Джон Маккарти. Он рассматривал ИИ как математическую абстракцию, целясь в создание «искусственного» аналога человеческого мышления. С тех пор научные исследования в области ИИ расширялись. В них включили изучение психологии памяти и механизмов понимания для их имитации на компьютере. К середине 1970-х появились методы семантического представления знаний, а также экспертные системы, которые использовали знания специалистов для моделирования мыслительных процессов.
Науки о данных
Онлайн-магистратура по Data Science c МФТИ. Получите фундаментальные знания и практические навыки, защитите диплом в формате запуска стартапа
от 342 ₽/мес
В следующие десятилетия популярность ИИ выросла. Появились алгоритмы машинного обучения, которые помогают компьютерам накапливать знания и самостоятельно обучаться на основе проб и ошибок. С 2010 года увеличившаяся мощность компьютеров позволила сочетать большие данные с методами глубокого обучения на основе нейросетей. Активнее начали развиваться распознавание речи и изображений, понимание естественного языка, автономное вождение автомобилей.
Как работает ИИ
- Сбор необходимых данных. AI требует большого объема информации для обучения. Она поступает из различных источников, таких как базы данных, интернет или датчики.
- Подготовка данных. ИИ обрабатывает и адаптирует информацию для дальнейшего использования.
- Обучение моделей. ИИ учится на данных для выполнения конкретных задач, например распознавания паттернов или прогнозирования. Программа анализирует данные и находит в них закономерности.
- Тестирование и оптимизация. после обучения модель проверяют на новых данных для оценки ее эффективности и точности. При необходимости дополнительно настраивают и улучшают алгоритмы.
- Работа в режиме реального времени. после успешного тестирования и оптимизации модель готова к использованию в реальных условиях, например для классификации или принятия решений на основе данных.
Давайте разберем на всем знакомом примере ChatGPT. Сначала ИИ обучали на огромном массиве текстовых данных из интернета: веб-сайтах, электронных книгах, словарях и энциклопедиях вроде «Википедии». Модель изучила языковые закономерности, структуру предложений, грамматику, собрала базу знаний.
Обработка естественного языка (NLP) в лингвистике и IT
Онлайн-магистратура по Data Science совместно с ТГУ
Далее модель дополнительно обучали на специфических задачах: генерация ответов на вопросы, перевод текста и суммирование ответов. Это помогает модели лучше справляться с конкретными запросами.
Когда пользователь задает вопрос или дает команду, ChatGPT генерирует ответ, основываясь на выученных паттернах. Модель анализирует введенный текст, определяет контекст и генерирует ответ. Данные от взаимодействий с пользователями алгоритм использует для дополнительного обучения и оптимизации.
Например, мы просим нейросеть написать текст про устройство космического корабля. Она выдает результат. Затем мы даем команду: «Нужно обязательно добавить информацию из книги N, сократить текст до пяти абзацев и сделать так, чтобы каждое предложение начиналось с новой буквы алфавита». ChatGPT возьмет за основу уже созданный текст и переработает его с учетом поставленной задачи.
Читайте также Искусственный интеллект против сценаристов: как нейросети создают истории
Нейросеть и ИИ — одно и то же?
Не совсем. Нейросеть — это один из видов AI.
Простыми словами, искусственный интеллект — это обширная технология, помогающая компьютерам выполнять задачи, как это делают люди, например понимать речь или принимать решения.
Нейросети — это лишь один из способов работы ИИ. Они подражают человеческому мозгу и используются для задач, где нужно распознавать образы или учиться на данных. Нейросети — это инструмент внутри большой области ИИ.
Начните карьеру в востребованной сфере Data Science. Онлайн-магистратура МФТИ с практикой на реальных проектах
Где используют ИИ
ИИ в медицине
Искусственный интеллект часто применяют для анализа медицинских изображений, например рентген-снимков. Сейчас самое активное направление развития здесь — диагностика и оценка риска развития онкологических заболеваний. Philips Healthcare, SIEMENS Healthineers и Google AI Healthcare представляют собственные разработки в этой сфере.
В медицине искусственный интеллект служит цифровым ассистентом врача. Он анализирует все детали, ускоряет работу и дает альтернативное мнение. Такой ИИ способен очень быстро анализировать сотни рентгеновских и МРТ-снимков, выявляя те случаи, которые требуют более детального внимания со стороны медицинских специалистов.
ИИ анализирует генетическую информацию пациентов, чтобы предложить индивидуализированные лечебные планы. Это особенно важно в онкологии, где лечение может быть адаптировано под конкретные генетические мутации опухоли. ИИ-помощники обеспечивают первичную медицинскую консультацию, анализируя симптомы и предоставляя рекомендации о необходимости обращения к специалисту.
Читайте также Data Science в медицине: как данные и алгоритмы спасают жизни
ИИ в банкинге
Искусственный интеллект активно используют в поиске мошеннических операций. Есть инструменты, которые анализируют паттерны транзакций клиентов, чтобы выявлять необычные или подозрительные действия, которые могут указывать на мошенничество. ИИ обучается на известных случаях мошенничества, что позволяет ему эффективно определять подобные ситуации в будущем.
AI анализирует финансовую историю клиента, его текущее финансовое состояние, чтобы дать рекомендации банку по выдаче кредита. Также ИИ может помочь с личными финансами: анализировать расходы клиентов и предлагать способы экономии.
ИИ в онлайн-торговле
Когда вы совершаете покупки в интернет-магазинах, площадка рекомендует вам товары исходя из ваших интересов. ИИ анализирует предыдущие покупки, поисковые запросы и просмотренные товары, чтобы составить вам предложку.
Алгоритмы машинного обучения анализируют данные о продажах и трендах, помогая предсказать будущий спрос и оптимизировать уровни запасов.
ИИ в искусстве
Искусственный интеллект проникает в мир музыки и кино, привнося инновации и открывая новые возможности для творчества и продакшна.
ИИ генерирует мелодии, используя алгоритмы глубокого обучения. Он анализирует большие объемы музыкальных данных для создания новых композиций. Может создавать музыку в различных стилях, от классической до популярной.
В кинематографе ИИ помогает в написании сценариев, предлагая идеи для сюжетных поворотов или диалогов. Также ИИ используют для создания реалистичных CGI-персонажей и сцен с визуальными эффектами.
Читайте также Может ли ИИ писать для блога SkillFactory? Отвечает нейросеть
ИИ в быту
Сегодня у многих в домах стоит умная колонка, которая не только воспроизводит музыку, но и разговаривает с людьми.
Умные колонки используют технологии распознавания речи и естественного языка для понимания и обработки запросов пользователя. При помощи голосового помощника мы управляем различными умными устройствами в доме: освещением, бытовой техникой, телевизором и системой безопасности.
В будущем искусственный интеллект поможет нам управлять умным домом, который вовремя закажет продукты, составит график уборки, включит свет утром и расскажет о погоде за окном.
Читайте также От тренера до инженера: 6 новых IT-профессий для тех, кто хочет работать с нейросетями
Какие вызовы ставит перед людьми ИИ
Искусственный интеллект активно трансформирует наш мир, открывая безграничные возможности во множестве сфер, от здравоохранения до образования. Однако вместе с потенциалом ИИ ставит перед людьми и ряд серьезных вызовов.
Первый — этический. Вопросы приватности и безопасности данных становятся все более актуальными. Развитие технологий должно идти рука об руку с развитием этических стандартов их использования.
Следующий вызов — безопасность. Применение ИИ в критически важных областях, таких как транспорт или медицина, требует исключительной надежности и точности. Ошибки в работе могут иметь катастрофические последствия. Поэтому важно обеспечить максимально возможную безопасность и защиту систем на основе ИИ от внешних угроз.
Третий пункт, вызвавший большой резонанс в обществе, — влияние на рынок труда. Автоматизация, приводящая к исчезновению некоторых профессий, требует переосмысления подходов к обучению и переквалификации рабочей силы.
Для того чтобы быть востребованным специалистом, нужно идти в ногу со временем и постоянно учиться. Тогда нейросети облегчают и автоматизируют работу, а не забирают ее.
Науки о данных
Освойте профессию инженера по компьютерному зрению, специалиста по машинному обучению или дата-сайентиста на онлайн-магистратуре МФТИ. Программа состоит из академических знаний и 70% практики от компаний-партнеров.
Искусственный интеллект
Искусственный интеллект (ИИ) — технология, позволяющая системе, машине или компьютеру выполнять задачи, требующие разумного мышления, то есть имитировать поведение человека для постепенного обучения с использованием полученной информации и решения конкретных вопросов.
Гипервизор — программное обеспечение для создания, запуска и контроля виртуальных машин. На них могут быть установлены разные операционные системы (ОС). Они изолированы от аппаратных систем и используют ресурсы виртуального компьютера, на котором запущены.
Интеграция ИИ в механизмы и системы позволяет автоматизировать рутинные, трудоемкие или сложные процессы, в том числе повысить их точность и производительность. Поэтому, эта технология — важный бизнес-ресурс.
Примечание: По данным Statista к 2025 году мировой рынок программного обеспечения (ПО) для искусственного интеллекта будет оцениваться в $22.6 млрд.
Преимущества внедрения ИИ
Использование искусственного интеллекта и решений на его базе обеспечивает бизнесу ряд преимуществ.
- Исключение человеческого фактора. Использование программируемых, самообучающихся алгоритмов исключает фактор человеческой ошибки и позволяет находить даже неочевидные для человека решения.
- Снижение рисков. Машины с ИИ могут применяться в ситуациях, связанных с риском для человека. Например, роботы с ИИ могут заменить человека на отдельных производственных участках или при работе в условиях стихийных бедствий.
- Круглосуточная доступность. Интеллектуальные машины можно использовать без перерывов, выходных, они не реагируют на отвлекающие факторы.
- Адаптируемость. В рамках установленных условий применение ИИ-решений позволяет находить быстрые решения. Например, ИИ в чат-ботах помогает лучше понимать «живой» язык клиентов, находить ответы на сложно сформулированные вопросы, справляться с большим потоком одновременных обращений и вопросов.
- Быстрое принятие решений. Приложения, машины, приборы и другие инструменты на базе ИИ принимают решения быстрее людей, что может использоваться в производственных процессах, в процессе аналитики данных, создании прогностических моделей, расчетах и других задачах.
Проблемы внедрения ИИ
Есть несколько причин, замедляющих внедрение и использование искусственного интеллекта.
- Для контролируемого обучения (с учителем) нейросетей нужно размечать (маркировать) наборы данных вручную. На это требуется много времени.
- Для обучения моделей нужен большой объем данных, которые нужно предварительно собрать из разных источников, структурировать, очистить от ненужной информации и привести к общему формату. Для такой работы нужна выстроенная система и штат специалистов.
- Результат, полученный в результате работы алгоритмов ИИ сложно трактовать и понять с точки зрения логики принятия решений.
- Модели ориентированы на решение определенных задач. Например, если алгоритм ИИ используется для обнаружения мошенничества конкретного вида, другие варианты мошенничества он распознавать не будет — для каждой задачи и каждых условий нужна своя модель.
- Если исходный набор данных для обучения искажен или недостаточен, результаты работы ИИ могут быть искажены. Например, если в выборке для обучения используются только объекты красного цвета, при появлении синего объекта в процессе самообучения могут возникнуть ошибки или разногласия.
- Для работы с ИИ и разработки проектов на его базе важно иметь достаточную компетенцию, позволяющую оценивать риски и принимать решения на каждом этапе внедрения алгоритмов.
Сферы применения искусственного интеллекта
Технологии ИИ используются в разных областях.
- В информационных системах связи. Для распознавания голосовых запросов, поиска релевантных ответов и их озвучивания с помощью сгенерированного человеческого голоса.
- В транспорте и логистике. Для создания беспилотных автомобилей и дронов для автоматизированной доставки товаров и посылок в удаленные районы.
- В финансовом секторе. Для прогнозирования рисков, распознавания мошеннических действий, оценки платежеспособности клиентов, фиксации и блокировки атак злоумышленников. Например, к 2023 году 90% заявок на получение кредитов в Сбербанке будет рассматривать ИИ.
- В медицине. Для диагностики заболеваний, обнаружения нарушений на ранних стадиях, долгосрочного прогнозирования состояния пациента.
- В военной промышленности. Для разработки новых видов вооружений, средств индивидуальной защиты и приборов для распознавания противников в сложных условиях.
- В бизнесе. Для проведения аналитики, сегментации клиентов, разработки персональных предложений, оптимизации рутинных рабочих процессов, выявления рисков и мошенничества. По данным 2019 года 42% российских ритейлеров использовали технологии ИИ, а еще 35% планировали их внедрить для проведения цифровой трансформации в течение пяти лет.
Примечание: Согласно результатам совместного исследования TAdviser, Huawei и «Техносерв», к концу 2020 года 68% российских компаний использовали решения на базе ИИ, а 24% — планировали интегрировать их в бизнес-процессы в течение следующих двух лет.
Выделяют три вида искусственного интеллекта:
- Слабый ИИ (Narrow AI). Единственный доступный сейчас тип ИИ, применяемый в голосовых помощниках, системах виртуальной реальности, рекомендательных механизмах и других решениях.
- Сильный ИИ (AGI). ИИ с самосознанием и возможностями, приближенными к человеческим. По прогнозам экспертов, сильный ИИ будет окончательно сформирован и доступен для использования не раньше 2075 года.
- Супер ИИ (Super AI). ИИ с полным самосознанием и сформированным мышлением, превосходящим человеческое. Предположительно Super AI сможет самостоятельно перепрограммироваться, создавать системы нового направления и алгоритмы без вмешательства человека.
Чтобы ИИ мог выполнять поставленные задачи, он должен быть предварительно обучен на реальных или схожих к ним задачах. Для этого используется два метода:
- машинное обучение;
- глубокое обучение.
Машинное обучение — способ обучения системы или машины программирования и строгого контроля.
Машинное обучение делится три типа:
- контролируемое — обучение на наборах размеченных данных с очевидными закономерностями;
- неконтролируемое — обучение на наборах неразмеченных данных без явных закономерностей;
- обучение с подкреплением — последовательное обучение на размеченных и неразмеченных наборах данных.
Для машинного обучения достаточно небольшого объема данных. Процесс обучения разделяется на небольшие этапы, результаты каждого из которых объединяются в блок выходных данных. Признаки должны быть точно определены и созданы пользователем. Выходные данные представляются в виде числа: оценки или классификации.
Глубокое обучение — разновидность машинного обучения с использованием нейронных сетей. Процесс обучения разделен на несколько этапов и имеет структуру с несколькими вводными, скрытыми и выходными слоями.
Модель учится не на исходном наборе данных, а на результатах обучения, полученных на предыдущем этапе — то есть каждый завершенный цикл использует в качестве учителя.
Глубокое обучение отличается от машинного алгоритмом — часть процесса скрыта и не имеет очевидной логики, а пользователь получает результат, который может быть представлен в любом формате: текст, аудио, число.
Для глубокого обучения нужен большой объем размеченных исходных данных и мощное вычислительное оборудование.
Примечание: Cloud.ru предлагает набор сервисов и инструментов для машинного обучения и искусственного интеллекта, в том числе платформу для совместной разработки ML Space, сервис распознавания и синтеза речи SmartSpeech, услугу Data Science as a Service и другие.
- Машинное обучение
- Data Science
- Нейронные сети
Запросите бесплатную консультацию по вашему проекту
Это нейробаза
Любую технологию, связанную с искусственным интеллектом, сегодня принято называть нейросетью. На самом деле это далеко не всегда корректно: например, GPT-4 — языковая модель на базе нейросети. Вместе с научно-исследовательским Институтом искусственного интеллекта AIRI мы подготовили материал, который поможет разобраться в том, какие технологии сегодня используют разработчики систем искусственного интеллекта, и на базовом уровне понять, как устроены последние достижения в этой области.
Вокруг только и говорят что об искусственном интеллекте. Что это такое?
Так называют область компьютерных наук или информатики, которая занимается созданием интеллектуальных систем, способных выполнять задачи, обычно требующие интеллектуальных усилий человека. ИИ использует
Алгоритм — набор инструкций, который может быть выполнен компьютером или другим устройством.
Модель — упрощенное представление реальной системы или явления, которое позволяет анализировать и предсказывать ее поведение.
, которые позволяют компьютерам изучать, анализировать и принимать решения на основе некоторого набора данных.
Иногда под искусственным интеллектом (Artificial Intelligence, AI) ошибочно понимают сильный искусственный интеллект (Artificial General Intelligence, AGI) — систему, которая может «думать и действовать» как человек. На самом деле большинство современных разработок в этой сфере предназначены для выполнения конкретных задач, и многие называют их слабым искусственным интеллектом (Narrow AI) или технологиями искусственного интеллекта (AI Technologies). Например, программа для игры в шахматы не умеет отвечать на вопросы, а чат-бот, имитирующий живого собеседника, — рисовать изображения. Тем не менее постепенно искусственный интеллект становится все более функциональным. Например, языковая модель GPT-4, хотя все еще не может генерировать ничего, кроме текста, умеет обрабатывать не только текстовые запросы, но и изображения.
На сегодняшний день можно выделить три основные области искусственного интеллекта и три сопутствующие им задачи.
Машинное обучение (Machine Learning), глубокое, или глубинное, обучение (Deep Learning) и базисные модели (Foundation Models) — это области в разработке ИИ, которые позволяют системе самостоятельно учиться на основе больших объемов данных и опыта.
Глубокое обучение — это подраздел машинного обучения, использующий сложные нейронные сети для решения самых нетривиальных задач, например распознавания речи и обработки естественного языка. Фундаментальное отличие глубокого обучения от машинного заключается в том, что для машинного обучения измеримые свойства данных (признаки), на которые ИИ должен обратить внимание, задает человек, тогда как глубокое обучение находит их самостоятельно.
- Компьютерное зрение (Computer Vision) — группа задач по разработке алгоритмов и моделей для распознавания и анализа изображений и видео. Сюда относятся технологии распознавания лиц, номерных знаков и, например, диагностика медицинских изображений. Кстати, компьютерное зрение не то же самое, что машинное (подробнее об этом читайте в нашем материале «Смотри внимательно»).
- Обработка естественного языка (Natural Language Processing, NLP) — группа задач, в которых алгоритмы и модели используются для анализа и понимания естественного языка (то есть языка, на котором люди общаются друг с другом). Сюда относятся, например, технологии автоматического перевода, распознавания речи и анализа тональности текста.
Какие технологии и инструменты используют разработчики ИИ?
Нейронные сети — на данный момент, вероятно, основной инструмент в сфере искусственного интеллекта. Как и человеческий мозг, нейронные сети состоят из узлов (нейронов), которые обрабатывают информацию и обмениваются ею друг с другом. В зависимости от задачи разработчики применяют различные архитектуры нейронных сетей.
Например, сверточные нейронные сети (Convolutional Neural Networks, CNN) широко используются для обработки изображений и видео. Это особый класс многослойных нейросетей, способных извлекать из изображений характерные признаки, уменьшать эти данные в размере (это и называется сверткой) и благодаря этому эффективно распознавать объекты и обрабатывать большие объемы данных. Такие нейросети могут, например, находить на видео целующихся людей и помогать ученым восстанавливать позы животных.
- Нейрон — базовый элемент нейронной сети. Он принимает входные данные, обрабатывает их и передает результат следующему нейрону.
Модели машинного обучения (от англ. machine learning model) — это методы, позволяющие компьютерам обучаться на большом количестве данных и благодаря этому делать прогнозы или принимать решения. ML-модели можно использовать, например, для сортировки результатов веб-поиска, прогнозирования цен на недвижимость или определения настроения текста. Для решения более сложных задач, таких как обработка изображений или распознавание речи, они используются в сочетании с нейронными сетями. Модели машинного обучения — важный инструмент для создания систем искусственного интеллекта, которые в том числе применяются в науке (об этом ниже).
- Датасет — набор данных (изображений, текстов, аудиофайлов и так далее), который используется для обучения модели и проверки ее работоспособности. Можно создавать вручную или собирать автоматически из открытых источников.
Базисные модели — это модели машинного обучения, которые используются для решения простых задач, таких как классификация и регрессия. Они могут быть использованы в комбинации с более сложными моделями для улучшения их точности и эффективности.
Генеративные модели (от англ. generative model) — методы искусственного интеллекта, которые используются для создания новых данных (изображений, музыки, текста и прочих) на основе обучающего датасета, состоящего из большого количества данных. Примером больших данных для генеративных моделей могут быть наборы изображений, такие как CIFAR-10, состоящий из 60 000 цветных изображений размером 32×32 пикселя, или ImageNet, который содержит более 1,2 миллиона изображений, разбитых на более чем 1000 категорий.
Генеративно-состязательные сети (от англ. generative adversarial network, GAN) — это разновидность генеративной сети, которая состоит из двух нейронных сетей: генератора, создающего новые данные, например изображения, и дискриминатора, который пытается отличить их от объектов из обучающей выборки. Задача GAN — генерировать такие данные, которые дискриминатор не сумеет опознать как искусственные. Таким образом генеративно-состязательные сети позволяют добиться фотореалистичного результата — например, создавать качественные изображения лиц несуществующих людей.
Наглядный пример работы генеративно-состязательной сети
Трансформерные архитектуры (от англ. transformer architecture)— наиболее сильный тип нейронных сетей на сегодняшний день. Он позволяет более эффективно обрабатывать последовательности данных, таких как текст или речь, за счет параллельных вычислений — в отличие от последовательной обработки в устаревших
Разновидность нейронных сетей, где связи между элементами образуют направленную последовательность.
. Трансформеры используют так называемые слои внимания (от англ. attention layers), позволяющие модели машинного обучения выделять нужное из истории обработки данных и учитывать их в дальнейшем. Именно трансформеры обеспечили прорыв в области автоматической обработки языка и сделали возможным, например, появление GPT-4.
Глубокое, или глубинное, обучение (от англ. deep learning) — это подход к машинному обучению, использующий многократное применение нейронных сетей с большим количеством слоев для решения сложных задач, таких как распознавание речи или обработка изображений.
Говори как разработчик
- Батч — так иногда называют набор данных (датасет), который используется для обучения модели.
Когда про градиент говорят «разлетелся», имеют в виду, что значения градиента в процессе обучения модели стали слишком большими и выходят за пределы оптимальных. Это приводит к проблемам в обучении — модель может пропускать важные детали или давать неверные ответы.
Как эти инструменты используются в реальной жизни?
Не нужно обладать особыми знаниями, чтобы увидеть, как технологии искусственного интеллекта меняют мир. Генеративные нейросети уже помогают дизайнерам (подробнее об этом читайте в материале «Совместный сновидческий процесс»), с помощью языковых моделей, например GPT-4, редактируют тексты и даже создают несложные приложения, а компьютерное зрение и другие алгоритмы обеспечивают движение беспилотных автомобилей. Тем не менее технологии искусственного интеллекта нуждаются в совершенствовании. Этим занимаются не только разработчики, но и исследователи, которые решают проблемы, возникающие на этапах разработки или внедрения технологии.
Например, в большинстве беспилотных автомобилей для оценки расстояния до объектов на дороге используют дорогостоящие датчики — лидары. Их высокая стоимость замедляет внедрение технологии в повседневную жизнь, поэтому компании ищут альтернативные подходы к созданию
Изображение, содержащее информацию о расстоянии до окружающих объектов.
. Один из них предполагает отказ от лидаров в пользу алгоритмов компьютерного зрения. Как раз такое решение предлагают исследователи из научно-исследовательского Института искусственного интеллекта AIRI. Они разработали архитектуру для создания точных карт глубины, которая сочетает преимущества трансформеров и сверточных нейронных сетей, а ее обучение не требует разметки с лидаров (о том, с какими проблемами сталкиваются разработчики беспилотников, читайте в материале «Ваше роботакси подъезжает»).
Технологии искусственного интеллекта активно применяются не только в прикладных целях, но и в фундаментальной науке. В частности, машинное обучение хорошо справляется с задачами моделирования в материаловедении, где его используют, чтобы искать новые материалы с необходимыми свойствами. В прошлом году исследователи AIRI представили нейросетевую модель, которая позволяет находить структуры, близкие к квазикристаллам — промежуточному звену между кристаллами и аморфными веществами, которое, благодаря необычной структуре, обладает уникальными свойствами.
Кроме того, начиная с 1970-х годов исследователи пытались найти способ использовать алгоритмы, чтобы предсказывать структуру белков. По форме белка можно определить его функцию и использовать это знание, например, для создания лекарств. Однако успеха в этой области добились относительно недавно. В 2020 году компания DeepMind представила алгоритм AlphaFold 2, предсказывающий структуры белков по последовательности аминокислот. Появление такого алгоритма — важная ступень в развитии структурной биоинформатики, которая поможет не только в биологии, но и в медицине, ускорив разработку новых лекарств.
Машинное обучение позволяет выполнять и обратную задачу: используя информацию о том, какой должна быть форма белка с необходимой функцией, определить аминокислотный состав для его синтеза. Например, обученная на 280 миллионах белковых последовательностях языковая модель ProGen, статья с описанием которой опубликована в Nature Biotechnology, способна генерировать белки de novo, не существовавшие ранее и обладающие нужными характеристиками.
Еще одна важная задача в биологии — работа с последовательностями ДНК. И если ученым уже вполне доступны языковые модели для последовательностей белков, то для ДНК долгое время в открытом доступе существовала только одна такая разработка, принадлежащая коллективу из США, — модель DNABERT. Исследователи AIRI использовали методы обработки естественного языка, чтобы разработать нейросетевую модель GENA_LM, обученную на самой полной на сегодняшний день сборке генома человека — T2T-CHM13. Проверяя эффективность модели для разных геномных задач, они поняли, что иногда для достижения наилучших результатов требуется увеличивать размер
То есть данных, используемых для обучения модели.
в модели. Так появилась вторая версия GENA на архитектуре BigBird, превосходящая своего предшественника в 8 раз по этому показателю (почти 24 000
То есть элементарных составляющих элементов ДНК и РНК.
Ученые могут использовать данные модели для решения различных исследовательских задач: от поиска участков генома, выполняющих регуляторные функции в процессах считывания РНК, до определения влияния отдельных мутаций на интенсивность работы генов. И в зависимости от поставленной задачи и доступных данных модели на разных архитектурах могут показывать разную эффективность.
Что такое искусственный интеллект (AI)?
Искусственный интеллект – раздел информатики, который занимается решением когнитивных задач, обычно отведенных человеку. К таким задачам относятся обучение, создание и распознавание образов. Современные организации собирают большие объемы данных из различных источников – интеллектуальных датчиков, инструментов мониторинга, системных журналов и контента, созданного человеком. Задача искусственного интеллекта заключается в создании самообучающихся систем, которые извлекают смысл из данных. Затем искусственный интеллект может применять эти знания для решения новых задач подобно человеку. Например, технология искусственного интеллекта может эффективно реагировать на человеческую речь, создавать оригинальные изображения и текст и принимать решения на основе данных, получаемых в реальном времени. Ваша организация может интегрировать возможности искусственного интеллекта в свои приложения, тем самым оптимизируя бизнес-процессы, улучшая качество обслуживания клиентов и ускоряя внедрение инноваций.
Как развивалась технология искусственного интеллекта?
В своей фундаментальной работе 1950 года «Вычислительные машины и разум» Алан Тьюринг рассматривал вероятность того, могут ли машины мыслить. В ней Тьюринг впервые ввел термин искусственный интеллект и представил его как теоретическую и философскую концепцию.
В период с 1957 по 1974 год достижения в области вычислительной техники обеспечили компьютерам возможность хранить больше данных и быстрее их обрабатывать. В течение этого времени ученые продолжали разрабатывать алгоритмы машинного обучения. Прогресс в этой области побудил такие агентства, как Управление перспективных исследовательских проектов Министерства обороны США (DARPA), создать фонд для исследований в области ИИ. Поначалу ученые пытались выяснить, могут ли компьютеры расшифровывать и переводить разговорную речь.
В 1980-е годы благодаря увеличению финансирования и расширению алгоритмического инструментария, используемого в области ИИ, удалось упростить развитие компьютеров. Дэвид Румельхарт и Джон Хопфилд опубликовали свои работы о методах глубокого обучения, в которых показали, что компьютеры могут обучаться на основе накопленного опыта.
В период с 1990 по начало 2000-х годов ученые достигли многих основных целей в сфере ИИ – например, победили действующего чемпиона мира по шахматам. Поскольку вычислительных данных и мощностей сегодня больше, чем в предыдущие десятилетия, исследования в области ИИ стали более распространенными и доступными. Он быстро превращается в общий искусственный интеллект, поэтому программное обеспечение может выполнять сложные задачи – самостоятельно разрабатывать и принимать решения, а также обучаться. Раньше это было по силам только человеку.
Преимущества искусственного интеллекта
Искусственный интеллект может предложить ряд преимуществ в различных отраслях.
Решение сложных проблем
Технология искусственного интеллекта может использовать машинное и глубокое обучение и решать сложные задачи подобно тому, как это делает человек. Искусственный интеллект может обрабатывать большие объемы данных, выявлять закономерности, идентифицировать информацию и давать ответы. Также с его помощью можно решать проблемы в различных областях, например, обнаруживать мошенничество, проводить медицинскую диагностику и бизнес-анализ.
Повышение эффективности бизнеса
В отличие от людей, искусственный интеллект может работать круглосуточно и без снижения производительности. Другими словами, он может выполнять ручные задачи без ошибок. Вы можете поручить ИИ выполнение повторяющихся утомительных задач, чтобы использовать человеческие ресурсы на других направлениях бизнеса, снизить рабочую нагрузку сотрудников и оптимизировать все задачи, связанные с организацией.
Более разумные решения
Искусственный интеллект может использовать машинное обучение, чтобы анализировать большие объемы данных быстрее, чем любой человек. Платформы искусственного интеллекта могут выявлять тенденции, анализировать данные и давать рекомендации, а благодаря прогнозированию данных ИИ помогает выбрать оптимальный вариант дальнейших действий.
Автоматизация бизнес-процессов
С помощью машинного обучения можно обучить искусственный интеллект точному и быстрому выполнению задач, чтобы повысить эффективность бизнеса за счет автоматизации тех его областей, с которыми сотрудникам тяжело или скучно работать. Кроме того, с помощью автоматизации ИИ можно освободить ресурсы сотрудников для выполнения более сложной и творческой работы.
Как искусственный интеллект можно использовать на практике?
Искусственный интеллект применяется в самых разных областях. Ниже приведен перечень примеров, подчеркивающих разнообразие вариантов использования ИИ. Этот список не является исчерпывающим.
Интеллектуальная обработка документов
Интеллектуальная обработка документов (IDP) преобразует неструктурированные форматы документов в полезные данные. Эта технология конвертирует деловые документы, например электронные письма, изображения и PDF-файлы, в структурированную информацию. IDP использует технологии искусственного интеллекта, такие как обработка естественного языка (NLP), глубокое обучение и машинное зрение, для извлечения, классификации и проверки данных.
Например, в Земельном кадастре Ее Величества (HMLR) обрабатываются права собственности на более чем 87 процентов земель Англии и Уэльса. Сотрудники HMLR сравнивают и изучают сложные юридические документы, связанные со сделками с недвижимостью. Организация внедрила приложение с искусственным интеллектом для автоматизации сравнения документов, что позволило сократить время проверки на 50 процентов и ускорить процесс утверждения передачи имущества. Подробнее см. в статье, как HMLR использует Amazon Textract.
Мониторинг производительности приложений (APM)
Мониторинг производительности приложений (APM) – это процесс использования программных инструментов и телеметрических данных для отслеживания производительности критически важных для бизнеса приложений. Инструменты APM на основе искусственного интеллекта используют исторические данные для прогнозирования проблем до того, как они возникнут. Кроме того, они могут помочь разработчикам эффективно решать проблемы в реальном времени. Эта стратегия обеспечивает эффективную работу приложений и устраняет сложности.
Например, компания Atlassian выпускает продукты для оптимизации командной работы и взаимодействия. Atlassian использует инструменты APM на основе ИИ для непрерывного мониторинга приложений, выявления потенциальных проблем и определения степени их серьезности. Благодаря этой функции команды могут быстро реагировать на рекомендации, разработанные с применением машинного обучения, и решать проблемы, связанные со снижением производительности.
Профилактическое обслуживание
Техническое обслуживание по текущему состоянию с помощью ИИ – это процесс использования больших объемов данных для выявления проблем, которые могут привести к простоям операций, систем или сервисов. Техническое обслуживание по текущему состоянию позволяет компаниям устранять потенциальные неполадки до их возникновения, что сокращает время простоев и предотвращает сбои.
Например, компания Baxter задействует 70 производственных площадок по всему миру и работает круглосуточно, обеспечивая поставки медицинского оборудования. Компания Baxter использует техническое обслуживание по текущему состоянию для автоматического выявления аномалий в промышленном оборудовании. Пользователи могут заблаговременно внедрять эффективные решения, чтобы сокращать период простоя оборудования и повышать его эффективность. Чтобы узнать больше, прочитайте, как компания Baxter использует Amazon Monitron.
Медицинские исследования
В медицинских исследованиях ИИ используется для оптимизации процессов, автоматизации повторяющихся задач и обработки огромных объемов данных. Технологии искусственного интеллекта можно использовать в медицинских исследованиях для того, чтобы упростить процесс разработки и создания фармацевтических препаратов, расшифровать медицинские записи и сократить время вывода новых продуктов на рынок.
В качестве примера можно назвать компанию C2i Genomics, которая использует искусственный интеллект для запуска высокомасштабных настраиваемых геномных конвейеров и клинических обследований. Благодаря тому, что вычислительные решения не требуются, исследователи могут сосредоточиться на разработке методов и клинической эффективности. Инженеры также используют ИИ для снижения потребности в ресурсах, сокращения затрат на инженерное обслуживание и невозмещаемых расходов (NRE). Подробнее см. в этой статье.
Бизнес-аналитика
В сфере бизнес-аналитики искусственный интеллект используется для сбора, обработки и анализа сложных наборов данных. Аналитику искусственного интеллекта можно использовать для прогнозирования будущих значений, анализа первопричин данных и сокращения трудоемких процессов.
Например, компания Foxconn использует бизнес-аналитику на основе ИИ для повышения точности прогнозирования. Они добились повышения точности прогнозирования на 8 %, что позволило сэкономить 533 000 USD в год. Компания также использует бизнес-аналитику для сокращения затрат на оплату труда и повышения уровня обслуживания клиентов за счет принятия решений на основе данных.
Каковы основные технологии искусственного интеллекта?
Нейронные сети глубокого обучения – основа технологий искусственного интеллекта. Они повторяют процессы, происходящие в человеческом мозге. В мозге содержатся миллионы нейронов, которые обрабатывают и анализируют информацию. Нейронные сети глубокого обучения состоят из искусственных нейронов, которые обрабатывают информацию. Каждый искусственный нейрон или узел использует математические расчеты для обработки информации и решения сложных задач. Подход глубокого обучения позволяет решать проблемы или автоматизировать задачи, которые обычно требуют человеческого интеллекта.
Вы можете разрабатывать различные технологии искусственного интеллекта, по-разному обучая нейронные сети глубокого обучения. Далее представлены некоторые ключевые технологии на основе нейронных сетей.
Обработка естественного языка
При обработке естественного языка (NLP) используются алгоритмы глубокого обучения для интерпретации, понимания и извлечения смысла из текстовых данных. Технология NLP позволяет обрабатывать тексты, созданные человеком. Она полезна для формирования сводок документов, автоматизации чат-ботов и анализа тональности текстов.
Машинное зрение
Машинное зрение использует методы глубокого обучения для извлечения информации и аналитических данных из видео и изображений. С помощью машинного зрения компьютер может воспринимать изображения, как человек. С помощью машинного зрения можно фильтровать неприемлемый контент в сети, распознавать лица и классифицировать детали изображений. В автомобилях и грузовиках с автопилотом оно необходимо для мониторинга окружающей обстановки и принятия решений за доли секунды.
Генеративный искусственный интеллект
Генеративный ИИ – это системы искусственного интеллекта, способные создавать новый контент и артефакты, такие как изображения, видео, текст и аудио, из простых подсказок. В отличие от прежнего ИИ, который ограничивался анализом данных, генеративный ИИ использует глубокое обучение и обрабатывает большие объемы информации для создания высококачественных творческих решений, похожих на человеческие. Несмотря на то, что технология позволяет создавать интересные творческие приложения, существуют опасения, связанные с предвзятостью, вредоносным контентом и интеллектуальной собственностью. В целом генеративный ИИ имеет более широкие возможности по созданию нового контента и артефактов в стиле, близком к человеческому.
Распознавание речи
Программное обеспечение для распознавания речи использует модели глубокого обучения для интерпретации человеческой речи, идентификации слов и определения смысла. Нейронные сети могут преобразовывать речь в текст и определять тональность голоса. Распознавание речи можно использовать при создании виртуальных помощников и программного обеспечения для колл-центров, чтобы облегчить выполнение поставленных задач и определять смысл сказанного.
Какие проблемы возникают при внедрении ИИ?
Существует ряд проблем, которые усложняют внедрение искусственного интеллекта. Ниже перечислены наиболее распространенные трудности, связанные с внедрением и использованием ИИ.
Управление данными
Политики управления данными должны соответствовать нормативным ограничениям и законам о конфиденциальности. Чтобы внедрить искусственный интеллект, необходимо управлять качеством, конфиденциальностью и безопасностью данных. Вы несете ответственность за данные клиентов и защиту их конфиденциальности. Чтобы управлять безопасностью данных, в вашей организации должны знать, как модели искусственного интеллекта используют эти данные и взаимодействуют с ними на каждом уровне.
Технические трудности
Машинное обучение ИИ требует огромных ресурсов, а для функционирования технологий глубокого обучения необходим высокий порог вычислительной мощности. Необходимо использовать надежную вычислительную инфраструктуру для запуска приложений ИИ и обучения моделей. Вычислительные мощности могут быть дорогостоящими, тем самым ограничивая масштабируемость систем ИИ.
Ограничения данных
Чтобы обучить системы искусственного интеллекта непредвзятому подходу, необходимо ввести огромные объемы данных. Вам потребуется достаточный объем памяти для хранения и обработки обучающих материалов. Кроме того, необходимо внедрить эффективное управление и контроль качества данных, чтобы обеспечить их точность в обучении.
Каковы основные компоненты приложений искусственного интеллекта?
Структура искусственного интеллекта состоит из четырех основных уровней. На каждом из этих уровней каждая отдельная технология выполняет свои задачи. Что же происходит на каждом из уровней?
Уровень 1. Данные
Искусственный интеллект основан на различных технологиях, таких как машинное обучение, обработка естественного языка и распознавание изображений. Центральное место в этих технологиях отводится данным, которые являются основным уровнем ИИ. На этом уровне основное внимание уделяется подготовке данных для приложений искусственного интеллекта. Современные алгоритмы, особенно алгоритмы глубокого обучения, требуют огромных вычислительных ресурсов. Итак, в этот уровень входят аппаратные средства, выполняющие роль подуровня и обеспечивающего необходимую инфраструктуру для обучения моделей ИИ. Вы можете получить доступ к этому уровню как к полностью управляемому сервису от стороннего поставщика облачных услуг.
Уровень 2. Платформы машинного обучения и алгоритмы
Инженеры и специалисты по исследованию данных создают платформы машинного обучения для решения конкретных бизнес-задач. Затем разработчики могут легко создавать и обучать модели, используя готовые функции и классы. Примеры таких платформ – TensorFlow, PyTorch и scikit-learn. Эти платформы являются жизненно важными компонентами архитектуры приложения и предлагают необходимые функции для простого создания и обучения моделей искусственного интеллекта.
Уровень 3. Модели
На уровне моделей разработчик приложения реализует модель искусственного интеллекта и обучает ее, используя данные и алгоритмы предыдущего уровня. От этого уровня зависят возможности искусственного интеллекта по принятию решений.
Ниже приведены некоторые из основных компонентов этого уровня.
Структура модели
Эта структура определяет мощность модели и включает уровни, нейроны и функции активации. В зависимости от проблемы и ресурсов можно выбрать нейронные сети прямого распространения, сверточные нейронные сети (CNN) или другие.
Параметры и функции модели
Для прогнозирования решающее значение имеют полученные в процессе обучения значения, например вес связи нейронов и узлы смещения нейронной сети. Функция потерь оценивает эффективность модели и предназначена для минимизации расхождений между прогнозируемым и реальным результатами.
Оптимизатор
Этот компонент регулирует параметры модели для уменьшения функции потерь. Различные оптимизаторы, такие как градиентный спуск и алгоритм адаптивного градиента (AdaGrad), служат разным целям.
Уровень 4. Прикладной уровень
Четвертый уровень – это прикладной уровень, который представляет собой часть архитектуры ИИ, ориентированную на клиента. Вы можете запрашивать у систем ИИ выполнение определенных задач, генерирование информации, предоставление сведений или принятие решений на основе данных. Благодаря прикладному уровню конечные пользователи могут взаимодействовать с системами искусственного интеллекта.
Как AWS может удовлетворить ваши требования к искусственному интеллекту?
Amazon Web Services (AWS) предоставляет самый полный набор сервисов, инструментов и ресурсов, отвечающих вашим требованиям к технологиям искусственного интеллекта. Благодаря AWS искусственный интеллект становится доступным для организаций любого масштаба и дает возможность разрабатывать инновационные технологии, не заботясь об инфраструктурных ресурсах.
Машинное обучение и искусственный интеллект AWS предлагают сотни сервисов для создания и масштабирования универсальных приложений искусственного интеллекта. Примеры сервисов, которые вы можете использовать, приведены ниже.
- Инструмент тестирования безопасности Amazon CodeGuru – обнаруживайте, отслеживайте и устраняйте уязвимости безопасности кода.
- Детектор мошенничества Amazon – улучшайте модели обнаружения мошенничества в Интернете и боритесь с ним на высшем уровне.
- Amazon Monitron – выявляйте проблемы с инфраструктурой до их возникновения.
- Amazon Rekogniton – автоматизируйте, оптимизируйте и масштабируйте распознавание изображений и анализ видео.
- Amazon Textract – извлекайте печатный текст и анализируйте рукописный, а также собирайте данные из любого документа.
- Amazon Transcribe – преобразовывайте речь в текст, извлекайте ключевую бизнес-информацию из видеофайлов и улучшайте бизнес-результаты.
Начните использовать искусственный интеллект на AWS, создав аккаунт уже сегодня.