ИИ и роботы – «Будущее сейчас»

Первый в мире киборг

В 2002 году профессор кибернетики Кевин Уорвик из Университета Рединга, Великобритания, совершил крупный прорыв в области интерфейсов мозг-компьютер (BCI). Этот знаменательный проект состоял из двух экспериментов, оба из которых были проведены самим профессором Уорвиком.

Первый включал в себя массив из 100 электродов, имплантированных в его руку. Они могли напрямую подключаться к его центральной нервной системе и посылать электрический сигнал за пределы его тела. Используя этот метод, профессор Уорвик успешно манипулировал роботизированной рукой, не используя ничего, кроме нервных импульсов. Дальнейшие эксперименты включали дистанционное управление через Интернет, а также управление инвалидной коляской с электроприводом.

Вторым этапом проекта была прямая искусственная связь между двумя людьми. Это тоже было успешно продемонстрировано. Используя Интернет в качестве посредника, между ним и его женой были отправлены сигналы. Хотя эффекты были незначительными, это был первый случай, когда нервные сигналы были искусственно посланы между двумя людьми. После эксперимента было доказано, что интерфейсы оставляют минимальное повреждение тканей.

Больше…

Прорыв в области компьютерной графики лица

В 2008 году новая технология моделирования была впервые разработана калифорнийской компанией Image Metrics, позволяющей фиксировать и воссоздавать мельчайшие детали выражения лица. Преодоление барьера, известного как “зловещая долина” – явление, основанное на гипотезе, подразумевающей, что робот или другой искусственный объект, выглядящий или действующий примерно как человек (но не точно так, как настоящий), вызывает неприязнь и отвращение у людей-наблюдателей, – теперь можно рассматривать как реальную возможность. Пример этой технологии продемонстрирован в видео, на котором показана полностью созданная компьютером женщина по имени “Эмили”. С дальнейшим прогрессом грань между тем, что кажется реальным, и тем, что просто визуализируется, полностью стирается к 2020 году.

Ученые извлекают изображения непосредственно из мозга

В результате крупного научного прорыва японская компания разработала способ анализа электрических сигналов, посылаемых зрительной корой головного мозга, и преобразования их в цифровые изображения на экране. В одном из экспериментов испытуемым показывали шесть букв в слове “нейрон”. Компьютер успешно восстановил слово на экране, измерив активность их мозга.

Больше…

Роботизированное манипулирование нежесткими объектами

Роботизированное манипулирование нежесткими объектами, конфигурация которых заранее неизвестна, стало возможным в 2010 году. Робот, разработанный в Калифорнийском университете, был продемонстрирован, анализируя полотенца “на лету”, а не получая фиксированный набор движений. Он может сканировать различные формы, цвета и материалы с помощью пары камер высокого разрешения, затем складывать и раскладывать их в аккуратные стопки.

В целях безопасности внедряются интеллектуальные технологии слежения

Спустя двадцать лет после 11 сентября устройства для наблюдения стали обязательным элементом систем безопасности аэропортов, спортивных стадионов и любых мероприятий высокого уровня. Эта технология столкнулась с проблемами с самого начала, поскольку приводила ко множеству ложных тревог – но последние достижения в области неврологии и аналитического компьютерного программного обеспечения значительно повысили точность таких устройств.

Система, основанная на алгоритмах с использованием искусственного интеллекта и распознавания лиц использует многочисленные сенсоры и камеры. Она следит за эмоциональным состоянием человека, выражением лица, жестикуляцией, температурой тела и другими сигналами. Проанализированные в совокупности, эти факторы помогают определить, планирует ли человек совершить преступление. Пионером внедрения таких систем является Китай.

Также активное распространение получают интеллектуальные системы слежения за автомобильным трафиком, распознавания пешеходов на дороге или дтп, различных нарушений правил дорожного движения.

Запуск GPT-4

В июне 2018 года исследователи компании OpenAI, базирующейся в Калифорнии, опубликовали исследование о “Генеративном предварительно обученном трансформере” (GPT). До этого лучшие языковые модели искусственного интеллекта (ИИ) в основном использовали обучение с учителем на основе большого количества вручную размеченных данных. Эта зависимость от обучения с учителем ограничивала их использование на неразмеченных наборах данных, а также делала обучение крайне дорогостоящим и затратным по времени для обучения очень больших моделей.

В отличие от этого подход GPT включал в себя этап ненадзорного генеративного “предварительного” обучения, используемый для установки начальных параметров, а затем этап “настройки” для адаптации этих параметров к целевой задаче. GPT имел 117 миллионов параметров, которые можно было рассматривать как примерно эквивалентные отдельным соединениям в мозгу. Новая архитектура GPT обеспечивала более структурированную память, что приводило к “устойчивой переносимой производительности на различных задачах”.

Исследования OpenAI привели к более продвинутой версии с размером набора данных и количеством параметров в 10 раз больше. Как и ее предшественник, GPT-2 использовал ненадзорную модель трансформатора, обученную создавать текст, предсказывая наиболее вероятное следующее слово в последовательности токенов. Продолжая предсказывать дополнительные слова, он мог соединять полные предложения и абзацы с полностью понятными (и семантически значимыми) утверждениями на естественном языке, несколько похожим на очень продвинутую форму автокоррекции на смартфонах. Большой набор данных позволил GPT-2 выполнять задачи за пределами простого создания текста: такие как ответы на вопросы или краткое изложение и даже перевод между языками в различных конкретных областях без предварительной инструкции.

GPT-3, выпущенный в июне 2020 года, поднял исследования на новый уровень. Он имел количество параметров 175 миллиардов, более чем в 100 раз больше, чем у GPT-2, и требовал 800 ГБ хранилища. Около 60% взвешенного набора данных для предварительного обучения GPT-3 было получено из отфильтрованной версии Common Crawl – открытого хранилища данных веб-сайтов, состоящего из 410 миллиардов байт-парных закодированных токенов. Другие источники текста включали WebText2 – корпус веб-сайтов, связанных с сообщениями Reddit с тремя или более положительными отзывами, а также Википедию и цифровые книги.

The New York Times описала способность GPT-3 генерировать естественно звучащий язык, включая компьютерный код, наряду с поэзией и прозой, не только как «удивительный», «жуткий» и «унизительный», но и как «более чем ужасающий». В обзоре Wired говорится, что от GPT-3 «бегут мурашки по всей Силиконовой долине».

Однако некоторые остались настроены скептически, в том числе сам генеральный директор OpenAI Сэм Альтман, который раскритиковал то, что он назвал «ажиотажем вокруг GPT-3», признав, что он имеет «серьезную слабость и иногда делает очень глупые ошибки… ИИ собирается изменить мир, но GPT-3 — это всего лишь очень ранний проблеск».

Растущее использование технологий автоматической генерации текста, основанных на GPT-3 и других языковых генераторах, привело к спорам об академической честности и о том, как школы и университеты должны оценивать, что представляет собой академические проступки, такие как плагиат. Опасения также возникли из-за возможности распространения дезинформации, в том числе предвзятого, сексистского, расистского и другого вредоносного контента, создаваемого ботами. В одном случае французский медицинский стартап протестировал GPT-3 в качестве медицинского чат-бота, который посоветовал вымышленному пациенту покончить жизнь самоубийством.

Тем не менее, GPT-3 оказалась чрезвычайно впечатляющей технологией во многих областях. Продолжались исследования алгоритмов, что привело к созданию нового прототипа, который пытался уменьшить количество негативных или ложных ответов. ChatGPT, версии 3.5, был запущен в ноябре 2022 года и продемонстрировал улучшенное понимание этики и морали. Он мог предложить более вдумчивые ответы о том, что делать — с учетом законности, чувств и эмоций людей и безопасности всех участников — с четко сформулированными ответами во многих областях знаний. ChatGPT также обладал феноменальными навыками компьютерного кодирования, способного сгенерировать весь макет веб-сайта или подробный сценарий за считанные секунды всего по нескольким запросам пользователя. Однако его фактическая точность оказалась в ряде случаев неравномерной.

GPT-4 появляется в 2023 году, и эксперты по технологиям начали размышлять о том, какими могут быть его возможности. Оценки количества параметров сильно различались — от тех, кто считал, что оно будет таким же или лишь немного больше, чем 175 миллиардов GPT-3, до тех, кто предсказывал еще один огромный скачок, возможно, на сотни триллионов.

В конце концов, GPT-4 оказывается в нижней части этих прогнозов. Однако эффективное масштабирование значительно улучшилось в последние годы, а это означает, что количество параметров само по себе больше не является лучшим показателем производительности языковой модели — схлже с так называемым «мифом о мегагерцах» 2000-х годов, который применялся к скоростям персональных компьютеров. Вместо этого обучение на больших наборах данных теперь более важно.

GPT-4 представляет собой самую впечатляющую языковую модель из когда-либо созданных — она прошла несколько модифицированных версий теста Тьюринга и вызвала широкие общественные дебаты по поводу потенциала искусственного интеллекта в ближайшем будущем. Он имеет большую скорость, более длинное контекстное окно, лучшую точность фактов и улучшенную способность «запоминать» и ссылаться на информацию из предыдущих разговоров. В нем также дополнительно рассматриваются этические проблемы, связанные с более ранними версиями.

Благодаря постоянному повышению эффективности и снижению стоимости оборудования GPT-4 и его производные начинают распространяться в таких приложениях, как обслуживание клиентов и техническая поддержка. Пятое и шестое поколения языковых моделей будут разработаны во второй половине 2020-х годов, что приведёт к созданию действительно человекоподобного ИИ, способного имитировать реального человека почти в 100% случаев.

Больше…

Разработка медицинских нанороботов

Разрабатываются наномасштабные роботы, чьи размеры на порядки меньше размеров ранних микро-версий. Они являются частью программы по улучшению и модернизации системы здравоохранения. В некоторых странах разработка и внедрение этих роботов уже вошли в стадию проведения испытаний на людях и скоро будут одобрены правительством. Они могут быть использованы как для диагностики, так и для лечения. Размер нанороботов позволяет им проникать в ранее недоступные места человеческого тела или же воздействовать на области, которые чересчур восприимчивы для обычных инструментов.

В ближайшие годы самый значимый прорыв произойдет в методах борьбы с раком. С использованием  нанороботов  можно будет обнаружить опухоль на самой ранней стадии, а затем воздействовать на нее с большой точностью. Даже излечение пациентов, которым раньше могли бы поставить диагноз «неизлечимо больной», становится обычным делом. Резко улучшаются возможности диагностики болезней сердца, неврологических расстройств и многих других заболеваний. В сочетании с выдающимися успехами в исследовании стволовых клеток это позволит создать следующее поколение медицинских препаратов с совершенно новым уровнем эффективности.

Нанороботы создаются методом молекулярного наслаивания с использованием позиционно-контролируемого алмазного механосинтеза и алмазоидных нанофабрик. Каждый робот способен самостоятельно перемещаться, используя крошечный моторчик, а также оснащен микроскопическими сенсорами, системой наведения и системой связи.

Роботизированные руки, соответствующие человеческим

В рамках продолжающегося роста уровня потребительской робототехники новых рубежей достигли последние исследования в области искусственного интеллекта и устройств, созданных по образу и подобию биологических организмов. Современные роботы теперь могут выполнять все более широкий круг задач как дома, так и на работе.  Одно из самых важных (и трудных) умений для таких машин – способность распознавать и взаимодействовать с различными физическими объектами. Для таких простых или повторяющихся задач, как, например, производственная линия сборки, решение было достаточно незамысловатым, требующим просто определенных навыков программирования и использования механических систем. Но все  возрастающая сложность ситуаций, с которыми  приходится сталкиваться коммерческим роботам в настоящее время, привело к разработке более сложных механизмов с широким диапазоном возможностей.

Как уже часто бывало, инженеры обратились за идеями для моделирования как формы, так и функциональных особенностей нового робототехнического аппарата собственно к человеческому телу. Так как почти все роботы должны в некотором роде управлять физическими объектами и взаимодействовать с ними, рука стала наиболее часто имитируемой частью человеческого тела. Вместе с сопутствующим программным обеспечением для визуального распознавания механические руки в 2000-х и 2010-х годах уже могли похвастаться некоторыми впечатляющими способностями. Они могли подбирать миниатюрные и хрупкие объекты, ловить предметы, в них брошенные, делать некоторые жесты,  складывать полотенца, наливать напитки и даже готовить пищу.  Несмотря на это, присущая человеческим рукам уникальная природная ловкость и гибкость наряду с практическими ограничениями механических компонентов мешала ученым добиться идеального воспроизведения.

Однако ко второй половине 2020-х годов используемые технологии получили достаточное развитие для того, чтобы преодолеть большинство препятствий, возникавших в предыдущие десятилетия. Примерно в это же время появляются первые лабораторные образцы  механической руки  с возможностями, равными человеческим.  Достижения в области нанотехнологий, миниатюризации и микроэлектроники позволили инженерам обеспечить выполнение практически всех тонких движений живой биологической руки. Приводы преобразования электроэнергии в движение на основе графена, искусственная кожа, тактильные датчики, гибкая электроника и другие инновации были использованы для полноценной имитации реального объекта. Это также явилось результатом лучшего понимания биомеханики человеческих движений при манипуляциях объектами.

Программы искусственного интеллекта, используя программное обеспечение точного визуального восприятия, способны распознавать бесчисленные физические объекты и разумно планировать, как ими можно манипулировать. Исходя из этого, механическая рука может функционировать автономно и самостоятельно приспосабливаться к различным объектам, основываясь на их текстуре, весе и форме. При этом движения механической руки настолько плавны и естественны, что практически неотличимы от движений реальной человеческой руки. Конечно, пока такие системы еще находятся на стадии испытаний, но в будущем они будут чрезвычайно полезны для создания человекоподобных роботов и андроидов. К середине этого века изощренные возможности механических рук позволят машинам взаимодействовать с людьми и окружающей их средой бесчисленным количеством новых способов.

Больше…

Искусственный интеллект, подобный человеческому, становится реальностью

В этом году достигнута важная веха в области создания искусственного интеллекта – компьютер впервые успешно прошел тест Тьюринга. Этот тест проводится человеческим судьёй, который в естественной языковой манере ведет разговор с одним человеком и одним компьютером, каждый из которых пытается казаться человеком. Участники размещаются в изолированных местах.

Информационные технологии развивались экспоненциально в течение многих десятилетий. Это привело к значительному росту таких показателей, как память, мощность процессора, совершенствованию программных алгоритмов, распознавания голоса и общего интеллекта машин. В настоящее время это развитие достигло той стадии, когда независимые судьи буквально не в состоянии сказать, кто является настоящим человеком, а кто нет. Конечно, ответы искусственного интеллекта на определенные «непонятные» вопросы, заданные судьей, могут показаться детскими или глупыми, но, тем не менее, они похожи на человеческие.

Больше…

Распространение Искусственного Интеллекта (ИИ)

Несмотря на недавние экономические потрясения, технология продолжает ускоряться в геометрической прогрессии. К 2030 году темпы изменений будут настолько велики, что покажется, как будто целый век прогресса произошел в первые три десятилетия 21-го века. Научные прорывы происходят с поразительной частотой – особенно в области компьютерной техники, нанотехнологий, медицины и неврологии.

Рабочие места становятся автоматизированными, со значительными улучшениями в скорости, производительности и эффективности. Постоянно растущее использование портативных, беспроводных устройств привело к эволюции почти безбумажного офиса. Между тем, потребность в сверхбыстром обмене информацией создало огромный спрос на видеоконференции. Эта тенденция подкрепляется значительным сокращением авиаперевозок, из-за растущих расходов на топливо и экологические проблемы.

Многие компании сократили свои административные ведомства и заменили их ИИ. Это особенно эффективно в кол центрах и других сферах услуг, где клиентам часто приходится сталкиваться лицом к лицу с “виртуальными сотрудниками” на основе автоматизированного программного обеспечения. Первые версии этих устройств были использованы еще в 1990-х годах – активация простых голосовых команд, – но многие из них в настоящее время представлены на экранах, как полностью живые существа.

Хотя ИИ не достаёт многого от настоящего человека, эти «живые» программы способны говорить «идеальным» голосом очень приятным на слух. Они оснащены множеством опций и, как правило, способны справиться с практически любым запросом, благодаря их передовому голосовому и программному обеспечению распознавания, в сочетании с чрезвычайно мощной системой базы данных.

Поскольку конкуренция увеличивается, эти виртуальные сотрудники становятся мощным маркетинговым инструментом в стремлении обеспечить наилучшее обслуживание клиентов. В дополнение к основным компаниям, индустрия развлечений для взрослых также получает огромное преимущество, и пользуется огромным спросом на их услуги. Научные исследования и разработки в области искусственного интеллекта (и соответствующего аппаратного/программного обеспечения) резко возрастают. Дополнительным преимуществом взаимодействия с этими виртуальными людьми является исчезновение очередей, так как нет необходимости в живых сотрудниках.

Из-за того, что ИИ играет более активную роль в обществе, начинают возникать проблемы “технологической сингулярности” по прогнозам Рэя Курцвейла и других. Эти опасения слегка преувеличены, в манере, схожей с Ошибкой тысячелетия.

Больше…