Программа поиска мысли

Может ли машина быть разумной? И корректен ли вообще подобный вопрос? Ученые больше 60 лет безуспешно ищут ответ. Но попутно узнали много нового о машинах, об интеллекте и о людях

Когда 13-й чемпион мира по шахматам Гарри Каспаров проиграл компьютеру, он не на шутку обиделся и за себя и, кажется, за все человечество. Не сомневавшийся в своей непобедимости, Каспаров уступил в шести партиях супермашине Deep Blue. После окончания матча рассерженный гроссмейстер заявил, что иногда действия Deep Blue были творческими, а отдельные ходы обладали интеллектуальной глубиной, к чему компьютер, пусть и очень сложный и большой, конечно, не способен. Значит, за Deep Blue тайно играли живые шахматисты, сделал вывод Каспаров. Создавшая Deep Blue компания IBM отрицала обвинения: программа играла без человеческой помощи. Тогда, 15 лет назад, казалось, что разум у машин появится совсем скоро.

Может ли машина думать?

Вопрос о том, могут ли машины обладать мышлением, начал волновать людей едва ли не раньше появления первых компьютеров. Андроиды, репликанты, интеллектуальные бортовые компьютеры и целые мыслящие планеты уже более века ведут бурную разумную деятельность в мире научной фантастики. В действительности, несмотря на быстрый технический прогресс последних 60 лет, решающего прорыва в создании искусственного интеллекта так и не произошло. По крайней мере не случилось главное: машины не обрели сознание. Обретут ли когда-нибудь?

Статья «Вычислительные машины и разум», опубликованная в 1950 году в журнале Mind («Разум») начиналась словами: «Зададимся вопросом: «Может ли машина думать?» Для этого необходимо определить, что есть «машина» и что значит «думать». Автором статьи был знаменитый британский ученый Алан Тьюринг, пионер информатики и один из первых идеологов искусственного интеллекта. Дальше в своей статье он шутит : понятие «думать» настолько субъективно, что выяснить, способна ли машина думать, можно, разве что устроив опрос общественного мнения.

Терминам «мышление», «сознание», «разум», «интеллект» очень сложно дать научное определение. Для того чтобы уверенно сказать, способны ли машины обладать этими качествами, нужно найти другую формулировку вопроса, которым Тьюринг начинает свою статью. Такую, чтобы ответ можно было получить путем строгих рассуждений или экспериментов. Первую попытку по-новому поставить вопрос предпринял сам Алан Тьюринг.

Тест Тьюринга Судья (на втором уровне) обменивается сообщениями с человеком (на третьем уровне) и машиной (на первом уровне), не зная где кто. Если судья не может понять, кто из собеседников — человек, считается, что машина прошла тест. Легитимность теста обеспечивается присутствием наблюдателей (второй уровень)

Может ли разум машины работать как человеческий?

Родившийся ровно 100 лет назад, в июне 1912 года, Алан Тьюринг не только наблюдал создание первых вычислительных машин, но и активно участвовал в нем. Во время Второй мировой войны Тьюринг занимался расшифровкой сообщений немецкой армии, закодированных шифровальной машиной «Энигма», позже разрабатывал мощнейшие для своего времени британские компьютеры ACE и MADAM.

Как только появились первые ЭВМ, пошли рассуждения об их потенциальных возможностях в сравнении с человеческими. Казалось очевидным, что способности машин ограничены простейшими операциями. Машины уж точно лишены воображения, инициативного мышления и интуиции. До 1940-х годов Тьюринг соглашался с этими представлениями, но потом резко поменял точку зрения. Вдохновленный достижениями нейробиологии, ученый предположил, что и сам человеческий мозг представляет собой «машину дискретных состояний», то есть процесс человеческого мышления является последовательностью элементарных логических действий. Поскольку все особенности человеческого разума, такие как интуиция и воображение, проявляются в процессе работы мозга, то чем хуже действующий по тем же принципам искусственный разум? Почему бы не столкнуть человека и компьютер в том, что в общепринятом смысле лучше всего выражает умственные способности, — в общении?

В той же статье в Mind Тьюринг описывает игру в притворщиков (imitation game) — развлечение для компании на вечеринке. Двое участников, женщина и мужчина, уходят в разные комнаты. Ведущий обменивается с ними записками. Задача участников — запутать ведущего: мужчина пытается выдать себя за женщину, и наоборот. Цель ведущего — определить, с человеком какого пола он общается. Тьюринг предложил заменить одного из участников компьютером. Если в процессе достаточно продолжительного общения ведущий не сможет понять, с человеком или машиной он ведет переписку, считается, что машина прошла тест.

Тест Тьюринга по-новому ставит вопрос: может ли машина думать? Теперь он звучит так: насколько мыслительные процессы машины похожи на человеческие? Важность формулировки в том, что на такой вопрос можно найти ответ эмпирическим путем. При всей своей простоте предложенная Тьюрингом игра в притворщиков была концептуальным прорывом. Человечество получило возможность, не вдаваясь в философские и психологические вопросы, определить, насколько умны прототипы систем искусственного интеллекта.

У теста Тьюринга много недостатков. Его непросто реализовать на практике, он антропоцентричен, субъективен и слишком сложен. До сих пор ни одной машине не удалось пройти тест Тьюринга, хотя такие попытки предпринимаются постоянно. С 1991 года среди компьютерных программ проводится ежегодный конкурс на прохождение теста Тьюринга, основанный и спонсируемый изобретателем из США Хью Лёбнером. Главный приз до сих пор не вручен, победителями каждый год объявляются программы, показавшие относительный лучший результат. При этом практика конкурса показывает, что обычно это не самые «умные» программы, а те, которые способны имитировать особенности человеческого общения в чате — сокращения, сленг и опечатки. Например, первый победитель конкурса Лёбнера программа Whimsical Conversation приветствовала члена жюри словами: «Здорово, судья! Повеселимся? Как делишки? Как погодка сегодня?» — и в дальнейшей беседе хотя и не демонстрировала чудеса сообразительности, но использовала сленговые выражения, допускала опечатки, в связи с чем была принята двумя членами жюри за человека. В то же время несколько судей приняли за машину девушку, специалиста по творчеству Шекспира: обсуждая одну из заранее заявленных тем — пьесы великого драматурга, — она цитировала внушительные фрагменты текста. Членам жюри показалось, что человек на это не может быть способен.

Современные программы, способные разговаривать с человеком голосом или текстовыми сообщениями (их называют чатботами), конечно, куда более совершенны и сложны, чем Whimsical Conversation. Используя обширные базы данных, они могут поддерживать вполне связную беседу, особенно на специальные темы. Чатбот Анна, живущая на сайте ИКЕА, поможет выбрать диван не хуже живого консультанта, но ее легко смутить. Ваш вопрос: «Сколько тебе лет?» Ответ Анны: «Мне очень жаль, но я предпочитаю не говорить о некоторых вещах. Сейчас как раз такой случай. Спросите меня что-нибудь о товарах и услугах ИКЕА, и я постараюсь Вам помочь».

Бывают и анекдотические случаи. Известный американский психолог Роберт Эпштейн, один из первых администраторов конкурса Лёбнера и редактор книги о тесте Тьюринга, рассказывает, как искал спутницу жизни на сайте знакомств. В 2006-м Эпштейн начал переписываться с женщиной из Нижнего Новгорода по имени Ивана. Ее фотографии были хороши, но после первого же письма от Иваны стало ясно, что английским языком она владеет очень плохо. Эпштейн (потомок эмигрантов из России) не увидел подвоха и продолжал отправлять сообщения, на которые получал развернутые ответы с рассказами об отношениях с мамой и прогулках с друзьями. Психолог несколько раз предлагал девушке встретиться или хотя бы созвониться, но Ивана как будто не обращала на это внимание. Наконец Эптштейн начал что-то подозревать. Он отправил письмо, которое выглядело примерно так: asdf;kj as;kj I;jkj;j ;kasd kljk ;klkj‘klasdfk; asjdfkj. With love, /Robert. На это Ивана как ни в чем не бывало ответила очередной историей о своей маме. Роберт Эпштейн понял, что несколько месяцев вел романтическую переписку с ботом.

До сих пор ни один чатбот не сумел притвориться человеком настолько хорошо, чтобы обмануть предвзятых членов жюри конкурса Лёбнера. Более того, сегодня тест Тьюринга не считается достаточным способом определения наличия мышления у машин. Большинство современных исследователей считают, что успешные в прохождении теста Тьюринга программы не столько обладают интеллектом, сколько умеют хорошо мошенничать. Гипотетически можно представить себе чатбота, снабженного гигантской (но конечной) базой данных всех удобоваримых ответов на любые возможные фразы. Такая программа, если бы она была создана, смогла бы пройти тест Тьюринга, но вряд ли она обладала бы хотя бы зачатками интеллекта.

Наконец, есть еще один недостаток теста Тьюринга. Игра в притворщиков служит для выяснения, насколько человекоподобен интеллект машины. При этом наше бытовое понятие об уме ограничено нашим же воображением. Не имея полноценных инструментов, даже для того чтобы определить и измерить собственный ум, мы продолжаем судить по нему о любом другом. Антропоцентричность представления об интеллекте ведет к его ограниченности.

Благодаря Алану Тьюрингу человечество совершило концептуальный прорыв в исследованиях искусственного интеллекта, получив эмпирическую возможность определять наличие мыслительных процессов у машин. Но содержащиеся в подходе Тьюринга внутренние ограничения ставят перед учеными новые проблемы и заставляют еще раз переформулировать исходный вопрос. Можно ли дать общее определение интеллекту, которое бы не ставило во главу угла человека?

Универсальный тест интеллекта Хосе Эрнандеса-Оральо и Дэвида Доу Перемещая кружок по квадратам, нужно собрать как можно больше положительных вознаграждений.

1. Перед вами несколько квадратов. В одном из них — ваша позиция, обозначенная кружком. Кроме того, в квадратах расставлены символы — звездочка и ромб. На каждом ходе вы можете переставить свою позицию в один из разрешенных правилами квадратов или остаться на месте. Положение символов при этом тоже меняется по определенным законам, которые вам неизвестны 
2. При каждом ходе вы получаете «вознаграждение»: положительное (стрелка вверх), отрицательное (стрелка вниз) или нейтральное (белый кружок)
3. На каждом шаге вы можете переставить кружок не в произвольный квадрат, а только в «разрешенный». Но какова допустимая последовательность перемещений, нужно выяснить в процессе тестирования — это одна из задач. В данном случае допустимая последовательность обозначена пунктирными линиями
4. Вознаграждение зависит от вашего положения относительно звездочки и ромбика. В этом примере, если ваш кружок после очередного хода оказывается в одном квадрате с ромбиком, вы получаете положительное вознаграждение
5. Если рядом со звездочкой — отрицательное

Что такое интеллект?

Даже если говорить только о человеке, представление об интеллекте всегда очень субъективно. Разработчики всевозможных психометрических IQ-тестов постоянно сталкиваются с этой проблемой. Очевидно, что в понятии интеллекта должны учитываться многие факторы, соответствующие разнообразным способностям разума. Люди разных культур, рас и различного пола часто имеют выраженные умственные способности в той или иной области: кому-то легче дается музыка, кому-то математика, кому-то рисование. В каких пропорциях смешать эти качества, чтобы получить универсальную характеристику разума?

Пожалуй, логичнее всего, не пытаясь оценивать отдельные свойства интеллекта, сформулировать в самых общих терминах, для чего интеллект может использоваться. Тогда появится возможность оценить его уровень, судя по эффективности применения.

Шейн Легг и Маркус Хаттер в статье «Универсальный интеллект: определение машинного интеллекта» (Universal Intelligence: A Defi nition of Machine Intelligence), опубликованной в 2007 году, проанализировали 10 определений человеческого интеллекта и попробовали выделить в них общие аспекты. Их оказалось три: интеллект как свойство индивидуума проявляется при взаимодействии со средой, задачей или проблемой; интеллект связан со способностью достигать цель или добиваться «выгоды»; интеллект проявляется при взаимодействии с обстоятельствами, которые заранее не полностью известны индивидууму, другими словами, интеллект связан со способностью к обучению.

Объединив эти аспекты, Легг и Хаттер дали собственное определение интеллекта: «Интеллект есть мера способности индивидуума добиваться цели в различных обстоятельствах (средах)». У этого определения есть два важнейших качества. Во-первых, на его основе можно построить математическую формулу для вычисления интеллекта. Во-вторых, это определение применимо не только к людям, но и к любым искусственным или биологическим системам: к компьютерным программам, животным и даже к разуму внеземного происхождения.

Как же построить по словесному определению математическую формулу? Легг и Хаттер приводят пример интеллектуального взаимодействия с некоторой средой. В воздух подбрасываются две монетки. Вы должны угадать, сколько из них (ни одной, одна или обе) выпадут решками вверх. Если вы угадали, можете забрать обе монеты, они заменяются новыми. Если нет, вы ничего не получаете. Затем монеты подбрасываются снова и игра продолжается. Почему такая игра может что-то сказать о вашем интеллекте? Если игра ведется обычными монетами, которые одинаково часто выпадают и орлом, и решкой, лучше всего каждый раз ставить на то, что решкой ляжет только одна монета (вероятность того, что хотя бы одна монета выпадет решкой составляет 1:2, тогда как остальные исходы имеют вероятность 1:4). Но как быть, если после многократных подбрасываний вы поняли, что монеты (в результате каких-то манипуляций исследователей) заметно чаще выпадают орлом? Тогда нужно сменить стратегию и загадывать каждый раз, что ни одна монета решкой не выпадет. Способность принять решение о перемене манеры поведения в зависимости от обстоятельств — это и есть признак вашего интеллектуального поведения. Другими словами, интеллект проявляется не только и не столько в том, чтобы хорошо играть, сколько в способности понять правила игры.

Авторы предположили, что любое проявление интеллекта можно, подобно игре в две монетки, изобразить в виде взаимодействия индивидуума (агента) и некоторой среды. Это взаимодействие выглядит как последовательность отдельных шагов, каждый из которых состоит из двух частей: во-первых, агент получает информацию о текущем состоянии среды (сколько монеток выпало решкой вверх) и вознаграждение (две монетки либо ничего) в зависимости от своих предыдущих действий (того, что было загадано на прошлом ходе). Во-вторых, оценив состояние среды и полученное вознаграждение, агент совершает определенное действие (загадывает, сколько монеток выпадут решкой в следующий раз), которое изменяет или не изменяет состояние среды на следующем шаге.

Математическая формула уровня интеллекта Легга и Хаттера это, грубо говоря, усредненная сумма всех вознаграждений, которые в течение бесконечного времени агент может получить, взаимодействуя со всеми возможными средами. При этом вознаграждения, полученные в ходе взаимодействия с более сложными средами по принципу бритвы Оккама берутся с меньшим коэффициентом. Кроме того, максимальный размер вознаграждения должен уменьшаться с каждым шагом: чем быстрее вы разберетесь со средой и научитесь выуживать из нее призы, тем вы умнее.

Математическое определение вашего ума учитывает сразу все возможные его проявления: способность сходить в магазин, разгадать сканворд, сыграть в шахматы, сказать тост на юбилее родственника. Каждое из этих действий можно смоделировать в виде взаимодействия с определенной средой. Более тривиальные действия учитываются с большим коэффициентом, и благодаря этому математически ваш уровень интеллекта больше, чем у узкоспециализированного шахматного компьютера Deep Blue. Из всех сред Deep Blue может иметь дело только с игрой в шахматы, которая дает всего один небольшой вклад в ее интеллект. С другой стороны, ваш приятель, который умеет все то же, что и вы, плюс способен обыграть лучших гроссмейстеров, окажется благодаря дополнительному вкладу шахматной среды умнее вас, хоть и не намного. Нужно учитывать, что все среды, как пример с игрой в две монетки, включают в себя элемент случайности. Поэтому приобретенный опыт не имеет для уровня интеллекта решающего значения. Учитывается не ваше умение сделать конкретные покупки в конкретном магазине, а способность в принципе справляться с задачами такого типа.

Плюс этого определения в том, что оно математически корректно и универсально. Гипотетически каждому человеку, обезьяне или машине может быть присвоено число, абсолютный математический IQ. Теперь в определенном смысле мы можем ответить на вопрос, что такое интеллект, предъявив для него математическую формулу. Главный минус определения в том, что практически вычислить по нему уровень интеллекта невозможно, так как нельзя учесть взаимодействие агента со всеми средами, контакт с каждой из которых продолжается в течение бесконечного времени.

Как измерить уровень интеллекта на практике?

Перейдя от теории к практике, то есть создав действующий тест для вычисления уровня математического IQ любой мыслящей системы, мы будем готовы предложить новую формулировку исходного вопроса. Может ли уровень интеллекта машины достигнуть человеческого?

В 2010 году Хосе Эрнандес-Оральо из политехнического университета Валенсии и Дэвид Доу из австралийского Университета Монаш приблизились к тому, чтобы сделать это. В статье «Измерение универсального интеллекта: по направлению ко всевременному тесту интеллекта» (Measuring Universal Intelligence: Towards an Anytime Intelligence Test) они модифицируют определениеинтеллекта Легга и Хаттера и описывают прототип теста для его измерения. Эрнандес-Оральо и Доу предложили учитывать взаимодействие агента не со всеми возможными средами, а только с подборкой из нескольких сред. Для каждого тестируемого создается специальный случайный набор сред различной сложности, который может статистически дать достаточно хорошее представление о способностях индивидуума действовать в любых возможных средах.

Тест Эрнандеса-Оральо и Доу (см. иллюстрацию) мало напоминает привычные испытания IQ. Перед вами несколько квадратов, некоторые из которых содержат символы — треугольник, звездочку и что-то еще. Ваша собственная позиция указана кружком, который также стоит в одном из квадратов. На каждом ходе вы либо передвигаете кружок в другой квадрат, либо остаетесь на месте. В зависимости от вашего хода и положения символов вы получаете либо положительное вознаграждение (зеленая стрелка), либо отрицательное (красная стрелка), либо нейтральное (серый круг). При этом меняются и позиции символов в квадратах.

Ваша задача — за определенное число ходов получить как можно большее вознаграждение. Правило, по которому происходит изменение расстановки символов в квадратах и начисляется вознаграждение, вам неизвестно. Оно неизвестно никому, так как заново создается системой перед началом тестирования. Угадав принцип, который может быть простым (всегда перемещай свою позицию туда, где стоит треугольник) или сложным (не стой на той позиции, где в прошлый раз была звездочка, а два хода назад — треугольник), вы начинаете набирать очки. Передвижение вашей позиции по квадратам на самом деле является моделью вашего поведения в столкновении с какой-то средой. Это может быть и выбор сока на полке магазина, и принятие решения об очередном ходе в шахматах. Кружочками и квадратиками можно условно изобразить интеллектуальную среду почти любой сложности.

Эрнандес-Оральо и Доу подчеркивают, что тест еще не готов и пока не может служить для практического определения математического IQ. Первые эксперименты провалились: компьютерная программа, охарактеризованная самим Эрнандесом-Оральо как «довольно тупая», показала лучший результат, чем 20 добровольцев. Но работы над универсальным тестом интеллекта продолжаются.

Снова переформулировав вопрос, мы отказались от попытки заглянуть в устройство интеллекта, зато в перспективе получили возможность его вычислить и сравнить у людей и машин. Хороша ли эта постановка вопроса? Преимущество в том, что она предполагает однозначный ответ. Эрнандес-Оральо уже знает, каким он будет: «Большинство ученых сегодня считает, что рано или поздно машины обгонят людей по уровню интеллекта. Нет серьезных научных причин, которые могли бы этому помешать, разве что кое-какие нестандартные философские аргументы. Самое важное — когда и как это случится. И насколько именно машины станут умнее нас». Недостаток в том, что этот ответ сложно интерпретировать. В романе фантаста Дугласа Адамса «Автостопом по Галактике» совершенный сверхкомпьютер Deep Thought в течение семи с половиной миллионов лет думает над «главным вопросом жизни, Вселенной и всего такого» и наконец отвечает: 42. Подобно этому искусственному разуму, тест Эрнандеса-Оральо и Доу дает нам слишком мало конкретной информации. Мы все еще не знаем, какими путями будет развиваться машинный разум. Мы не сможем использовать универсальный тест для того, чтобы построить машину, способную пройти тест Тьюринга.

Ответ в вопросе

Значит ли это, что работа над созданием искусственного интеллекта зашла в тупик? Скорее всего, это тот случай, когда процесс поиска не менее важен, чем конечный ответ. Заслуга Алана Тьюринга в том, что он первый задумался над необходимостью изменить постановку вопроса, может ли машина думать. Тьюринг спросил: «Могут ли мыслительные процессы машины быть схожими с человеческими?» Субъективность теста Тьюринга дала стимул новым поискам правильной постановки вопроса. Подход Эрнандеса-Оральо и Доу, смешавший воедино большинство результатов, достигнутых исследователями к началу XXI века, в том числе математическое определение, данное Хаттером и Леггом, дал путь к объективному, неантропоцентричному измерению интеллекта любой биологической или искусственной системы, а значит, и способ найти ответ на новый вариант вопроса: «Могут ли машины по уровню интеллекта догнать людей?» Ответ, когда он будет получен, ничего не скажет о том, может ли машина думать. Мы так и не знаем, что означает «думать» или «обладать сознанием», и не можем сказать, будут ли разумны те машины, которые обгонят людей по уровню интеллекта. Предстоит задавать новые вопросы. У них будут свои недостатки, однако, пытаясь ответить на них, мы узнаем еще больше об искусственном интеллекте и человеческом сознании. Возможно, когда-нибудь мы найдем верную формулировку, но, как писал Роберт Шекли, «для того чтобы правильно задать вопрос, нужно знать большую часть ответа на него».

Иллюстрации: Павел Шевелев

 
# Вопрос-Ответ