Правь и словом, и жестом
Виртуальных помощников научили ловить мысли на лету
На протяжении последних десяти лет профессор доктор Вольфганг Вальстер твердо придерживается определенных принципов: компьютер должен понимать человека, какие бы языки не использовал последний (принцип мультилингвальности) и какими бы невербальными средствами выражения эмоций он не пользовался (принцип мультимодальности). Фото: DFKI |
«Не наше дело производить гаджеты, мы лишь создаем новые технологии», — скромно сказал о достижениях своих коллег европейским журналистам глава Немецкого исследовательского центра искусственного интеллекта (DFKI, ) профессор Вольфганг Вальстер ().
Однако сами эти «гаджеты» журналистам также были представлены: магазин будущего, «умная» квартира и машина, компьютерные игры нового поколения. Всё это последние совместные разработки DFKI и Института информатики Общества им. Макса Планка () с партнерами, которые выводят Германию на передовые рубежи в области «computer science». Оба института находятся на территории Университета Саарбрюккена (), что позволяет его ученым разрабатывать новые решения, реализуя их в программах, и сотрудничать с профессионалами из других областей — физиками, химиками, биологами, лингвистами и психологами. И если в Институте информатики занимаются в основном фундаментальными исследованиями, то DFKI ориентируется на их применения в конкретных технических устройствах.
Поговорите со своей техникой
Представьте, вы на машине торопитесь в офис, продираетесь сквозь запруженные улицы проснувшегося города и мечтаете начать рабочий день с песни «Queen», причем любимой. Вам даже не придется отрывать руки от руля, достаточно четко произнести миникомпьютеру: «Поставь мне „I’m Going Slightly Mad“!», и зазвучит музыка. И если песни не окажется в вашей коллекции дисков, компьютер быстро выудит её из «всемирной паутины». Неплохо?
Современные могут хранить огромное количество данных, но возможности пользовательских интерфейсов, которые, собственно, должны потребителя направлять в информационных «джунглях», ограничены. Ученые из DFKI предлагают свою разработку для общения с техникой под названием . Это мультилингвальная система с комбинированным вводом данных, которая почти мгновенно обрабатывает голосовые команды и позволяет вам управлять всеми основными функциями MP3-плейера (естественно, при этом можно пользоваться и сенсорным экраном). Мы наблюдали, как это всё работает на демонстрационном BMW. Разработчики предлагали системе подготовить подборку песен европейских рок-групп из Интернета, затем проиграть ту, что была написана в прошлом году. Система реагировала практически мгновенно.
Профессор доктор Франк Кирхнер в студенческие годы изучал не только математику и информатику, но также и нейробиологию. Теперь он считает, что, хотя человеческий организм пока невозможно понять, можно смоделировать некоторые его функции. Фото: DFKI |
Для разработки новых пользовательских интерфейсов, значительно упрощающих общение человека с техники, при DFKI в. июле 2008 года была создана специальная компания . Её главная цель — дать пользователям возможность выбора, общаться ли с ней, отдавая приказы голосом или жестикулируя, с помощью клавиатуры, мышки или комбинируя перечисленное. Смысл используемой технологии в том, чтобы выделить из мультимодального потока информации технические детали содержания.
Эта технология поможет превратить вашу гостиную в интерактивный информационно-развлекательный центр. «Вы можете спокойно уйти вечером в гости, дав указание телевизору перед выходом: «Запиши мне вечером последнюю серию «Симпсонов», — пояснил нам её преимущества в обыденной жизни разработчик интерактивных интерфейсов Йохен Штайгнер (), один из четырех основателей компании SemVox.
Виртуальный покер
Систему речевого синтеза, да ещё способную передавать эмоции, можно увидеть в действии в виртуальном казино: там вам предложат сыграть в покер с компьютерными персонажами — Сэмом и Максом. Вы получаете в руки 52 покерные карты, которые отличаются от обычных встроенными чипами — RFID-метками. Технология RFID позволяет идентифицировать объект с помощью радиосигналов. Занятно наблюдать, как во время игры, в зависимости от развития ситуации, меняется эмоциональное состояние виртуальных игроков, они синтетическими голосами по-разному комментируют развитие игры, и, как настоящие игроки, иногда блефуют.
Виртуальные игроки в покер похожи на вполне реальных не только на вид. Они способны на многое, даже на умеренное жульничество. Иллюстрация: DFKI |
Это одно из достижений в рамках проекта , которым занимается DFKI с коллегами из Берлина и Аугсбурга. Оно открывает новые возможности для следующего поколения компьютерных игр. Главный компонент IDEAS4Games — это авторские разработки в области искусственного интеллекта SceneMaker, на основе которого созданы интерактивные применения.
Для того чтобы подчеркнуть выразительность виртуальных персонажей в компьютерной игре, разработчики использовали новейшие методы системы речевого синтеза и усовершенствованное моделирование эмоций. В сочетании с авторскими разработками получается неплохой результат — гибко построенный диалог и улучшенные реакции виртуальных персонажей. Структура речевого синтеза строилась на основе системы MARY (), первоначально разработанной исследователями из Лаборатории языковых технологий DFKI () в сотрудничестве с Институтом фонетики () Университета Саарбрюккена, а для передачи эмоционального настроя виртуальных персонажей ученые использовали компьютерную модель ALMA (). Эмоции и настроение игроков рассчитываются в режиме реального времени на основе событий игры и в соответствии с 34 правилам покера.
«Наша цель — создать виртуальных персонажей, которые смогут полноценно участвовать в разговоре с пользователем, то есть реагировать не только на содержание фраз, но и на выражение лица собеседника, тембр и интонации голоса, поведение, и, в конце концов, способных разобраться, когда человек улыбается, а когда злится. Для этого вместе с европейскими коллегами мы разрабатываем систему «внимательного искусственного слушателя» () в рамках проекта «устойчивого эмоционально-окрашенного диалого человек-машина с использованием невербальных средств выражения» (). Мы уже близки к тому, чтобы научить компьютер вести нормальный разговор», — уверен участник проекта Марк Шрёдер ().
Полет над Google Earth
«Не хотите за пару минут слетать в Москву из Саарбрюккена, прямо до своего дома и прямо сейчас?» — спрашивают симпатичные ребята у экрана Google Earth. Матье Дерю () и Симон Бергвайлер () из Лаборатории тактильных интерфейсов () в DFKI — чемпионы по просмотрам . Молодые исследователи использовали одну из последних разработок игровой компании «Нинтендо» (Nintendo), предназначенную для занятий фитнесом и видеоигр, — так называемый игровой манипулятор .
Разобраться в современном магазине, где продаются музыкальные записи, довольно трудно без посторонней и квалифицированной помощи. Фото (): |
Недорогое входное устройство, удобное в использовании — это небольшая платформа со встроенными датчиками движения. Они отслеживают, как человек меняет свое положение — наклоняется вперед, назад, вправо или влево — и передают компьютеру, на котором установлено специальное программное обеспечение. Встаешь на доску, смотришь на экран с картой Google Earth и, меняя положение корпуса (как заядлый серфер), направляешься к родному дому, пролетая над Европой. Нажимая на кнопочки, можно менять высоту полета. А фанат компьютерных игр в стерео-очках перед экраном-полусферой почувствует себя участником виртуального сюжета.
Надо отметить, что большой интерес к блестящей разработке ученых проявили не только музеи и авторы компьютерных игр. В больницах прибор можно использовать для реабилитации пациентов с нарушениями вестибулярного аппарата. «Мы не сомневаемся, что нашему примеру последуют многие ученые, подхватят и разовьют наши идеи», — уверены ребята.
Бетховен и миллиарды байт: поисковая служба в мире музыки
Забыл название песни, которая крутится в голове с утра? Или автора прозвучавшей мелодии? Насвисти или напой её компьютеру, и он выдаст тебе все, что «знает»: автора, название, всех исполнителей произведений, которые есть в его музыкальной базе данных. Такую удивительную поисковую систему разрабатывает Майнард Мюллер (), старший исследователь Института информатики.
Как найти нужные музыкальные диски в базе данных по нескольким тактам — небольшому аудио фрагменту? Можно ли сравнить разные исполнения музыкального произведения, синхронизовать их по времени? Как автоматически обработать на компьютере структуру музыкального произведения? Эти вопросы интересуют и любителя музыки, и профессионального музыканта.
«Математика дает нам необходимые средства, чтобы выработать способы решения этих проблем и использовать их для конкретных мелодий. Мне в этом помогают наши прежние исследования в группе Михаэля Клаузена () из Боннского университета в области аудио обработки сигналов, теории алгоритмических представлений, алгебраической теории сложности и Фурье-преобразований», — рассказывает Мюллер.
Немецкие консерватории заинтересовались необычными разработками — хорошее подспорье на занятиях по музыкальной литературе.
Настоящий холодильник должен не только помнить, что у него внутри, но и уметь напоминать хозяевами, когда наступает время пополнять запасы. Фото: DFKI |
Магазин будущего
«Умная» тележка для продуктов поможет выбрать нужный товар из составленного вами списка, проведет к нужной полке и выдаст всю . расскажет о вкусовом букете и тонкостях производства алкогольных напитков, сравнит вино разных урожаев и посоветует, к какому блюду его лучше подать. Холодильники магазина будут хранить сведения об , сообщат, когда они оказались в магазине, сколько их можно хранить и при каких условиях. Да и сами продукты могут немало поведать о себе: где и когда изготовлены, на каком складе хранились, в каком сочетании особенно вкусны, на какой ассортимент . И, конечно, в вашем распоряжении будет виртуальный помощник, который объяснит, на какие продукты может быть аллергия, а в каких содержится ГМО, консерванты и красители.
Этими новшествами вы скоро сможете воспользоваться в магазинах немецкой торговой сети GLOBUS SB. В сотрудничестве с её представителями в DFKI была создана Лаборатория торговых инноваций (). Ученые вместе с профессионалами из области торговли работают над несколькими проектами для магазина будущего, который разместится на территории в пятьсот квадратных метров.
Разумеется, для такого магазина нужно много разнообразной электроники — сенсорных экранов, RFID-меток на продуктах и в полу (для навигации), антенн на полках, датчиков температуры… Но главное — это специализированное программное обеспечение.
Знакомство с «сomputer science» по-немецки завершилось для нас в знаменитом замке Дагштуль или Центре Лейбница по информатике (), который называют Меккой информатики: в нем каждый месяц проходят международные конференции, а имена всех приглашенных в замок заносятся в «Книгу Дагштуля». «Мы и наши европейские коллеги вышли вперед в этой области потому, что наши исследования позволяют создавать уже сегодня работающие технологии», — заверил меня на прощание профессор Райнхард Вильгельм (), показывая достопримечательности знаменитого замка, научным директором которого он является.
Ольга Баклицкая-Каменева, 04.02.2009
Германия на Карте «Вокруг Света», в Энциклопедии, в Фотобиблиотеке, а также:
| в Телеграфе: | в журнале: | в телепередаче: |
|---|---|---|
-
Нежданное богатство
Выход Facebook на биржу сделает мультимиллионером художника расписавшего стены офиса компании
-
Российское посольство атаковано
На территорию посольства РФ в Ливии ворвались протестующие против вето России на резолюцию по Сирии
-
Смартфон из бамбука
Его сделал лондонский студент-дизайнер
Любовь длиной в 6 тыс. лет
В итальянском музее выставлены скелеты любовников эпохи неолита...
Найдено золото Колчака
На дне озера Байкал обнаружены блестящие предметы
Опять нашли Антлантиду
Под болотами на южном берегу Испании
|
Голос России |
|
INFOX.ru - новые новости |






