Хронограф
18152229
29162330
310172431
4111825
5121926
6132027
7142128

<декабрь>

Путеводители

Правь и словом, и жестом

Виртуальных помощников научили ловить мысли на лету

На протяжении последних десяти лет профессор доктор Вольфганг Вальстер твердо  придерживается определенных принципов: компьютер должен понимать человека, какие бы языки не использовал последний (принцип мультилингвальности) и какими бы невербальными средствами выражения эмоций он не пользовался (принцип мультимодальности). Фото: DFKI

«Не наше дело производить гаджеты, мы лишь создаем новые технологии», — скромно сказал о достижениях своих коллег европейским журналистам глава Немецкого исследовательского центра искусственного интеллекта (DFKI, Das Deutsche Forschungszentrum für Künstliche Intelligenz) профессор Вольфганг Вальстер (Wolfgang Wahlster).

Однако сами эти «гаджеты» журналистам также были представлены: магазин будущего, «умная» квартира и машина, компьютерные игры нового поколения. Всё это последние совместные разработки DFKI и Института информатики Общества им. Макса Планка (Max-Planck-Institut für Informatik) с партнерами, которые выводят Германию на передовые рубежи в области «computer science». Оба института находятся на территории Университета Саарбрюккена (Universität des Saarlandes), что позволяет его ученым разрабатывать новые решения, реализуя их в программах, и сотрудничать с профессионалами из других областей — физиками, химиками, биологами, лингвистами и психологами. И если в Институте информатики занимаются в основном фундаментальными исследованиями, то DFKI ориентируется на их применения в конкретных технических устройствах.

Поговорите со своей техникой

Представьте, вы на машине торопитесь в офис, продираетесь сквозь запруженные улицы проснувшегося города и мечтаете начать рабочий день с песни «Queen», причем любимой. Вам даже не придется отрывать руки от руля, достаточно четко произнести миникомпьютеру: «Поставь мне „I’m Going Slightly Mad“!», и зазвучит музыка. И если песни не окажется в вашей коллекции дисков, компьютер быстро выудит её из «всемирной паутины». Неплохо?

Современные MP3-плейеры могут хранить огромное количество данных, но возможности пользовательских интерфейсов, которые, собственно, должны потребителя направлять в информационных «джунглях», ограничены. Ученые из DFKI предлагают свою разработку для общения с техникой под названием «BabbleTunes». Это мультилингвальная система с комбинированным вводом данных, которая почти мгновенно обрабатывает голосовые команды и позволяет вам управлять всеми основными функциями MP3-плейера (естественно, при этом можно пользоваться и сенсорным экраном). Мы наблюдали, как это всё работает на демонстрационном BMW. Разработчики предлагали системе подготовить подборку песен европейских рок-групп из Интернета, затем проиграть ту, что была написана в прошлом году. Система реагировала практически мгновенно.

Профессор доктор Франк Кирхнер в студенческие годы изучал не только математику и информатику, но также и нейробиологию. Теперь он считает, что, хотя человеческий организм пока невозможно понять, можно смоделировать некоторые его функции. Фото: DFKI

Для разработки новых пользовательских интерфейсов, значительно упрощающих общение человека с техники, при DFKI в. июле 2008 года была создана специальная компания SemVox GmbH. Её главная цель — дать пользователям возможность выбора, общаться ли с ней, отдавая приказы голосом или жестикулируя, с помощью клавиатуры, мышки или комбинируя перечисленное. Смысл используемой технологии в том, чтобы выделить из мультимодального потока информации технические детали содержания.

Эта технология поможет превратить вашу гостиную в интерактивный информационно-развлекательный центр. «Вы можете спокойно уйти вечером в гости, дав указание телевизору перед выходом: «Запиши мне вечером последнюю серию «Симпсонов», — пояснил нам её преимущества в обыденной жизни разработчик интерактивных интерфейсов Йохен Штайгнер (Jochen Steigner), один из четырех основателей компании SemVox.

Виртуальный покер

Систему речевого синтеза, да ещё способную передавать эмоции, можно увидеть в действии в виртуальном казино: там вам предложат сыграть в покер с компьютерными персонажами — Сэмом и Максом. Вы получаете в руки 52 покерные карты, которые отличаются от обычных встроенными чипами — RFID-метками. Технология RFID позволяет идентифицировать объект с помощью радиосигналов. Занятно наблюдать, как во время игры, в зависимости от развития ситуации, меняется эмоциональное состояние виртуальных игроков, они синтетическими голосами по-разному комментируют развитие игры, и, как настоящие игроки, иногда блефуют.

Виртуальные игроки в покер похожи на вполне реальных не только на вид. Они способны на многое, даже на умеренное жульничество. Иллюстрация: DFKI 

Это одно из достижений в рамках проекта IDEAS4Games, которым занимается DFKI с коллегами из Берлина и Аугсбурга. Оно открывает новые возможности для следующего поколения компьютерных игр. Главный компонент IDEAS4Games — это авторские разработки в области искусственного интеллекта SceneMaker, на основе которого созданы интерактивные применения.

Для того чтобы подчеркнуть выразительность виртуальных персонажей в компьютерной игре, разработчики использовали новейшие методы системы речевого синтеза и усовершенствованное моделирование эмоций. В сочетании с авторскими разработками получается неплохой результат — гибко построенный диалог и улучшенные реакции виртуальных персонажей. Структура речевого синтеза строилась на основе системы MARY (Modular Architecture for Research on speech sYnthesis), первоначально разработанной исследователями из Лаборатории языковых технологий DFKI (Language Technology lab) в сотрудничестве с Институтом фонетики (Institute of Phonetics) Университета Саарбрюккена, а для передачи эмоционального настроя виртуальных персонажей ученые использовали компьютерную модель ALMA (A Layered Model of Affect). Эмоции и настроение игроков рассчитываются в режиме реального времени на основе событий игры и в соответствии с 34 правилам покера.

«Наша цель — создать виртуальных персонажей, которые смогут полноценно участвовать в разговоре с пользователем, то есть реагировать не только на содержание фраз, но и на выражение лица собеседника, тембр и интонации голоса, поведение, и, в конце концов, способных разобраться, когда человек улыбается, а когда злится. Для этого вместе с европейскими коллегами мы разрабатываем систему «внимательного искусственного слушателя» (SAL, Sensitive Artificial Listener) в рамках проекта «устойчивого эмоционально-окрашенного диалого человек-машина с использованием невербальных средств выражения» (SEMAINE, Sustained Emotionally coloured Machine-human Interaction using Nonverbal Expression). Мы уже близки к тому, чтобы научить компьютер вести нормальный разговор», — уверен участник проекта Марк Шрёдер (Marc Schröder).

Полет над Google Earth

«Не хотите за пару минут слетать в Москву из Саарбрюккена, прямо до своего дома и прямо сейчас?» — спрашивают симпатичные ребята у экрана Google Earth. Матье Дерю (Matthieu Deru) и Симон Бергвайлер (Simon Bergweiler) из Лаборатории тактильных интерфейсов (Advanced Tangible Interface Lab, AdvanTI–Lab) в DFKI — чемпионы по просмотрам роликов института на Youtube. Молодые исследователи использовали одну из последних разработок игровой компании «Нинтендо» (Nintendo), предназначенную для занятий фитнесом и видеоигр, — так называемый игровой манипулятор Wii Balance Board.

Разобраться в современном магазине, где продаются музыкальные записи, довольно трудно без посторонней и квалифицированной помощи. Фото (Creative Commons license): Josh Gross

Недорогое входное устройство, удобное в использовании — это небольшая платформа со встроенными датчиками движения. Они отслеживают, как человек меняет свое положение — наклоняется вперед, назад, вправо или влево — и передают компьютеру, на котором установлено специальное программное обеспечение. Встаешь на доску, смотришь на экран с картой Google Earth и, меняя положение корпуса (как заядлый серфер), направляешься к родному дому, пролетая над Европой. Нажимая на кнопочки, можно менять высоту полета. А фанат компьютерных игр в стерео-очках перед экраном-полусферой почувствует себя участником виртуального сюжета.

Надо отметить, что большой интерес к блестящей разработке ученых проявили не только музеи и авторы компьютерных игр. В больницах прибор можно использовать для реабилитации пациентов с нарушениями вестибулярного аппарата. «Мы не сомневаемся, что нашему примеру последуют многие ученые, подхватят и разовьют наши идеи», — уверены ребята.

Бетховен и миллиарды байт: поисковая служба в мире музыки

Забыл название песни, которая крутится в голове с утра? Или автора прозвучавшей мелодии? Насвисти или напой её компьютеру, и он выдаст тебе все, что «знает»: автора, название, всех исполнителей произведений, которые есть в его музыкальной базе данных. Такую удивительную поисковую систему разрабатывает Майнард Мюллер (Meinard Müller), старший исследователь Института информатики.

Как найти нужные музыкальные диски в базе данных по нескольким тактам — небольшому аудио фрагменту? Можно ли сравнить разные исполнения музыкального произведения, синхронизовать их по времени? Как автоматически обработать на компьютере структуру музыкального произведения? Эти вопросы интересуют и любителя музыки, и профессионального музыканта.

«Математика дает нам необходимые средства, чтобы выработать способы решения этих проблем и использовать их для конкретных мелодий. Мне в этом помогают наши прежние исследования в группе Михаэля Клаузена (Michael Clausen) из Боннского университета в области аудио обработки сигналов, теории алгоритмических представлений, алгебраической теории сложности и Фурье-преобразований», — рассказывает Мюллер.

Немецкие консерватории заинтересовались необычными разработками — хорошее подспорье на занятиях по музыкальной литературе.

Настоящий холодильник должен не только помнить, что у него внутри, но и уметь напоминать хозяевами, когда наступает время пополнять запасы. Фото: DFKI

Магазин будущего

«Умная» тележка для продуктов поможет выбрать нужный товар из составленного вами списка, проведет к нужной полке и выдаст всю информацию о покупке. Цифровой сомелье расскажет о вкусовом букете и тонкостях производства алкогольных напитков, сравнит вино разных урожаев и посоветует, к какому блюду его лучше подать. Холодильники магазина будут хранить сведения об «истории» продуктов, сообщат, когда они оказались в магазине, сколько их можно хранить и при каких условиях. Да и сами продукты могут немало поведать о себе: где и когда изготовлены, на каком складе хранились, в каком сочетании особенно вкусны, на какой ассортимент объявлена скидка. И, конечно, в вашем распоряжении будет виртуальный помощник, который объяснит, на какие продукты может быть аллергия, а в каких содержится ГМО, консерванты и красители.

Этими новшествами вы скоро сможете воспользоваться в магазинах немецкой торговой сети GLOBUS SB. В сотрудничестве с её представителями в DFKI была создана Лаборатория торговых инноваций (IRL, Innovative Retail Laboratory). Ученые вместе с профессионалами из области торговли работают над несколькими проектами для магазина будущего, который разместится на территории в пятьсот квадратных метров.

Разумеется, для такого магазина нужно много разнообразной электроники — сенсорных экранов, RFID-меток на продуктах и в полу (для навигации), антенн на полках, датчиков температуры… Но главное — это специализированное программное обеспечение.

Знакомство с «сomputer science» по-немецки завершилось для нас в знаменитом замке Дагштуль или Центре Лейбница по информатике (Schloss Dagstuhl — Leibniz-Zentrum für Informatik GmbH), который называют Меккой информатики: в нем каждый месяц проходят международные конференции, а имена всех приглашенных в замок заносятся в «Книгу Дагштуля». «Мы и наши европейские коллеги вышли вперед в этой области потому, что наши исследования позволяют создавать уже сегодня работающие технологии», — заверил меня на прощание профессор Райнхард Вильгельм (Reinhard Wilhelm), показывая достопримечательности знаменитого замка, научным директором которого он является.

Ольга Баклицкая-Каменева, 04.02.2009

 

Новости партнёров