Wolfram Alpha - новый тип поисковиков

15 мая 2009 года в Интернете появился, наверное, самый многообещающий стартап со времен Google. Имя талантливого новичка — Wolfram Alpha («Вольфрам Альфа»). Создатели гордо называют его «движок вычислительных знаний» (computational knowledge engine). Сервис, доступный по адресу www.wolframalpha.com, умеет искать ответы на вопросы. Само по себе это звучитне слишком многообещающе: ниша поисковых систем в Интернете давно занята Google и Yahoo! (в России к ним добавляется «Яндекс», а в Китае — Baidu). Но суть в том, что Wolfram не является поисковым сервисом в привычном смысле. Цель этого ресурса состоит в предоставлении любому человеку систематизированных знаний, вычисляемых в реальном времени. Поисковик содержит множество данных об окружающем мире, умеет сопоставлять, визуализировать и комбинировать их, давая ответы на множество вопросов, встающих как перед учеными, так и самыми обыкновенными людьми. При этом Wolfram ищет ответы на вопросы не в Интернете, а в собственной гигантской базе данных. По сути, сам сайт www.wolframalpha.com представляет собой не что иное, как интерфейс потрясающей своими объемами экспертной системы. В ней содержится свыше десяти триллионов элементов данных — цифр и фактов, а также более пятидесяти тысяч типов алгоритмов и моделей. О гигантском объеме работы, проделанной разработчиками, красноречиво свидетельствует тот факт, что трудитьсянад базой данных поисковика они начали более пяти лет назад.

В работе
Вот простой пример осведомленности Wolfram. Введите в поисковой строке название какого-нибудь города — кстати, это первое, что создатели системы советуют сделать при тестировании их детища. Нью-Йорк, Сиэтл, Иркутск или Москва — неважно, что вы выберете. Единственное условие — вводить названия нужно латинскими буквами, поскольку с пониманием кириллицы у «Альфы» пока проблемы (их обещают решить в самое ближайшее время). После этого моментально, без перезагрузки страницы (благодаряиспользованию AJAX), на экране начинают появляться данные, связанные с запросом: из глубин баз данных извлекается информация о численности населения, дате основания, географическом положении и текущей погоде. При этом на основании данных о ваших собственных координатах (по всей видимости, географическое положение пользователя определяется по его IP-адресу) сервис сам решит, какую именно Москву вы имеете в виду — столицу России или небольшой городок в штате Пенсильвания.
Информация о географических объектах включает не только цифры, но и карту — правда, качество ее детализации явно оставляет желать лучшего. Вообще, Wolfram предоставляет много графической информации: пользователь может полюбоваться на схематичное изображение молекул, диаграмму популярности того или иного человеческого имени, тикеты биржевых котировок и даже ноты. На основании анализа запроса поисковик (создатели упорно называют его «вычислительным движком», но интерфейс заглавной страницы все же напоминает привычный сервис интернет-поиска) пытается соотнести его с определенной категорией знаний, после чего выводит на экран тот или иной набор связанных данных. Всего доступно порядка тридцати категорий запросов (включая даже такие, как вычисление сложных формули нотная грамота), и благодаря стараниям разработчиков их число непрерывно увеличивается.

Область применения
Создатели Wolfram Alpha и ее идейный вдохновитель Стивен Вольфрам прекрасно понимали, что новый принцип поиска может сбить людей с толку. Привычная модель работы с поисковой системой типа Google, когда пользователь, не особо задумываясь, вводит в качестве запроса нечто вроде «Самый лучший ресторан неподалеку от Трафальгарской площади», в данном случае работает не самым лучшим образом. Именно для облегчения «учебной кривой» в боковой панели поисковика указаны самые типичные и удачные запросы, такие как «x^2 sin (x)», «1 apple 2 oranges», «San Francisco to Tokyo», «Atlantic Ocean». Если же любопытному исследователю захочется увидеть больше примеров, то к его услугам справка с несколькими сотнями образцов вопросов из различных сфер знаний.
Разработчики полагают, что основными областями, в которых может пригодиться их сервис, являются, конечно, наука и обучение. Многие исследователи, ранее вынужденные самостоятельно выуживать специфическую информацию из Сети или бумажных справочников, смогут существенно экономить время, получая прямые ответы на поставленные вопросы без необходимости просмотра сотен веб-страниц и неизбежного мусора поисковой оптимизации, а также моментально экспортировать полученные данные в PDF или файл пакета Mathematica. К тому же развитие самого поисковика не стоит не месте: количество фактов, которые содержатся в его базах данных, постоянно увеличивается. За счет этого вопрос, ответ на который еще вчера был неизвестен системе, сегодня может быть с легкостью решен.
В любом случае Wolfram пригодится и «простым смертным»: возможность гарантированного получения точной информации, а также моментального сравнения тех или иных данных (попробуйте ввести в поисковой строке что-нибудь вроде «Russia China» — и получите немало пищи для размышлений) сможет если не заменить привычный поиск в Интернете, то как минимум дополнить его. Шансы на это стремительно увеличиваются: с помощью Wolfram Alpha уже можно искать непосредственно из Firefox (с сайта можно скачать специальный поисковый плагин), а аддон для этого же браузера под нехитрым названием Wolfram Alpha Google позволяет выводить на одной странице информацию одновременно из Google и Wolfram Alpha. Не нужно быть провидцем, чтобы предсказать скорое появление сервисов, реализующих данную возможность без каких-либо плагинов и надстроек для браузера. Кроме того, уже сейчас разработчки Wolfram Alpha предоставляют всем желающим API для обращения к поисковому сервису извне. Как показывает опыт, это обещает интереснейшую волну гибридных сервисов и мэшапов (веб-приложений, объединяющих данные с различных сервисов). Так, в первую очередь на ум приходит идея вывода справочных данных из Wolfram в качестве дополнительной информации о городах в картах от Google.
Сервис Wolfram Alpha является лучшим доказательством потрясающей мощи пакета Mathematica — основного продукта компании Wolfram Research, который выпускается уже двадцать лет и весьма популярен в научной среде. Пять миллионов строк кода, написанного на внутреннем языке Mathematica, выполняют работу по поиску, визуализации, журналированию, а также всем вычислениям формул «Альфы». За обработку пользовательских запросов отвечает набор Java-сервлетов (небольшие Java-приложения, выполняемые не на ПК пользователя, как обычные Java-апплеты, а на сервере) под названием Mathematica Web, а распределенными вычислениями на десяти тысячах процессорных ядер занимается gridMathematica — средство распараллеливания кода и построения кластеров.
С помощью Mathematica также осуществляется импорт данных из разнородных источников и их статистическая обработка. Разработка Wolfram Alpha продолжалась более пяти лет, и большую часть этого срока о перспективном сервисе не было известно практически ничего: по словам создателей, они не были уверены в успехе проекта, а потому не хотели раньше времени рассказывать о нем миру. Лишь в марте этого года первая информация о Wolfram Alpha просочилась в Сеть, и сейчас на основе этих материалов можно убедиться, что в системе реа лизовано большинство намеченных функций. Так, например, можно упомянуть лингвистический анализ запросов на естественном языке, представляющий собой отдельную, довольно сложную проблему.

Ученый-бизнесмен
Необычайно интересна личность создателя и главного идеолога Wolframи Research — Стивена Вольфрама. Математик, ставший профессором уже в двадцать лет, и успешный бизнесмен, посвятивший свою жизнь теории «вычислимой науки», он опубликовал немало книг и статей, посвященных этой теме. Среди них — нашумевшая книга «Новый вид науки» («New Kind Of Science»), в которой подробно описываются принципы совершения научных открытий путем исследования весьма простых компьютерных программ, таких, например, как клеточные автоматы. По замыслу автора, многообразие поведения различных моделей позволит с помощью массированных вычислений найти алгоритмы, результаты действия которых будут в точности совпадать с реакцией реального мира. Слова ученого не расходятся с делом: вместо того чтобы творить заумные абстракции в башне из слоновой кости, Стивен Вольфрам успешно доказывает и реализует свои идеи на практике — в Mathematica, стоимость лицензии на которую, к слову, превышает две тысячи долларов. Мало того, Wolfram Research ставит перед собой амбициозную задачу автоматической генерации знаний, и важно понимать, что поисковая система в данном случае — лишь один из инструментов (пусть и весьма впечатляющий) для достижения поставленной цели.
Грамотно выбранная бизнесмодель — залог успеха и долголетия сервиса. На данный момент авторами Wolfram Alpha выбрана концепция спонсорской помощи: проект финансируется неназванными компаниями, хотя можно предположить, что баннеры, появляющиеся иной раз при определенных поисковых запросах, принадлежат тем самым спонсорам.
Кроме того, финансирование осуществляется и самой Wolfram Research в объеме, достаточном для интенсивного развития проекта. Не исключается, впрочем, что в будущем финансовые потоки будут поступать и за счет размещения рекламы, релевантной запросам пользователей (например, те же города или названия компаний), а также встраивания «вычислителя» в сторонние продукты и сервисы. В ближайших планах создателей — наращивание вычислительных мощностей. В момент запуска их явно не хватало, в связи с чем пользователи периодически сталкивались с ироничной фразой: «I'm sorry, Dave. I’m afraid i can't do that», — прямой цитатой из «Космической Одиссеи 2001 года» Кубрика, а также предложением посмотреть прямую трансляцию из дата-центра компании. Кроме того, несмотря на уже весьма обширную базу данных, разработчики не собираются останавливаться на достигнутом и планируют продолжать работу над ее дальнейшим наполнением.
Вне всякого сомнения, полностью оценить эффект от появления нового способа поиска удастся лишь через некоторое время, когда пользователи адаптируются к новизне сервиса, а шум по поводу открытия Wolfram Alpha слегка поутихнет. Но одно можно сказать наверняка: множеству любознательных людей по всему миру стало гораздо удобнее и легче искать ответы на свои вопросы, а это уже немало.

По материалам журнала Chip
Денис Балуев