Logo CitForum CITForum на CD Форумы Газета Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

24.05.2012

Google
WWW CITForum.ru
2000 г

Мифы и реальности XML

Сергей Кузнецов
ИСП РАН, Центр информационных технологий
kuzloc@ispras.ru

Людям свойственно верить в философский камень. Вот-вот кто-то его изобретет, и вся жизнь изменится. Так происходит и в мире информационных технологий. Вспомним, например, краткую, но яркую историю Java-технологий. В 1995 г. мне довелось присутствовать на двухдневной конференции, организованной компанией Sun Microsystems специально для журналистов. Формально конференция посвящалась выпуску первого микропроцессора серии UltraSparc. Фактически большую часть времени заняло представление нового объектно-ориентированного языка Java. Тогда меня потрясло выступление Билла Джоя, который сказал, что создание этого языка является главным достижением в его жизни, и что наконец-то открываются реальные возможности организации и доступа в Internet мультимедийной информации. Наверное, все помнят, сколько сил и средств затратила Sun, чтобы убедить разработчиков программного обеспечения полностью перейти на использование языка Java.

Сегодня уже понятно, что Java-технологии (в частности, JavaBeans и Jini) являются еще одним набором информационных технологий, который пригоден и выгоден для использования в одних ситуациях и не приносит успеха в других случаях. Более того, мне неизвестны случаи, когда серьезные информационные системы создавались бы на основе только этих технологий без привлечения существовавших ранее или возникших параллельно (чтобы больше не отвлекаться от темы, не буду приводить конкретные примеры).

Теперь многим кажется, что XML спасет мир и приведет к новой эпохе информационного благоденствия. Возможно, оно и так, но что-то я в этом сомневаюсь. Перечислю некоторые мифы, возникшие вокруг XML:

Миф первый. XML полностью изменит жизнь в Internet, обеспечив, наконец, единое мировое информационное пространство.

Миф второй. XML станет единым общепринятым стандартом представления информации в системах электронного бизнеса (как B2C, так и B2B).

Миф третий. Основанные на XML системы баз данных за счет своей большей гибкости вытеснят реляционные и другие системы.

Этот список имеющихся мифов можно продолжать, но для наших целей их хватит. В мифы хочется верить. Но что-то редко встречаются случаи, когда слепая вера давала хорошие результаты. С другой стороны, в каждом мифе есть доля реальности. Обсудим, почему мифичны приведенные выше высказывания и какова их реальная составляющая.

Миф первый (опровержение). Что нас сегодня не устраивает в Internet? (Я не буду говорить о технических трудностях.) Фактически, сегодня Всемирная Паутина напоминает джунгли, где, конечно, можно пробраться от любого заданного места к любому другому, но если целью похода в джунгли является поиск конкретного вида орхидей, то далеко не факт, что путешествие завершится успешно. Конечно, помимо явной навигации по гиперссылкам (лианам, охватывающим все джунгли) в Internet имеется ряд поисковых машин (не знаю прямого аналога в джунглях). Но все знают, что все мы имеем право искать в Internet, но не имеем гарантий того, что найдем желаемое (даже если оно реально существует).

Миф состоит в том, что если перейти от плоских файлов HTML к полуструктурированным файлам XML, то возможности релевантного поиска резко улучшатся. За каждым мифом стоит реальность. Действительно, полностью переделав весь Internet на XML, решив массу проблем унифицированного представления метаинформации, создав принципиально новые поисковые машины, можно теоретически принципиально улучшить жизнь в Internet. Но все-таки это миф. Миф, потому что подавляющее большинство поставщиков информации в Internet не заинтересовано в том, чтобы эта информация легко находилась через универсальные поисковые машины. Реальность состоит в том, что в Internet появятся тематически ориентированные островки, зная про которые, вы действительно можете найти любую информацию по данной тематике. Но даже эта реальность - это не реальность сегодняшнего дня. Но я в нее верю.

Миф второй (опровержение). Если первый миф свойственен несчастным пользователям Internet, то второй очень сильно раздувается за счет усилий отделов маркетинга производителей аппаратуры и программного обеспечения. Посмотрите, как здорово вышло. Почти одновременно возникли два непонятных, но заманчивых термина - "электронный бизнес" и "XML". И солидные компании говорят вам, что электронный бизнес гарантирует вашей собственной компании абсолютное процветание, но этот бизнес можно основывать только на продуктах, базирующихся на XML. Хороший маркетинговый ход, мне он и самому нравится. Но в чем состоит реальность?

А она состоит в том, что для достижения реального успеха в электронном бизнесе при создании соответствующей системы требуется решить массу задач, не имеющих никакого отношения к XML. XML не может претендовать даже на роль стандарта представления информации, поскольку почти всегда наряду с наличием новых XML-баз данных разумно допустить существование традиционных структурированных баз данных. Так в чем же состоит реальность? Она состоит в том, что в электронного бизнеса как правило действительно требуется возможность хранения и выбирки данных, которые не являются полностью структурированными. Да, на сегодня наилучшим кандидатом для представления данных является XML, но имеется множество нерешенных (или решенных плохо) проблем, мешающих использованию этого языка.

Миф третий (опровержение). Давайте вспомним, откуда есть пошли базы данных. А оттуда, что при наличии только файловых систем (с которых и началось управление данными во внешней памяти) структуру данных (бухгалтерских, банковских, систем резервирования и т.д.) приходилось поддерживать в прикладной программе. А если их больше одной? Как контролировать согласованность? Я ж не буду говорить про целостность данных, возможность многопользовательского доступа, транзакционное управление, журнализация изменений и восстановление после сбоев и т.д. Мифичность того, что базы данных, основанные на XML, вытеснят традиционные базы данных, для меня очевидна. Имеется масса прикладных областей, в которых нужны именно структурированные, а не полуструктурированные данные. Для них нужны и будут нужны традиционные базы данных со структурированной схемой.

Реальность состоит в том, что имеется множество информационных приложений, для которых данные не укладываются естественным образом в традиционные модели. Для них XML может быть весьма полезен. Но замечу, что при наличии нескольких коммерческих серверов XML-баз данных, ни в одном из них пока не решены в полном объеме те задачи, с решением которых успешно справляются традиционные СУБД.

Хочу ужесточить свою позицию и заявить о том, что, по моему мнению, разумно использовать любую технологию, связанную с XML, можно только в комбинации с другими технологиями. Приведу несколько примеров.

В некотором смысле XML аналогичен языку ассемблера. Предположим, что нам требуется спроектировать некоторую XML-базу данных. (Если вы думаете, что для таких баз данных фаза проектирования не требуется, то глубоко ошибаетесь.) Один из подходов состоит в использовании UML (Unified Modeling Language). Существует де-факто стандарт отображения UML в XML. Имеется соответствующая промышленная поддержка.

Когда мне говорят, что MS Explorer теперь поддерживает XML, я громко смеюсь. Очевидно, что стандартный браузер понимает только подмножество XML, а определенные пользователями теги просто игнорирует. Насколько я понимаю, возможны два решения для обеспечения адекватного восприятия XML-документов на стороне пользователя. Первый (очевидный) подход - создание специализированных браузеров, понимающих смысл DTD заданного набора XML-документов. Второй подход состоит в использовании Java-апплетов. Он универсален и обеспечивает возможность правильной работы с XML-документами с любого стандартного браузера.

Если возникает желание создать на основе XML распределенную информационную систему, то, конечно, потребуется использование дополнительного программного обеспечения промежуточного уровня (middleware). Для меня предпочтительнее была бы CORBA, но возможны решения и на основе COM/DCOM или RMI.

Наконец, я глубоко уверен, что какие бы новые языки запросов не были придуманы для XML-баз данных, будет жить язык SQL. Рано или поздно понадобится реализовать SQL для работы с XML-базами данных, обладающими реляционной структурой. Тогда и пригодится инженерия традиционных SQL-ориентированных СУБД.

Я далеко не пессимист и надеюсь, что появление XML-технологий и стандартов реально позволит улучшить информационную технологию в целом, хотя и не произведет революционного переворота.

 

Подписка на новости CITForum.ru

Новые публикации:

19 мая

  • Прозрачный механизм удаленного обслуживания системных вызовов

  • Система моделирования Grid: реализация и возможности применения

    Газета:

    Майкл Стоунбрейкер:

  • Ошибки в системах баз данных, согласованность "в конечном счете" и теорема CAP

  • Дискуссия по поводу "NoSQL" не имеет никакого отношения к SQL

    29 апреля

  • Материалы конференции "Корпоративные Базы Данных-2010"

  • Разные облики технологии баз данных (отчет о конференции)

    14 апреля

  • MapReduce: внутри, снаружи или сбоку от параллельных СУБД?

  • Научные вызовы технологиям СУБД

    Обзоры журнала Computer:

    31 марта

  • Рационализация согласованности в "облаках": не платите за то, что вам не требуется

  • Взаимные блокировки в Oracle

  • Архитектура среды тестирования на основе моделей, построенная на базе компонентных технологий

  • Объектное представление XML-документов

    Газета:

  • Microsoft для российских разработчиков: практика с элементами фундаментальности

    10 марта

  • HadoopDB: архитектурный гибрид технологий MapReduce и СУБД для аналитических рабочих нагрузок

  • Классификация OLAP-систем вида xOLAP

  • BGP. Три внешних канала. Балансировка исходящего и входящего трафиков

    Газета:

  • Что мы знаем об iPhone 4G?

    17 февраля

  • MapReduce и параллельные СУБД: друзья или враги?

  • Объектно-ориентированное программирование в ограничениях: новый подход на основе декларативных языков моделирования данных

  • Системологический подход к декомпозиции в объектно-ориентированном анализе и проектировании программного обеспечения

    Газета:

  • Эволюция Wine

    3 февраля

  • Дом на песке

  • Реальное переосмысление "формальных методов"

  • Интервью с Найджелом Пендзом

    Газета:

  • iPad. Первый взгляд на долгожданный планшет от Apple

  • Я не верю в iPad

    20 января

  • SQL/MapReduce: практический подход к поддержке самоописываемых, полиморфных и параллелизуемых функций, определяемых пользователями

  • Данные на лету: как технология потокового SQL помогает преодолеть кризис

    Обзоры журнала Computer:

    2 декабря

  • Сергей Кузнецов. Год эпохи перемен в технологии баз данных

    18 ноября

  • Генерация тестовых программ для подсистемы управления памятью микропроцессора

  • Сравнительный анализ современных технологий разработки тестов для моделей аппаратного обеспечения

    Все публикации >>>


  • IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

    Информация для рекламодателей PR-акции, размещение рекламы — тел. +7 495 6608306, ICQ 232284597 Пресс-релизы — pr@citforum.ru
    Послать комментарий
    Информация для авторов

    Редакция раздаёт котят!

    Rambler's Top100 TopList liveinternet.ru: показано число просмотров за 24 часа, посетителей за 24 часа и за сегодня This Web server launched on February 24, 1997
    Copyright © 1997-2000 CIT, © 2001-2009 CIT Forum
    Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...