СЕМАНТИЧЕСКИЙ ВЕБ: ОТ ИДЕИ - К ТЕХНОЛОГИИ
За чуть более чем 10 лет своего существования Web настолько развился, что близок к состоянию "переполнения", как это ни парадоксально звучит.
Две основные причины порождают две основные проблемы Internet. Первая причина - рост объемов информационного наполнения, порожденный популярностью и дешевизной Web-технологий, а вторая - формат представления информации в Сети, который ориентирован преимущественно на людей и лишь в некоторых случаях допускает автоматическую обработку программными агентами.
В результате, во-первых, возникает проблема нахождения необходимой пользователю информации в любом виде - объемы Web-пространства не позволяют оперативно обновлять базы данных информационно-поисковых систем (не говоря уже о невозможности достижения 100-процентного охвата), а во-вторых в автоматизированном режиме практически невозможно выделить смысл информационных сообщений, например, по названию какой-либо конкретной статьи, представленной в Internet, можно найти сотни ссылок на эту статью, в массиве которых сама статья теряется.
Поэтому дальнейшее развитие Internet многие ученые связывают с концепцией Семантического Web (Semantic Web), которая во многом благодаря унификации обмена данными предположительно даст возможность интегрировать в Internet даже объекты реального мира. Концепцию Семантического Web выдвинул Тим Бернерс-Ли, один из основоположников Worl-Wide Web и председатель WWW-консорциума (W3C) на международной конференции XML-2000, прошедшей в 2000 году в Вашингтоне.
Основная идея этого проекта заключается в организации такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей. Путем таких радикальных преобразований концепции уже традиционного Web предполагается превращение его в систему семантического уровня. По замыслу создателей Семантический Web должен обеспечить "понимание" информации компьютерами, выделение ими наиболее подходящих по тем или иным критериям данных, и уже после этого - предоставление информации пользователям.
При автоматической обработке информации в рамках Семантического Web взаимодействующие друг с другом сервисы на основе анализа смысловых связей между объектами и понятиями, хранящимися в Сети должны отбирать лишь ту информацию, которая будет реально полезна пользователям.
По определению консорциума W3C Семантический Web представляет собой расширение существующей сети Internet, в котором информация представляется в четком и определенном смысловом значении, дающем возможность людям и компьютерам работать с более высокой степенью взаимопонимания и согласованности. Семантический Web предусматривает объединение разнообразных видов информации в единую структуру, где каждому смысловому элементу данных будет соответствовать специальный синтаксический блок (тэг). Тэги должны составлять единую иерархическую структуру, на основе которой и должен функционировать Семантический Web. По словам Бернерса-Ли, в рамках проекта "Семантический Web" разрабатываются языки для выражения информации в форме, доступной для машинной обработки, на которых можно будет описывать как данные, так и принципы трактования этих данных. Это должно привести к тому, что правила выводов, существующие в какой-либо одной системе представления знаний, будут передаваться по сети другим подобным системам. В процессе реализации концепции Семантического Web получили широкое развитие синтаксические методы представления информации языковыми средствами XML и его дополнений, предназначенных для описания типовых свойств элементов XML- документов, их структуры и семантики: рекомендации W3C, регламентирующие DTD (Document Type Definition), XML Schema, XQuery (язык запросов к базам XML-данных) и т.д.
Другая ветвь Семантического Web связана с направлениями, близкими к области искусственного интеллекта, и названа онтологическим подходом. Этот подход включает в себя средства аннотирования документов, которыми могли бы воспользоваться компьютерные программы - Web-сервисы и агенты при обработке сложных пользовательских запросов.