RDF — Resource Description Framework
RDF расшифровывается как Resource Description Framework (Структура описания ресурсов) и представляет собой стандарт для описания веб-ресурсов и обмена данными, разработанный и стандартизированный Консорциумом World Wide Web (W3C). Хотя существует множество обычных инструментов для работы с данными и, в частности, для работы с отношениями между данными, RDF является самым простым, наиболее мощным и выразительным стандартом, разработанным на данный момент.
Краткая характеристика стандарта RDF
- Что такое структура описания ресурсов (RDF)? RDF — это общий метод описания данных путем определения отношений между объектами данных.
- Почему RDF — простая и гибкая модель данных? RDF обеспечивает эффективную интеграцию данных из нескольких источников, отделяя данные от своей структуры. Это позволяет применять несколько схем, связывать их, запрашивать как одну и изменять без изменения экземпляров данных.
- На чем построен RDF? RDF построен на основе существующих веб-стандартов: XML и URL (URI).
Триплеты RDF
Способ, которым RDF соединяет фрагменты данных, — это тройки-триплеты (три позиционных оператора).
Говоря простым языком, оператор RDF констатирует факты, отношения и данные, связывая ресурсы разных видов. С помощью оператора RDF почти все может быть выражено единообразной структурой, состоящей из трех связанных частей данных.
Именно так модель RDF утраивает возможности любого фрагмента данных, предоставляя ему возможность вступать в бесконечные отношения с другими фрагментами данных и становиться строительным блоком более крупных, более гибких и тесно взаимосвязанных структур данных, подобных кубикам конструктора LEGO.
Важно знать, что все данные о реальности, независимо от их формата, могут быть преобразованы в данные RDF.
Графы знаний RDF
Являясь мощной и выразительной структурой для представления данных, RDF используется для построения графов знаний — сильно взаимосвязанных, интероперабельных и гибких информационных структур.
Узлы в графе знаний RDF могут быть либо ресурсами, представленными уникальным идентификатором ресурса (URI, например, общеизвестные URL-адреса), литералами (например, такими же, как в XML), либо вспомогательными пустыми узлами.
Типы ребер называются предикатами.
Именованные графы или контексты могут использоваться для управления компонентами в графе (например, по происхождению). Каждое ребро в графе представляет собой факт и может рассматриваться как четверка <субъект, предикат, объект, контекст>.
Классы, предикаты и именованные графы определяются как URI. Таким образом, они могут отображаться в виде узлов на графике, получать свои описания, т. е. можно управлять данными экземпляра и схемой и получать к ним доступ в единой модели.
Графы знаний, представленные в RDF, обеспечивают наилучшую основу для интеграции, унификации, связывания и повторного использования данных, поскольку они сочетают в себе:
- Выразительность. Стандарты стека Semantic Web — RDF(S) и OWL — позволяют свободно представлять различные типы данных и контента: схемы данных, таксономии и словари, все виды метаданных, справочные и основные данные. Расширение RDF* упрощает моделирование происхождения и других структурированных метаданных.
- Формальная семантика: все стандарты в стеке Semantic Web имеют четко определенную семантику, которая позволяет людям и компьютерам однозначно интерпретировать схемы, онтологии и данные.
- Производительность: все спецификации были продуманы и проверены на практике, чтобы обеспечить эффективное управление графами из миллиардов фактов и свойств.
- Совместимость: существует ряд спецификаций для сериализации данных, доступа (протокол SPARQL для конечных точек), управления (хранилище графов SPARQL) и объединения. Использование глобальных уникальных идентификаторов облегчает интеграцию и публикацию данных.
- Стандартизация: все вышеперечисленное стандартизировано в рамках процесса сообщества W3C, чтобы гарантировать удовлетворение требований различных участников — от логиков до специалистов по управлению корпоративными данными и групп системных операций.
Часто RDF критикуют за то, что он не позволяет прикреплять описания или свойства к ребрам графа, и это воспринимается как недостаток по сравнению с графами свойств. Эта проблема была решена с помощью RDF-Star (сокращенно RDF*), который позволяет делать утверждения о других утверждениях и, таким образом, присоединять метаданные к отношениям — ребрам графа.