Мысли
May 22, 2021

Формат для хранения результатов сетевого поиска в текстовой базе данных с системой управления

В конце декабря 2020 придумал формат для хранения результатов сетевого поиска в текстовой базе данных с системой управления. Вот он.

Формат для хранения результатов сетевого поиска в текстовой базе данных с системой управления. Версия v1.1 Автор: EvgenZhaba.

Зарезервированные слова-сокращения. и = идентификатор т = тег ст = старый тег нт = новый тег

Зарезервированные символы. [] - для ссылок. # - для тегов.

За наполнение базы данных(БД) отвечают её администраторы, также за сохранение целостности: адекватные новые теги, не противоречащие уже существующему облаку тегов; достоверные и актуальные записи; логичная и полная иерархия тегов; соответствие следующим правилам оформления записи.

1. Атомарная единица - запись. 2. У каждой записи есть: уникальный идентификатор, увеличивается для каждой новой записи, например: #и_23 теги (каждый тег одним словом, пробелы заменяются символом "_"), тело записи (текст и медиа). 3. В новых записях можно ссылаться на старые записи через их идентификатор, например: [и_23]. 4. В теле записи могут быть файлы, имена которых должны быть уникальны для текущей БД, указываются так: [filename.extension], например [20201228_telegram_video.mp4]. Для уникальности рекомендуется использовать префикс YYYYMMDD, например, для предыдущего примера это 20201228 - 28 декабря 2020 года. 5. Новый тег вводится через префикс "т": #т_новый_тег, например, #т_телеграм. 6. Иерархия тегов реализуется через указание в теге понятий от высшего множества к низшему, например, "форум"->"анонимный"->"для пользователя": #форум_анонимный_для_пользователя

Опционально. 7. Для указания авторства можно использовать теги: администратора, вносящего изменения в базу: #автор_админ_аноним; того, кто предложил запись: #автор_предложил_аноним; владельца информации в записи: #автор_владелец_аноним; где вместо "аноним", если известен, может стоять чей-то никнейм. 8. Для указания временного штампа можно использовать тег вида #время_YYYYMMDD_hhmmss, например, #время_20201228_232412. Желательно для единообразия времени всем администраторам использовать единое время, или брать формат тега с указанием временной зоны. 9. Для замены тега можно сделать отдельную запись с тегами с суффиксами "ст" и "нт": #старый_тег_ст #новый_тег_нт, например, #сообщества_ст #сообщества_малые_нт.

С базой данных можно работать как в "сыром" текстовом виде, так и для удобства использовать систему управления базой данных (пока что в планах на html+js - запускается везде, где есть браузер), где автоматически сформировано облако тегов на основе префикса "т"; составлена иерархия тегов на основе одинаковых первых слов в тегах; проведены все замены тегов, если они есть; и с поиском по тегам, с включением и исключением.

Первое использование предполагается в телеграме. Теги-идентификаторы явно не указываются, берутся из идентификатора записи в канале. Аналогично временной штамп.