Формат для хранения результатов сетевого поиска в текстовой базе данных с системой управления
В конце декабря 2020 придумал формат для хранения результатов сетевого поиска в текстовой базе данных с системой управления. Вот он.
Формат для хранения результатов сетевого поиска в текстовой базе данных с системой управления.
Версия v1.1
Автор: EvgenZhaba.
Зарезервированные слова-сокращения.
и = идентификатор
т = тег
ст = старый тег
нт = новый тег
Зарезервированные символы.
[] - для ссылок.
# - для тегов.
За наполнение базы данных(БД) отвечают её администраторы, также за сохранение целостности: адекватные новые теги, не противоречащие уже существующему облаку тегов; достоверные и актуальные записи; логичная и полная иерархия тегов; соответствие следующим правилам оформления записи.
1. Атомарная единица - запись.
2. У каждой записи есть:
уникальный идентификатор, увеличивается для каждой новой записи, например: #и_23
теги (каждый тег одним словом, пробелы заменяются символом "_"),
тело записи (текст и медиа).
3. В новых записях можно ссылаться на старые записи через их идентификатор, например: [и_23].
4. В теле записи могут быть файлы, имена которых должны быть уникальны для текущей БД, указываются так: [filename.extension], например [20201228_telegram_video.mp4].
Для уникальности рекомендуется использовать префикс YYYYMMDD, например, для предыдущего примера это 20201228 - 28 декабря 2020 года.
5. Новый тег вводится через префикс "т": #т_новый_тег, например, #т_телеграм.
6. Иерархия тегов реализуется через указание в теге понятий от высшего множества к низшему, например, "форум"->"анонимный"->"для пользователя": #форум_анонимный_для_пользователя
Опционально.
7. Для указания авторства можно использовать теги:
администратора, вносящего изменения в базу: #автор_админ_аноним;
того, кто предложил запись: #автор_предложил_аноним;
владельца информации в записи: #автор_владелец_аноним;
где вместо "аноним", если известен, может стоять чей-то никнейм.
8. Для указания временного штампа можно использовать тег вида #время_YYYYMMDD_hhmmss, например, #время_20201228_232412. Желательно для единообразия времени всем администраторам использовать единое время, или брать формат тега с указанием временной зоны.
9. Для замены тега можно сделать отдельную запись с тегами с суффиксами "ст" и "нт":
#старый_тег_ст #новый_тег_нт, например, #сообщества_ст #сообщества_малые_нт.
С базой данных можно работать как в "сыром" текстовом виде, так и для удобства использовать систему управления базой данных (пока что в планах на html+js - запускается везде, где есть браузер), где автоматически сформировано облако тегов на основе префикса "т"; составлена иерархия тегов на основе одинаковых первых слов в тегах; проведены все замены тегов, если они есть; и с поиском по тегам, с включением и исключением.
Первое использование предполагается в телеграме. Теги-идентификаторы явно не указываются, берутся из идентификатора записи в канале. Аналогично временной штамп.