Processus de conversion des Wikilinks Obsidian en base de données relationnelle basée sur les ID de bloc

S'affranchir des limites du système de fichiers pour garantir l'intégrité référentielle

En utilisant Obsidian, il arrive souvent que le simple changement de nom d'un fichier rompe des centaines de liens connectés. Lorsque le nombre de documents atteint plusieurs milliers, la latence d'indexation fait même ramer la saisie au clavier. Les systèmes basés sur les fichiers finissent par atteindre des limites claires. SiYuan résout ce problème simplement. Il définit chaque élément comme un bloc doté d'un identifiant unique de 20 caractères et les injecte dans un noyau SQLite. Puisqu'il suit l'ID du bloc et non le nom du fichier, les liens ne sont jamais rompus, peu importe le déplacement physique des fichiers. En pratique, lors du passage à un système de blocs dans un environnement possédant des dizaines de milliers de fichiers Markdown, le taux d'erreur de référence chute à moins de 0,1 %.

Pour déplacer des données non structurées vers une base de données relationnelle, un script Python avec des expressions régulières est nécessaire.

Exécutez une expression régulière avec le module re de Python pour détecter le motif [[nom_du_fichier#en-tête]].
Appelez l'API de SiYuan pour générer des ID de bloc uniques correspondant à chaque section ou les extraire de la base de données existante.
Remplacez tous les Wikilinks existants par le format de référence spécifique à SiYuan : ((BlockID "texte d'ancrage")).

Ce processus permet d'économiser tout le temps perdu à restaurer manuellement les liens. C'est le moment où la rigueur des relations de clé étrangère (Foreign Key) d'une base de données devient préférable à la flexibilité d'un système de fichiers.

Extraction automatique de snippets de code et de contextes de projet via des requêtes SQL

Le fait que l'intégralité de la base de connaissances soit gérée par SQLite est une arme redoutable pour un ingénieur senior. Contrairement à Obsidian qui gratte du texte simple, vous pouvez extraire dynamiquement uniquement les données souhaitées avec la syntaxe SQL standard. La table blocks possède déjà un schéma de colonnes détaillé incluant l'ID, le texte Markdown complet, le type, le sous-type, etc. Même en fouillant dans des dizaines de milliers de notes, la vitesse de réponse se compte en millisecondes. Le temps de latence qui interrompt le flux de travail est réduit de plus de 80 % par rapport à la recherche simple d'Obsidian.

Si vous souhaitez gérer des snippets de code dispersés en temps réel, vous devez combiner les blocs intégrés (embedded blocks) et le SQL.

Créez un bloc de code SQL à l'intérieur d'un document SiYuan et saisissez la requête SELECT * FROM blocks WHERE type = 'c' AND subtype = 'python'.
Pour filtrer des mots-clés spécifiques, ajoutez la condition AND content LIKE '%API%' et triez par nouveauté avec ORDER BY created DESC.
Configurez la vue du résultat de la requête comme un bloc intégré SiYuan pour l'épingler en haut du document.

Il n'est pas nécessaire d'installer une multitude de plugins tiers. Avec les fonctionnalités natives seules, vous obtenez un tableau de bord qui rassemble automatiquement par thème les codes Python enfouis dans des milliers de notes.

Mise en place d'une synchronisation chiffrée avec Docker et le stockage S3

La souveraineté des données ne provient pas du serveur d'autrui, mais de votre propre conteneur. SiYuan supporte officiellement le déploiement Docker. En y associant un VPN mesh Tailscale, vous pouvez synchroniser vos notes en toute sécurité dans un environnement Zero Trust sans ouvrir de ports vers l'extérieur. C'est une méthode pour protéger vos données sans craindre les vulnérabilités d'exploration de chemin ou les attaques DoS sur WebSocket.

Voici la procédure pour monter une instance sécurisée sur un serveur personnel ou un NAS :

Exécutez la commande docker run en incluant l'option -u 1000:1000 pour faire correspondre l'UID/GID de l'utilisateur hôte avec le conteneur, ainsi que le mappage des volumes.
Installez Tailscale sur le serveur et les appareils mobiles, activez MagicDNS, puis connectez-vous à http://siyuan-node:6806 via l'IP interne.
Dans le menu des paramètres, saisissez un point de terminaison de stockage compatible S3 (comme Cloudflare R2), copiez la clé du dépôt (Repo Key) et activez la synchronisation avec chiffrement de bout en bout (E2EE).

En concevant l'architecture de cette manière, vous n'avez plus besoin de payer chaque mois pour un service d'abonnement. Vous économisez plus de 100 000 wons par an tout en renforçant la sécurité.

Protocole de maintenance pour maintenir la réactivité des grands ensembles de données

Lorsque les données dépassent les dizaines de milliers d'entrées, des espaces vides appelés "dead tuples" s'accumulent à l'intérieur du moteur SQLite. Si les performances de recherche ne sont plus ce qu'elles étaient, il est temps de nettoyer le moteur. Le noyau de SiYuan, basé sur Go, utilise efficacement le multi-cœur ; il est donc conseillé d'allouer généreusement des ressources -cpus au conteneur Docker lors de la phase d'indexation initiale. Pour éviter que les plans d'exécution des requêtes ne s'emmêlent, il faut lancer régulièrement des commandes de maintenance.

Pour maintenir un temps de réponse de recherche inférieur à une seconde, vous devez effectuer les tâches suivantes :

Exécutez la fonction d'optimisation de la base de données interne de SiYuan pour récupérer l'espace physique occupé par les données supprimées via la commande VACUUM de SQLite.
Mettez à jour les statistiques de distribution des données avec la commande ANALYZE pour que le moteur SQL trouve le chemin de recherche le plus rapide.
Pour les ressources volumineuses ou les PDF de plus de 10 Mo, ne les jetez pas simplement dans le dossier assets ; redimensionnez les images ou utilisez des liens externes pour réduire la taille de l'index.

En effectuant ces tâches périodiquement, vous pouvez économiser 60 % de l'espace de stockage total. C'est le secret pour conserver la vitesse des débuts, même si les données augmentent de manière exponentielle.

Processus de conversion des Wikilinks Obsidian en base de données relationnelle basée sur les ID de bloc

S'affranchir des limites du système de fichiers pour garantir l'intégrité référentielle

Pour déplacer des données non structurées vers une base de données relationnelle, un script Python avec des expressions régulières est nécessaire.

Exécutez une expression régulière avec le module re de Python pour détecter le motif [[nom_du_fichier#en-tête]].
Appelez l'API de SiYuan pour générer des ID de bloc uniques correspondant à chaque section ou les extraire de la base de données existante.
Remplacez tous les Wikilinks existants par le format de référence spécifique à SiYuan : ((BlockID "texte d'ancrage")).

Extraction automatique de snippets de code et de contextes de projet via des requêtes SQL

Si vous souhaitez gérer des snippets de code dispersés en temps réel, vous devez combiner les blocs intégrés (embedded blocks) et le SQL.

Créez un bloc de code SQL à l'intérieur d'un document SiYuan et saisissez la requête SELECT * FROM blocks WHERE type = 'c' AND subtype = 'python'.
Pour filtrer des mots-clés spécifiques, ajoutez la condition AND content LIKE '%API%' et triez par nouveauté avec ORDER BY created DESC.
Configurez la vue du résultat de la requête comme un bloc intégré SiYuan pour l'épingler en haut du document.

Mise en place d'une synchronisation chiffrée avec Docker et le stockage S3

Voici la procédure pour monter une instance sécurisée sur un serveur personnel ou un NAS :

Exécutez la commande docker run en incluant l'option -u 1000:1000 pour faire correspondre l'UID/GID de l'utilisateur hôte avec le conteneur, ainsi que le mappage des volumes.
Installez Tailscale sur le serveur et les appareils mobiles, activez MagicDNS, puis connectez-vous à http://siyuan-node:6806 via l'IP interne.
Dans le menu des paramètres, saisissez un point de terminaison de stockage compatible S3 (comme Cloudflare R2), copiez la clé du dépôt (Repo Key) et activez la synchronisation avec chiffrement de bout en bout (E2EE).

Protocole de maintenance pour maintenir la réactivité des grands ensembles de données

Pour maintenir un temps de réponse de recherche inférieur à une seconde, vous devez effectuer les tâches suivantes :

Exécutez la fonction d'optimisation de la base de données interne de SiYuan pour récupérer l'espace physique occupé par les données supprimées via la commande VACUUM de SQLite.
Mettez à jour les statistiques de distribution des données avec la commande ANALYZE pour que le moteur SQL trouve le chemin de recherche le plus rapide.
Pour les ressources volumineuses ou les PDF de plus de 10 Mo, ne les jetez pas simplement dans le dossier assets ; redimensionnez les images ou utilisez des liens externes pour réduire la taille de l'index.

Processus de conversion des Wikilinks Obsidian en base de données relationnelle basée sur les ID de bloc

Related Video

L'app de notes pour dev qui répare ce qu'Obsidian ne peut pas (SiYuan)

Processus de conversion des Wikilinks Obsidian en base de données relationnelle basée sur les ID de bloc

S'affranchir des limites du système de fichiers pour garantir l'intégrité référentielle

Extraction automatique de snippets de code et de contextes de projet via des requêtes SQL

Mise en place d'une synchronisation chiffrée avec Docker et le stockage S3

Protocole de maintenance pour maintenir la réactivité des grands ensembles de données

Comments (0)

Processus de conversion des Wikilinks Obsidian en base de données relationnelle basée sur les ID de bloc

S'affranchir des limites du système de fichiers pour garantir l'intégrité référentielle

Extraction automatique de snippets de code et de contextes de projet via des requêtes SQL

Mise en place d'une synchronisation chiffrée avec Docker et le stockage S3

Protocole de maintenance pour maintenir la réactivité des grands ensembles de données