Récupération d’un post effacé…
De nos jours, les purs bloggers travaillent directement en ligne : le temps ou l’on bossait sa version en local (merci EasyPhP et MAMP) avant de tout vérifier et d’uploader ses modifications est révolu. Dommage, car cela avait l’avantage de conserver une copie de chaque publication : copie distante en cas de crash de mon ordi, copie locale en cas de pépin chez l’hébergeur.
Si vous êtes dans le premier cas, l’effacement par erreur d’un article entier est toujours possible. Heureusement, il existe des solutions pour récupérer ces contenu évaporés… La manip est décrite pour une page WordPress, mais peut être adaptée à tout type de contenu HTML.
Le problème est plus facile à résoudre s’il s’agit d’un article assez ancien : logiquement, il doit être indexé et stocké dans le cache de Google. Effectuez une recherche sur [site:nom_du_site.com: nom_du_post] et vous pourrez afficher la page conservée : il ne reste plus qu’à récupérer la source.

En cas de suppression d’un post récent, il n’y a d’autre solution que de fouiller dans le cache de Firefox (d’ou l’intérêt de surfer avec le renard…). La manipulation est un peu hard, surtout parce que le fichier récupéré contient tout un fatras de données parasites qui composent le code HTML de votre page : le plus gros du boulot consistera à nettoyer le fichier afin d’en extraire votre contenu textuel.
Pour accéder au cache de Firefox, saisissez simplement [about:cache] dans la barre d’adresse. Une page subdivisée en trois zones s’affiche :

Dans le cas présent, seuls les caches « mémoire » et « disque » sont actifs ; vous aurez peut-être à les vérifier tous les deux, mais commençons par le cache « mémoire ». Cliquez alors sur [List Cache Entries] : une vaste liste d’URLs apparaît, parmi laquelle vous allez rechercher [Crtl + F] le titre de votre post :

Ca y est ! Vous avez trouvé votre page dans le cache : affichez-la en cliquant dessus. Le rendu n’est pas celui d’une page web classique, elle est remplie d’une succession de codes absolument incompréhensibles ; seule la partie gauche contient nos informations en HTML, on aperçoit la déclaration du DocType.

Pour nettoyer notre page, nous ferons appel à un éditeur HTML wysiwyg ET texte, qui doit être en mesure de faire des recherche/remplacement sur des expressions régulières : c’est le cas avec Dreamweaver, (mais également l’excellent NVu), tous deux disponibles en environnement Windows et MacOS.
Copiez le contenu de votre page dans l’éditeur, en mode [Création]. La première recherche visera à éliminer tous les caractères de la partie droite ; voici l’expression que vous devrez saisir dans la zone de recherche :
[0-9a-z]{8}:\s*?([0-9a-z]{2}\s*?){16}\s
Une fois la chaîne de caractères identifiée, vous laissez la zone de remplacement vide et vous cliquez sur [Remplacer tout] : quelques secondes plus tard, le tour est joué.
Mais notre HTML est toujours bloqué en colonne sur la gauche et la page fait environ 3000 lignes : il faut supprimer tous les retours chariot (<br> ou <br />) invisibles dans la page. Passez en mode [Code], vous pourrez ainsi les repérer ; une nouveau remplacement et notre fichier reprends sa forme originelle, ou presque. En effet, certains caractères spéciaux (é, è, ê, à, etc.) auront probablement muté durant les diverses conversions : après avoir repéré votre texte dans la page, vous corrigerez le plus gênant en effectuant encore quelques [Rechercher/Remplacer].

Vous n’avez plus qu’à [Copier/Coller] le texte dans l’éditeur de votre plateforme de blog. Vos réflexions trop pertinentes, vos plus belles tournures de phrase et même les précieux liens sont à nouveau accessibles : votre post est sauvé !
[Traduction et adaptation de l'article de John Crenshaw - many tHx to him ! ]











5 mars 2009 à 11:54
Une visite guidée à travers les méandres du cache de Firefox…
5 mars 2009 à 16:53
C’est bizarre, mais je me sens concerné par cette problématique..!
N’empêche, on n’aurait pas besoin de toutes ces bidouilles, si l’on pouvait gérer l’historisation de ses fichiers depuis les écrans d’admin. A terme, WP ne pourra pas faire l’impasse sur l’intégration d’un vrai système de gestion de conf…
Y’a ptètre un plugin à faire, là…
5 mars 2009 à 17:04
Bonne idée – Mais c’est pas moi qui vais m’y coller : le développement, c’est pas trop ma came…
5 mars 2009 à 19:51
C’est beau, t’es allé jusqu’au bout là ( t’étais désespéré ? )
pour récupérer tes posts, tu peux également sauvegarder ta base sql à intervalles réguliers
Le Top de l’anticonformiste est de faire son système de blog bien à soit ( comme mon pourri au passage ) qui permet d’encaisser >3000 visiteurs par jour sans trop ramer
voili voilou