Fichier texte corrompu : Différence entre versions

De fablabo
Aller à : navigation, rechercher
Ligne 1 : Ligne 1 :
=== = Comment récupérer les éléments textuels dans un document texte corrompu ? ====
+
==== Comment récupérer les éléments textuels dans un document texte corrompu ? ====
  
 
{{Projet
 
{{Projet

Version du 20 juin 2013 à 10:24

Comment récupérer les éléments textuels dans un document texte corrompu ?

réparation fichier corrompu

Docx.jpg

Contributeur·ice·s

User:[[contributeur::ThomasB
La propriété « Contributeur » (comme le type de page) avec la valeur d’entrée « User:[[contributeur::ThomasB » contient des caractères non valides ou est incomplète, et donc peut provoquer des résultats inattendus lors d’une requête ou d’un processus d’annotation.
|ThomasB]]

Statut du projet

fonctionnel

Statut de la publication

License

GPL

Inspiration

Fichiers source

Machines

Matériaux

Lien





Transformer le .docx en .zip

Les documents textes "complexes" tels que ceux utilisés avec libreOffice, mais aussi openOffice, word etc. sont en fait des paquets contenant plusieurs types de fichiers. En somme un fichier .odt ou ici .docx s'apparentent plus à un dossier qu'à un fichier. C'est le syndrome des poupées russes. Alors comment accéder au contenu disponible dans un fichier .docx ? Et bien tout simplement en le renommant en monFichier.zip.

Ouvrir le fichier document.xml

Qu'est ce que le XML ?

Récupérer le contenu textuel depuis le fichier document.xml

Processing ?

C'est fini !