Ça permettrais d'éliminer certains problème possibles.
]>J'ai testé tout ça avec la dernière version de xsane / tesseract dispo en unstable ...
]>Et le billet de TGV n'est pas donné donné (perte de pouvoir d'achat des fonctionnaires, toussa....), et le dernier TGV est bien trop tôt pour une Andébière, ce qui ne résout toujours pas mon problème principal : l'hébergement sur Paris.
Korova complètement écroulée
]>Korova croulant sous les copies
Bonne idée, le scanner pour corriger les QCM. Ce sera pour la prochaine fois...
J'ai eu une pub de la SNCF l'aut'fois dans le métro (du temps ou il fonctionnait encore). Ils affirmaient que grâce au TGV, on pouvait venir rapidement de ton coin à Paris. Plus d'excuses pour la prochaine Andébière (suffit de vendre quelques Kg de BD).
Armen déjà dehors (fait pas chaud ...)
]>Si ce sont tes tifs qui vont pas tu n'as qu'à essayer de les réencoder ou regarder les paramètres du scanner (et non pas les couper, les tifs! Oups désolé ).
Oula, les tifs sont coupés depuis un bon p'tit bout de temps maintenant (le sieur Ledub peut témoigner)
Quant à mes formats tif, je ne sais pas ce qui ne va pas, ils sont en niveau de gris et pas compressés. À suivre, car là j'ai des copies à corriger (l'arrêt des notes est demain, ça urge donc)
Korova croulant sous les copies
]>N'empêche que s'il y avait des messages quelconques (de la part du logiciel), ça m'aiderait à y voir plus clair
Korova pas en grève... parce que le mardi elle ne va jamais au lycée !
]>LeDub qui fait des copier/coller sans trop chercher à comprendre
[edit]Correction de faute d'orthographe[/edit]
]>Version 2.00 is now available and contains the following new features:
* Support for English, French, Italian, German, Spanish, Dutch
* Scripts to test accuracy against the original 1995 tests run by UNLV (see TestingTesseract)
* Ability to train in other languages and scripts (see TrainingTesseract)
Est ce que tu as essayer de le faire fonctionner avec les fichiers exemple qui sont dans le tarball du site ?
]>Currently, Tesseract recognizes only English and works only on TIFF files (black and white, 8-bit greyscale, and 24-bit color; no compression). Also, it can generate output only in the US-ASCII character set, so glyphs with accent marks or other unsupported attributes will probably be reproduced incorrectly.
L'article date de septembre 2006, j'imagine que depuis, ils ont ajouté le support du français. Mais c'est peut être ton fichier d'entrée qui n'est pas au bon format.
Armen, espérant ne pas avoir encombré le réseau inutilement
]>Tesseract n'a pas l'air de mobiliser les foules...
tanpiche, je continuerai à taper mes textes avec mes gros doigts boudinés...
Korova qui remet l'essai de tesseract à plus tard
]>j'ai essayé d'utiliser tesseract pour faire de l'OCR, histoire de voir si ça marche mieux que gocr ou ocrad (on en dit du bien à divers endroits).
J'ai donc installé le paquet tesseract-ocr et le paquet tesseract-ocr-fre (histoire qu'il reconnaisse le français) en version 2.01 avec aptitude.
Après avoir lu la page de man (d'une brièveté déconcertante) et tâtonné un peu (pour réalisé qu'il ne veut que du tiff en entrée), les quelques essais de lancés me donnent... des fichiers parfaitement vides !
pourtant je me place dans le répertoire contenant mon image en tiff (scannée en niveau de gris à 200 dpi) et je lance
$ tesseract mon_image.tiff ma_sortie -l fra
ce qui semble correspondre à ce que j'ai lu en googlisant un peu.
Quelqu'un a une idée ?
Korova qui vient de se trouver un nouveau problème.
]>