Contribution à la segmentation de textes manuscrits anciensReport as inadecuate




Contribution à la segmentation de textes manuscrits anciens - Download this document for free, or read online. Document in PDF available to download.



Résumé : Dans cet article, nous présentons une méthode de segmentation en lignes de textes manuscrits arabes. Les documents traités sont issus dans leur grande majorité de textes manuscrits anciens numérisés et stockés dans des bases documentaires. La diversité des styles des écritures utilisés, ainsi que les différentes présentations des textes montrent que la retroconversion de ces documents reste un défi majeur pour la prochaine décennie. Nous pensons qu-il faut plusieurs stratégies de segmentation pour arriver à extraire toutes les lignes de texte de tels documents. La méthode proposée (en cours de développement) s-adresse à des textes manuscrits anciens comme ceux de la figure 1. L-approche utilisée segmente souvent une page de document en trois types de blocs de texte : les petits blocs représentent généralement les symboles diacritiques ; les blocs moyens correspondent au corps du texte et les grands blocs reflètent le chevauchement entre mots des lignes voisines. La segmentation des grands blocs ainsi que l-appariement entre tous les blocs générés permet de trouver les lignes de texte. Les premiers résultats obtenus dans le stade actuel de la méthode sur une dizaine de textes manuscrits sont encourageants.

Mots-clés : Semaine du Document Numérique (SDN 2004). Conférence Internationale Francophone sur l-Ecrit et le Document (CIFED 04). Ecriture manuscrite Segmentation en ligne classification automatique K-means





Author: Abderrazak Zahour Bruno Taconet Saïd Ramdane

Source: https://hal.archives-ouvertes.fr/



DOWNLOAD PDF




Related documents