Publication:
Developing an automatic layout analysis system for Ottoman population registers

Thumbnail Image

Departments

School / College / Institute

Program

KU Authors

Co-Authors

Publication Date

Language

Embargo Status

NO

Journal Title

Journal ISSN

Volume Title

Alternative Title

Osmanlı nüfus kayıtlarının otomatik yerleşim analizi ile incelenmesi

Abstract

For extracting information from the historical documents, digitization efforts have increased dramatically in the recent decades. Accurate layout analysis will help researchers for developing more robust HTR and OCR techniques which will extract meaningful information from these documents. Variable layouts, low quality and distorted images of historical documents create different problems to deal with when compared to modern document processing. Arabic script features have even more problems for these automatic processing systems. In this study, we have developed a tool for automatically analyzing the layouts of the first Ottoman population registers which are written in Arabic script form. We built a dataset for testing the performance of our system which are chosen from the first population records of the Ottoman Empire between the 1840s and 1860s. We successfully classified two different object types in those documents. / Tarihsel belgelerden bilgi çıkarmak için sayısallaştırma çabaları son yıllarda önemli ölçüde artmı ştır. Doğru yerleşim analizi, araştırmacıların bu belgelerden anlamlı bilgiler elde edecek daha sağlam HTR ve OCR teknikleri geliştirmelerine yardımcı olacaktır. Değişken yerleşimler, düşük kaliteli ve bozuk tarihi belgeler, modern belge işlemeye kıyasla farklı sorunlar yaratmaktadır. Arapça yazılar kendine has bazı özelliklerinden dolayı otomatik işlem sistemleri için daha da fazla sorun yaratmaktadır. Bu çalışmada, ilk Osmanlı nüfus kayıtlarının Arap harfleriyle yazılmış yerleşimlerini otomatik olarak analiz etmek için bir araç geliştirdik. 1840’lar ve 1860’lar arasında Osmanlı İmparatorluğu’nun ilk nüfus kayıtlarından seçilen sistemimizin performansını test etmek için bir veri seti oluşturduk. Bu belgelerde iki farklı nesne türünü başarıyla sınıflandırdık.

Source

Publisher

Institute of Electrical and Electronics Engineers (IEEE)

Subject

History

Citation

Has Part

Source

2020 28th Signal Processing and Communications Applications Conference (SIU)

Book Series Title

Edition

DOI

10.1109/SIU49456.2020.9302464

item.page.datauri

Link

Rights

Copyrights Note

Endorsement

Review

Supplemented By

Referenced By

0

Views

3

Downloads

View PlumX Details