OCR nasıl çalışır? Basit ve anlaşılır bir şekilde açıklanabilir
Bu yazıda OCR'nin nasıl çalıştığını açıklıyoruz. OCR, "Optik Karakter Tanıma" anlamına gelir ve Almancada metin tanıma olarak anılır. Bu, bir bilgisayarın OCR kullanarak taranan görüntüdeki metni tanıyabileceği ve daha sonra basit bir metin belgesine dönüştürebileceği anlamına gelir.
OCR böyle çalışır
Bir meslektaşınızdan yazılı bir sunum aldığınızı düşünün. Artık bunları bireysel pasajları sevmediğiniz için PC'de düzenlemek istiyorsunuz. Bu yüzden tarayın ve OCR programınıza gidin. Şimdi aşağıdakiler olur:
- Yazılım önce düzen analizi denir. Bunu yapmak için, sayfa düzenine bakar ve görüntüleri metinden ayırır. Ayrıca sayfadaki konumlarını not eder. Ardından paragraf sayısı sayılır ve sayfa numaraları gibi tek tek öğeler kaydedilir.
- Şimdi zor kısmı geliyor. Yazılım tek tek metin bloklarına bakar ve onları cümlelere böler. Cümleler daha sonra tek tek kelimelere ve kelimeler harflere bölünür.
- OCR yazılımı harf ve karakter desenleri içerir. Program şimdi taranan harfleri bu desenlerle karşılaştırmaktadır. Eğer% 99 benzerlerse, algoritma büyük olasılıkla bu harf olması gerektiğine karar verir. Çok kesindir, çünkü birçok deseni kısa sürede karşılaştırabilir. Bu şekilde "8" ile "B" arasında başarılı bir şekilde ayrım yapar.
- Böylece harfler ve karakterler yavaş yavaş tanınır. Sonra tekrar sözcükler olarak birleştirilir ve cümledeki yerlerine geri konurlar. Yazılım biter bitmez, her şey normal bir belgeye kaydedilir ve daha sonra düzenleyebilirsiniz. Bitti!
Yazılım bilginizi test etmek ister misiniz? Büyük yazılım testimize katılın!