Sabtu, 15 Oktober 2016

Artikel Tentang perkembangan teknologi : OCR (Optical Character Recognition)

Ada kalanya kita harus menyalin buku atau sebuah dokumen yang penting, namun waktu yang tersedia tidak cukup. Kini ada cara yang lebih praktis, dengan menggunakan Image To Text - OCR.
Teknologi OCR (Optical Character Recognition) sudah lama kita dengar, tetapi apakah kita sudah mengetahui fungsi dan cara kerja dari software tersebut?
Seperti yang sudah kita ketahui bahwa software OCR berfungsi untuk merubah file Image/Gambar menjadi file Teks dengan format TXT.
Hal ini berguna apabila kita ingin mendapatkan file teks dari sebuah surat tanpa harus mengetik ulang seluruh tulisan yg terdapat didalam surat tersebut.
Pada dasarnya setiap scanner hanya menghasilkan file gambar/image dalam format TIFF saja, setelah file gambar/image tersebut dihasilkan, file tersebut di kirim ke dalam komputer dan langsung di sambut dan diproses oleh program OCR untuk diproses menjadi file teks, berikut ini saya jelaskan susunan cara kerja software OCR tersebut:
1. Meratakan gambar (Auto Deskewing).
file image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.
2. Menganalisa (Analysis).
software (program) OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.
3. Otomatis mengatur arah gambar (Auto Orientation).
software (program) OCR akan mengambil sebagian area pada file image (gambar) dan mengidentifikasi arah teks yang benar.
file image (gambar) akan diputar ke arah yang benar, pilihannya adalah 90⁰, 180⁰ atau 270⁰.
4. Memisahkan setiap karakter huruf dan angka (Separating single character).
software (program) OCR akan memisahkan setiap karakter yang terdapat pada image (gambar) menjadi sebuah huruf atau angka.
5. Mengidentifikasi gambar (Capturing the features of the characters and comparing).
software (program) OCR akan mengidentifikasi satu persatu setiap gambar yang sudah dipisahkan, dan melakukan pengecekan terhadap database yang dimiliki oleh software (program) OCR, dan menetapkan huruf atau angka yang akan digunakan.
6. Menghasilkan file akhir (Recognition result output).
Setelah setiap image (gambar) sudah dirubah menjadi huruf atau angka (format teks) maka software (program) OCR akan menghasilkan sebuah file dengan format teks, seperti Microsoft Word, Microsoft Excel, TXT, Rich Text dan Searchable PDF, tergantung dari pengaturan awal.
Kesimpulan: Software OCR berfungsi untuk merubah data gambar/image menjadi teks, hal ini membantu kita untuk mendapatkan data teks secara cepat dari sebuah surat/dokumen.

sumber: 
http://digitalsense.co.id/news/bagaimana-cara-kerja-program-ocr-optical-character-recognition
https://www.merdeka.com/teknologi/image-to-text--ocr-mengubah-foto-menjadi-file-teks.html