, 2 min read
OCR, atau Optical Character Recognition, adalah teknologi yang digunakan untuk mengonversi teks dari gambar atau dokumen yang dipindai menjadi format teks yang dapat diedit dan dicari.
Optical Character Recognition (OCR) adalah teknologi yang memungkinkan komputer untuk membaca teks dari gambar atau dokumen yang dipindai. Dalam tutorial ini, kita akan menggunakan Golang untuk melakukan OCR pada gambar dengan bantuan Tesseract OCR.
Setelah menginstall kedua tools diatas, sekarang waktunya membuat project Golang.
Buat folder dimana project kita ingin dibuat, misalnya folder belajar-ocr. kemudian masuk kedalam folder belajar-ocr
Lalu initiate module dengan memasukan perintah:
go mod init belajar-ocr
Setelah menjalankan perintah diatas, install pacakge yang diperlukan, jalankan perintah:
go get github.com/otiai10/gosseract/v2
Siapkan gambar yang ingin di convert menjadi teks, misalnya test.jpg
kemudian buat file main.go
package main
import (
"fmt"
"github.com/otiai10/gosseract/v2"
)
func main() {
client := gosseract.NewClient()
defer client.Close()
client.SetImage("test.jpeg")
text, _ := client.Text()
fmt.Println(text)
}
Kemudian jalankan perintah:
go run .
Dengan script sederhana seperti diatas, kita sudah berhasil membuat program convert gambar menjadi teks dengan OCR.
Silahkan eksplor kembali misalnya dengan membuat project dengan kasus:
Kita juga bisa mengintegrasikan dengan Frontend seperti React JS supaya ada form upload gambar lalu akan menghasilkan output berupa teks.
Tags