Golang : Convert gambar menjadi teks dengan OCR

10 bulan yang lalu, 2 min read

OCR, atau Optical Character Recognition, adalah teknologi yang digunakan untuk mengonversi teks dari gambar atau dokumen yang dipindai menjadi format teks yang dapat diedit dan dicari.

Optical Character Recognition (OCR) adalah teknologi yang memungkinkan komputer untuk membaca teks dari gambar atau dokumen yang dipindai. Dalam tutorial ini, kita akan menggunakan Golang untuk melakukan OCR pada gambar dengan bantuan Tesseract OCR.

Persiapan

Install tesseract-ocr, silahkan kunjungi link berikut ini https://tesseract-ocr.github.io/tessdoc/Installation.html
Install Go : https://go.dev

Setelah menginstall kedua tools diatas, sekarang waktunya membuat project Golang.

Membuat Project

Buat folder dimana project kita ingin dibuat, misalnya folder belajar-ocr. kemudian masuk kedalam folder belajar-ocr

Lalu initiate module dengan memasukan perintah:

shell
go mod init belajar-ocr

Setelah menjalankan perintah diatas, install pacakge yang diperlukan, jalankan perintah:

shell
go get github.com/otiai10/gosseract/v2

Siapkan gambar yang ingin di convert menjadi teks, misalnya test.jpg

kemudian buat file main.go

go
package main

import (
	"fmt"

	"github.com/otiai10/gosseract/v2"
)

func main() {
	client := gosseract.NewClient()
	defer client.Close()
	client.SetImage("test.jpeg")
	text, _ := client.Text()
	fmt.Println(text)
}

Kemudian jalankan perintah:

shell
go run .

Dengan script sederhana seperti diatas, kita sudah berhasil membuat program convert gambar menjadi teks dengan OCR.

Silahkan eksplor kembali misalnya dengan membuat project dengan kasus:

Scan ID Card
Scan Plat Nomor
Dll

Kita juga bisa mengintegrasikan dengan Frontend seperti React JS supaya ada form upload gambar lalu akan menghasilkan output berupa teks.

Golang : Convert gambar menjadi teks dengan OCR

OCR, atau Optical Character Recognition, adalah teknologi yang digunakan untuk mengonversi teks dari gambar atau dokumen yang dipindai menjadi format teks yang dapat diedit dan dicari.