|

Nchọpụta ederede site na onyonyo iji EasyOCR: Ntuziaka zuru oke

N'isiokwu a, anyị ga-enyocha otu esi etinye OCR site na iji EasyOCR, ngwá ọrụ dị mfe iji, nke ziri ezi na ọtụtụ asụsụ. Na mgbakwunye na Bekee, ọba akwụkwọ a na-akwadokwa asụsụ ndị ọzọ. 

Nchọpụta ederede site na onyonyo iji EasyOCR: Ntuziaka zuru oke

Banyere Nchọpụta agwa anya (OCR)

Agbanyeghị, EasyOCR, ngwa OCR dabere na Python dabere na mmụta miri emi, na-enye gị ohere iwepu ederede na foto.

A na-akpọ ọrụ ọhụụ kọmputa maka iwepu mkpụrụedemede na onyonyo onyonyo (OCR).

A na-ejikarị OCR eme ihe n'ọtụtụ ọrụ dị iche iche, gụnyere ntụgharị asụsụ, iwepụta ụgwọ, njirimara akara ngosi, na ọtụtụ ndị ọzọ.

Agbanyeghị, mmejuputa OCR adịghị mfe. Ọbụlagodi na-agbakwunyeghị ihe nlegharị anya n'onwe ya, pipeline n'ozuzu ya gụnyere ọtụtụ usoro nhazi ụzọ. Ọ dabara nke ọma, EasyOCR dị anyị n'aka.

Kedu ihe bụ EasyOCR?

PyTorch na-eje ozi dị ka onye na-azụ azụ maka EasyOCR, ngwugwu Python.

Mgbe m na-eji EasyOCR, achọpụtara m na ọ bụ usoro enyi na enyi kacha mma maka iwepụta ederede na foto, ọbụlagodi mgbe ọbá akwụkwọ mmụta miri emi dị ike, dị ka PyTorch, na-akwado ya n'azụ.

Nke a na-abawanye ntụkwasị obi ziri ezi nke mmịpụta ederede.

EasyOCR na-akwado asụsụ 42+ maka nchọpụta asụsụ. Jaided AI Firm bụ ụlọ ọrụ mepụtara EasyOCR.

Otu esi amalite na njirimara ngwa anya

Site na njirimara ngwa anya, a na-enyocha mkpụrụedemede ọ bụla dị na ibe n'otu n'otu, na-enye ohere ka etinyere ederede gị ka ọ bụrụ akwụkwọ ederede karịa foto.

Modul Python akpọrọ EasyOCR na-eme ka njirimara ngwa anya dị mfe ime. A ga-etinye ya n'ọrụ na mmịpụta okwu site na ihe ngosi. Iji OpenCV, anyị ga-enwe ike ịhụ nsonaazụ ndị a.

Ihe ndị dị mkpa:
Ị ga-enwerịrị: ka i wee soro nkuzi a.

  • Mụta maka ịme ihe ngosi site na iji mmụta igwe.
  • Jiri Google Colab ma ọ bụ Jupyter Notebook.

1. Wụnye isi ndabere

  • Pytorch

Ọ nwere ike ịbụ ntakịrị ihe ịma aka ịwụnye PyTorch dị ka ngwugwu zuru ezu, yabụ anyị na-atụ aro ịgagharị webụsaịtị PyTorch gọọmentị. 

Ị ga-aghọta ya interface mgbe ị na-aga banyere usoro ka ị site na ukara website.

Ugbu a, ọ bụrụ na i jiri nlezianya nyochaa foto dị n'elu, ị ga-ahụ na e nwere ọtụtụ ohere anyị nwere ike ịhọrọ ma nweta iwu kachasị mma na mmasị anyị.

Mgbe ị na-agafe na webụsaịtị, a na-atụ anya ka ị họrọ ngwugwu: pip na Compute n'elu ikpo okwu: CPU, na n'ihi ya, ị ga-enweta iwu: pip tinye ọkụ ọkụ ọkụ ọkụ. 

Ozugbo ị nwetara iwu a, ịwụnye ọba akwụkwọ PyTorch ga-adị mfe dịka ịga ije na achicha ahụ. Naanị mee iwu a na ngwa ngwa.

  • EasyOCR

Ịgba iwu na-esonụ ga-arụnye ọbá akwụkwọ EasyOCR nke ọma mgbe etinyere ọba akwụkwọ PyTorch.

Nye iwu: pip3 wụnye easyocr

2. Ụlọ akwụkwọ na-ebubata

kpọbata gị

Ọzọkwa, bubata easyocr

mbubata cv2

si matplotlib mbubata pyplot dị ka plt

bubata numpy dika np

3. Ịgụ Foto

  • Ịse foto n'ịntanetị: Ebe a, anyị ga-esetịpụ foto site na URL (online)

IMAGE_PATH = 'https://blog.aspose.com/wp-content/uploads/sites/2/2020/05/Perform-OCR-using-C.jpg

A na-echekwa URL nke onyonyo a na mgbanwe IMAGE PATH dị na koodu ewepụtara n'elu.

  • Ịse foto dị ka ntinye na mpaghara: N'ebe a, anyị ga-ese foto site na sistemụ mpaghara.

IMAGE_PATH = 'Mee-OCR.jpg'

Otu nwere ike ịhụ site na snippet koodu dị n'elu na m wepụrụ onyinyo ahụ site na usoro mpaghara.

4. Na-ewepụ Ederede Site na Foto

  • Nchọpụta ederede Bekee

onye na-agụ = easyocr.Reader(['en'])

nsonaazụ = reader.readtext(IMAGE_PATH, paragraf = "Ụgha")

mmepụta:

[[[95, 71], [153, 71], [153, 107], [95, 107], 'OCR']

Na-agbakwụnye onyonyo maka mmasị gị.

N'ikpeazụ, anyị enweela ike iwepụta ederede na onyonyo enyere.

N'ahịrị n'ahịrị, ka anyị nyochaa koodu:

  • N'ebe a, anyị na-eji klas Reader sitere na klas EasyOCR ma na-enye ['en'] dị ka àgwà, nke mere na ọ ga-amata naanị akụkụ Bekee nke ihe oyiyi ahụ dị ka ederede; ọ bụrụ na ọ chọta asụsụ ndị ọzọ, dị ka Chinese na Japanese, ọ ga-eleghara ihe odide ndị ahụ anya.
  • Ugbu a anyị edobela akụrụngwa asụsụ n'ahịrị dị n'elu, mgbe anyị na-ebunye IMAGE PATH na ọrụ readText (), paramita “paragraf” ka edobere ụgha, nke pụtara na easyOCR agaghịzi ejikọta nsonaazụ ya, ntụgharị Ọ bụrụ na easyocr na-agba ọsọ. n'ime ọtụtụ ederede, ọ ga-egosipụta nke ọ bụla iche iche kama ijikọta ha.
  • Inweta nsonaazụ dị ka nhazi 2-D NumPy.

Anyị webata ihe anọ:

  • EasyOCR bụ ngwugwu bụ isi anyị ga-eji rụọ njirimara njirimara anya.
  • MepeeCV dị ka cv2. Ọ ga-enyere anyị aka bubata ihe onyonyo anyi ma jiri anya nke uche hụ ya.
  • Matplotlib na-enyekwa aka n'ile anya.
  • Numpy iji nyere aka mee mgbako mgbakọ na mwepụ.

Otu esi eji EasyOCR wepụ ederede na onyonyo

Nke mbụ, anyị kwesịrị ịgafe na easyocr reader wee gafee n'asụsụ anyị chọrọ iji. N'ọnọdụ anyị, nke ahụ ga-abụ Bekee.

Nke abuo, na-eji ocr_reader, anyị na-agafe na iwu ederede na-agafe na anyị oyiyi. Anyị na-echekwa nsonaazụ ndị a na mgbanwe akpọrọ nsonaazụ.

ocr_reader = easyocr.Reader(['en'])
results = ocr_reader.readtext(image)

Ntinye:

([[121.756503204768, 455.2312153828863],
   [389.1020796120134, 432.6470713866934],
   [389.24349679523203, 524.7687846171136],
   [122.8979203879866, 547.3529286133066]],
  'GOOD',
  0.5394189953804016),
 ([[126.45506700720357, 542.3292546273735],
   [389.0906482289428, 511.83345289506786],
   [393.5449329927964, 599.6707453726265],
   [130.90935177105715, 630.1665471049322]],
  'NEWS',
  0.993106484413147),
 ([[190.6717988226486, 618.007698233973],
   [392.5179510077811, 588.6436857858664],
   [398.3282011773514, 642.992301766027],
   [196.48204899221892, 672.3563142141336]],
  'COMING',
  0.9999751310992928)]

Mgbe iji EasyOCR na ihe oyiyi ahụ, anyị nwere ike ịhụ na e wepụrụ ederede ahụ nke ọma na ihe oyiyi ahụ na ntụkwasị obi dị elu.

Ọnụọgụ dị iche iche na-egosi nhazi nke ebe ederede anyị dị n'ime foto a.

mmechi

N'ọtụtụ ụzọ, EasyOCR na-eme nke ọma Tesseract (njin OCR ọzọ nke google mebere nke ejiri python ngwugwu Pytesseract).

Ọ dị mfe iji, na-achọ naanị ahịrị koodu ole na ole iji mejuputa, ma na-enye nsonaazụ ziri ezi maka ọtụtụ foto enyochala.

Ọzọkwa, a na-agbasakwa ya n'ọtụtụ asụsụ. Ebe nchekwa GitHub nke AIM na-akwado koodu isi mmalite zuru oke. 

Ọtụtụ mgbe Ẹbụp Ajụjụ

Onye na-agụ agwa ebipụtara nke dabere na typeface ma na-eji usoro ndakọrịta template.

Ee, ọ bụ.

Ee, ọ bụ.

Sechọpụta

Ọ dị ezigbo mma.

Google Cloud Vision API

Pytesseract ma ọ bụ Python-tesseract

Yiri Posts

Nkume a-aza

Na adreesị email gị agaghị bipụtara. Chọrọ ubi na- *