Tambua maandishi katika faili ya PDF mtandaoni.


Si mara zote inawezekana kuondoa dhana kutoka kwa faili la PDF kwa kutumia nakala ya kawaida. Mara nyingi kurasa za nyaraka hizo ni maudhui yaliyotambuliwa ya matoleo yao ya karatasi. Ili kubadili faili hizo katika data kamili ya maandishi, mipango maalum na kazi ya Optical Character Recognition (OCR) hutumiwa.

Ufumbuzi huo ni vigumu sana kutekeleza na kwa hiyo, gharama ya pesa nyingi. Ikiwa unahitaji kutambua maandishi na PDF mara kwa mara, ni vyema kununua programu inayofaa. Kwa matukio ya kawaida, itakuwa ni mantiki zaidi kutumia moja ya huduma za mtandaoni zilizopo na kazi sawa.

Jinsi ya kutambua maandishi kutoka PDF online

Bila shaka, kipengele cha huduma za OCR mtandaoni kinawekwa mdogo ikilinganishwa na ufumbuzi kamili wa desktop. Lakini unaweza kufanya kazi na rasilimali hizo ama kwa bure, au kwa ada ya majina. Jambo kuu ni kwamba programu zinazofanana za mtandao zinakabiliana na kazi yao kuu, yaani kutambua maandishi, pia.

Njia ya 1: ABBYY FineReader Online

Kampuni ya maendeleo ya huduma ni mojawapo ya viongozi katika uwanja wa kutambua hati ya macho. ABBYY FineReader kwa Windows na Mac ni suluhisho la nguvu la kugeuza PDF kwa maandishi na kufanya kazi nayo.

Mshirika wa wavuti wa programu, bila shaka, ni duni kwa utendaji. Hata hivyo, huduma inaweza kutambua maandishi kutoka kwenye picha na picha katika lugha zaidi ya 190. Inasaidia uongofu wa faili za PDF kwenye nyaraka Neno, Excel, nk.

ABBYY FineReader Online Online huduma

  1. Kabla ya kuanza kufanya kazi na chombo, fungua akaunti kwenye tovuti au uingie kwenye akaunti yako ya Facebook, Google au Microsoft.

    Ili kwenda kwenye dirisha login, bonyeza kitufe. "Ingia" katika bar ya menyu ya juu.
  2. Mara baada ya kuingia, ingiza hati ya PDF iliyohitajika kwenye FineReader kwa kutumia kifungo "Pakia Files".

    Kisha bonyeza "Chagua namba za ukurasa" na kutaja span taka ya utambuzi wa maandishi.
  3. Kisha, chagua lugha zilizopo kwenye waraka huo, muundo wa file iliyosababisha na bonyeza kifungo "Kujua".
  4. Baada ya usindikaji, muda ambao inategemea kabisa ukubwa wa waraka, unaweza kushusha faili iliyokamilishwa na data ya maandishi tu kwa kubonyeza jina lake.

    Au utafirisha kwa moja ya huduma za wingu zilizopo.

Huduma hiyo inajulikana, labda, na taratibu sahihi zaidi za kutambua Nakala katika picha na faili za PDF. Lakini, kwa bahati mbaya, matumizi yake ya bure ni mdogo kwenye kurasa tano kusindika kwa mwezi. Ili kazi na nyaraka zenye nguvu, unapaswa kununua ununuzi wa mwaka mmoja.

Hata hivyo, kama kazi ya OCR inahitajika mara chache sana, ABBYY FineReader Online ni chaguo kubwa la kuondokana na maandishi kutoka kwa faili ndogo za PDF.

Njia ya 2: Free Online OCR

Huduma rahisi na rahisi kwa kuandika maandishi. Bila haja ya usajili, rasilimali inakuwezesha kutambua kurasa kamili za PDF kwa saa. Free Online OCR hufanya kazi kikamilifu na nyaraka katika lugha 46 na bila idhini inasaidia mitambo ya nje ya maandishi ya tatu - DOCX, XLSX na TXT.

Wakati wa kusajili, mtumiaji anaweza kusindika hati nyingi za ukurasa, lakini idadi ya bure ya kurasa hizi ni mdogo kwa vitengo 50.

Free Online OCR huduma online

  1. Ili kutambua maandiko kutoka kwa PDF kama "mgeni", bila idhini ya rasilimali, tumia fomu sahihi kwenye ukurasa kuu wa tovuti.

    Chagua hati inayotakiwa kwa kutumia kifungo "Faili", taja lugha kuu ya maandishi, muundo wa pato, kisha kusubiri faili kupakia na bonyeza "Badilisha".
  2. Mwishoni mwa mchakato wa utambulisho, bofya "Pakua Faili ya Pato" ili kuhifadhi hati iliyokamilishwa na maandiko kwenye kompyuta.

Kwa watumiaji wenye mamlaka, mlolongo wa vitendo ni tofauti kabisa.

  1. Tumia kifungo "Usajili" au "Ingia" katika bar ya menyu ya juu kwa, kwa mtiririko huo, unda akaunti ya Free Online OCR au uingie ndani yake.
  2. Baada ya idhini katika jopo la kutambua, shika ufunguo "CTRL", chagua hadi lugha mbili za waraka wa chanzo kutoka kwenye orodha iliyotolewa.
  3. Taja chaguo zaidi za kuchukua maandishi kutoka PDF na bonyeza kitufe. "Chagua Faili" kupakia hati katika huduma.

    Kisha, kuanza kutambua, bofya "Badilisha".
  4. Baada ya usindikaji waraka, bofya kwenye kiungo na jina la faili ya pato kwenye safu sambamba.

    Matokeo ya utambuzi itakuwa mara moja kuhifadhiwa katika kumbukumbu ya kompyuta yako.

Ikiwa unahitaji kuchora maandishi kutoka kwenye hati ndogo ya PDF, unaweza kutumia mapumziko kwa kutumia zana iliyoelezwa hapo juu. Ili kufanya kazi na faili kubwa, utahitaji kununua alama za ziada kwenye Free Online OCR au upeo kwenye suluhisho lingine.

Njia ya 3: NewOCR

Huduma ya OCR ya bure kabisa ambayo inakuwezesha kuondoa maandiko kutoka kwa hati yoyote ya graphic na ya elektroniki kama DjVu na PDF. Rasilimali haina kuweka vikwazo kwenye ukubwa na idadi ya faili zinazojulikana, hauhitaji usajili, na hutoa kazi mbalimbali zinazohusiana.

NewOCR inasaidia lugha 106 na ina uwezo wa kushughulikia hata usahihi wa kumbukumbu za hati. Inawezekana kwa kuchagua manually eneo la kutambua maandishi kwenye ukurasa wa faili.

Huduma ya mtandaoni NewOCR

  1. Kwa hiyo, unaweza kuanza kufanya kazi na rasilimali mara moja, bila ya haja ya kufanya vitendo visivyohitajika.

    Moja kwa moja kwenye ukurasa kuu kuna fomu ya kuingiza waraka kwenye tovuti. Ili kupakia faili kwa NewOCR, tumia kifungo "Chagua faili" katika sehemu "Chagua faili yako". Kisha katika shamba "Lugha ya kutambua" chagua lugha moja au zaidi ya hati ya chanzo, kisha bofya "Pakia + OCR".
  2. Weka mipangilio yako ya kutambuliwa, chagua ukurasa unaotaka ili uondoe maandishi, na bofya kifungo. "OCR".
  3. Tembea chini na kupata kifungo. Pakua.

    Bofya juu yake na katika orodha ya kushuka chini chagua fomu iliyohitajika ya hati ya kupakua. Baada ya hapo, faili iliyokamilishwa na maandishi yaliyoondolewa itapakuliwa kwenye kompyuta yako.

Chombo ni rahisi na hutambua wahusika wote katika ubora wa kutosha. Hata hivyo, usindikaji wa kila ukurasa wa waraka wa PDF ulioingizwa lazima uanzishwe kwa uhuru na umeonyeshwa kwenye faili tofauti. Unaweza, bila shaka, nakala nakala ya kutambua kwa clipboard na kuunganisha pamoja na wengine.

Hata hivyo, kutokana na hali ya hapo juu, kiasi kikubwa cha maandishi kwa kutumia NewOCR ni vigumu sana kuchimba. Pamoja na nakala ndogo za huduma za faili "na bang."

Njia ya 4: OCR.Space

Rasilimali rahisi na inayoeleweka kwa kuandika maandiko inakuwezesha kutambua nyaraka za PDF na kutoa pato kwenye faili la TXT. Hakuna mipaka kwa idadi ya kurasa. Kikwazo pekee ni kwamba ukubwa wa hati ya pembejeo haipaswi kuzidi megabytes 5.

Huduma ya mtandaoni ya OCR.Space

  1. Kujiandikisha kufanya kazi na chombo sio lazima.

    Bonyeza tu juu ya kiungo hapo juu na uhifadhi hati ya PDF kwenye tovuti kutoka kwa kompyuta yako kwa kutumia kifungo "Chagua faili" au kutoka kwenye mtandao - kwa kutafakari.
  2. Katika orodha ya kushuka "Chagua lugha ya OCR" chagua lugha ya hati iliyoagizwa.

    Kisha kuanza mchakato wa kutambua maandishi kwa kubonyeza kifungo. "Anza OCR!".
  3. Mwishoni mwa usindikaji wa faili, angalia matokeo katika "Matokeo ya OCR'ed" na bofya Pakuakupakua hati iliyokamilishwa ya TXT.

Ikiwa unahitaji tu kuchora maandishi kutoka kwa PDF na muundo wa mwisho sio muhimu kabisa, OCR.Space ni chaguo nzuri. Hati pekee lazima iwe "monolingual", kwani kutambua lugha mbili au zaidi kwa wakati mmoja katika huduma haitolewa.

Angalia pia: Analogues Free FineReader

Kuchunguza zana za mtandaoni zinazotolewa katika makala hiyo, ni lazima ieleweke kwamba FineReader Online kutoka ABBYY inasimamia kazi ya OCR kwa usahihi na kwa usahihi. Ikiwa usahihi wa juu wa utambuzi wa maandishi ni muhimu kwako, ni vyema kutafakari chaguo hili. Lakini kulipa kwa hiyo, uwezekano mkubwa, lazima pia.

Ikiwa unahitaji kutafakari nyaraka ndogo na uko tayari kusahihisha makosa katika huduma mwenyewe, inashauriwa kutumia NewOCR, OCR.Space au Free Online OCR.