Kas ir optisko rakstzīmju atpazīšana (OCR)?

Optisko rakstzīmju atpazīšana (OCR) attiecas uz programmatūru, kas izveido drukātu, drukātu vai ar roku rakstītu dokumentu ciparu versiju, kuru datori var nolasīt bez nepieciešamības manuāli ievadīt vai ievadīt tekstu. OCR parasti tiek izmantots skenētajos dokumentos PDF formātā, bet var arī izveidot datorā lasāmu teksta versiju attēla failā.

Kas ir OCR?

OCR, kas arī tiek dēvēta par teksta atpazīšanu, ir programmatūras tehnoloģija, kas no drukātiem vai rakstiskiem dokumentiem elektroniskos veidos pārveido tādas rakstzīmes kā ciparus, burtus un pieturzīmes (piemēram, glifu), kuras ir vieglāk atpazīstamas un nolasītas datoros un citās programmatūras programmās. Dažas OCR programmas to dara kā dokumentu, ko skenē vai fotografē ar digitālo kameru, bet citi to var pielietot dokumentiem, kas iepriekš ir skenēti vai fotografēti bez OCR. OCR ļauj lietotājiem meklēt PDF dokumentos, rediģēt tekstu un pārformatēt dokumentus.

Kas ir OCR lietots?

Lai ātri, katru dienu skenēšanas vajadzībām, OCR, iespējams, nav liels darījums. Ja veicat lielu skenēšanas daudzumu, meklējot PDF failos, lai atrastu precīzu nepieciešamo, var ietaupīt diezgan daudz laika, un OCR funkcionalitāte jūsu skenera programmā kļūst svarīgāka. Šeit ir dažas citas lietas, ar kurām OCR palīdz:

Kāpēc izmantot OCR?

Kāpēc ne tikai uzņemt attēlu, vai ne? Tā kā jūs nevarēsit kaut ko rediģēt vai meklēt tekstu, jo tas vienkārši būtu attēls. Dokumenta skenēšana un OCR programmatūras darbināšana var pārvērst šo failu kaut ko, ko jūs varat rediģēt un varēsit meklēt.

OCR vēsture

Lai gan ļoti agrākais teksta atpazīšanas izmantošanas datums ir 1914. gads, plaši izplatītā OCR tehnoloģiju attīstīšana un izmantošana 1950. gadā sākās nopietni, it īpaši izveidojot ļoti vienkāršotus fontus, kurus bija vieglāk pārvērst par digitāli lasāmu tekstu. Pirmais no šiem vienkāršotajiem fontiem tika izveidots ar David Shepard un pazīstams kā OCR-7B. OCR-7B joprojām tiek izmantots finanšu nozarē šodien, izmantojot standarta fontu, ko izmanto kredītkartēs un debetkartēs. 1960. gados vairāku valstu pasta pakalpojumi sāka izmantot OCR tehnoloģiju, lai ievērojami paātrinātu pasta sūtījumu šķirošanu, tostarp Amerikas Savienotajās Valstīs, Lielbritānijā, Kanādā un Vācijā. OCR joprojām ir galvenā tehnoloģija, ko izmanto, lai sakārtotu pasta pakalpojumus visā pasaulē. 2000. gadā galvenās zināšanas par OCR tehnoloģiju ierobežojumiem un iespējām tika izmantotas, lai izstrādātu CAPTCHA programmas, ko izmanto, lai apturētu roboti un surogātpasta izplatītājus.

Vairāk nekā desmitgadēs OCR ir kļuvusi precīzāka un sarežģītāka, pateicoties progresam saistītās tehnoloģiju jomās, piemēram, mākslīgā intelekta , mašīntulkošanas un datoru redzes jomā. Šodien OCR programmatūra izmanto rakstzīmju atpazīšanu, funkciju noteikšanu un teksta ieguvi, lai dokumentus ātrāk un precīzāk pārveidotu nekā jebkad agrāk.