Ja jums ir nepieciešams digitalizēt grāmatu teksta formātā, jums var rasties vairāki jautājumi. Vai to var izdarīt?Kā ar kvalitāti, vai tā ir laba? To var ne tikai izdarīt, bet ir arī vairāki veidi, kā pārvērst skenētu dokumentu uz Word. Paskatīsimies:
- Dokumenta skenēšana PDF formātā un tā rediģēšana vēlāk ar Adobe Acrobat XI Pro, lai saglabātu to Word formātā. Acrobat Pro versija ir apmaksāta, taču jūs varat iegādāties bezmaksas 30 dienu izmēģinājuma licenci.
- No vietnes OnlineOCR.net. Šī tīmekļa lietojumprogramma ļauj konvertēt dokumentus PDF, JPG, TIFF un GIF formātos uz Word, Excel un tekstu. Bezmaksas versijā mēs varam konvertēt līdz 15 lapām stundā un dokumentus ne vairāk kā vienu lapu.
- Dokumenta skenēšana (OCR) formātā un saglabājot to kā tekstu. Pēc tam varam atvērt Word un rediģēt vai saglabāt to .doc formātā.
- Izmantojot kādu optisko rakstzīmju atpazīšanas programmu:
- VueScan (pieejams operētājsistēmām Windows, Mac OS X un Linux)
- Kooka(operētājsistēmai Linux)
- Biroja objektīvs (paredzēts Android un ios)
- CamScanner (par Android un ios)
Visefektīvākais veids, ko mēs varētu teikt, ir Adobe Acrobat Pro, bet tikai tad, ja skenēšana ir ļoti, ļoti tīra un augstas kvalitātes. Optiskās rakstzīmju atpazīšanas lietojumprogrammas ir sasniegušas garu ceļu, taču tajās joprojām ir redzamas dažas nepilnības, piemēram, treknrakstā vai slīprakstā, un dažu vārdu transkripcija atkarībā no oriģinālā dokumenta fonta veida var būt nepareiza.
Mēģiniet skenēt un nodot šo dokumentu programmai Word, lai redzētu, kas notiekNo paša skenera
Daži skeneri savā skenēšanas programmā ietver optiskās atpazīšanas (OCR) funkciju. Lai skenētu dokumentu tekstā, jums vienkārši jāiestata digitalizācijas formāts un jāskatās tāds, kas attiecas uz OCR vai līdzīgu (tas ir atkarīgs no skenera zīmola/modeļa).
Pārejiet no PDF uz Word, izmantojot Adobe Acrobat XI Pro
Reiz Adobe Acrobat XI Pro (ŠEIT jums ir 30 dienu bezmaksas izmēģinājuma versija), dodieties uz “Rīki -> Teksta atpazīšana -> Šajā failā”.
logā "Atpazīt tekstu"Klikšķiniet uz"RediģētUn izvēlieties teksta valodu, izvades stilu un izšķirtspēju.
Lai pabeigtu, dodieties atpakaļ uz "Rīki -> Satura rediģēšana -> Rediģēt tekstu un attēlus"Un mainiet tekstu, ja jums ir nepieciešams labot vārdu. Lai pabeigtu, noklikšķiniet uz "Fails -> Saglabāt kā”Un saglabājiet to Word formātā.
Tiešsaistes OCR
OnlineOCR ir tīmekļa lietojumprogramma attēlu vai PDF failu pārsūtīšanai uz Word, un to ir ļoti viegli lietot. Es paskaidroju, kā tas darbojas: Ievadiet //www.onlineocr.net/ un noklikšķiniet uz "Izvēlieties failu”. Atlasiet skenēto dokumentu un pēc tam izvēlieties valodu un izvades formātu no 2 nolaižamajām izvēlnēm, kas atrodas ekrāna centrā.
Lai pabeigtu, noklikšķiniet uz "Konvertēt”. Tieši zem tā parādīsies vienkārša teksta priekšskatījums, ko varat rediģēt, ja nepieciešams labot vārdus. Visbeidzot noklikšķiniet uz "Lejupielādēt izvades failuUn jūs varat lejupielādēt failu Word formātā. Šeit ir piemērs PDF failam, kas konvertēts uz Word, izmantojot OnlineOCR:
- Oriģināls PDF:
- Konvertēts dokuments:
Ja šī tīmekļa lietojumprogramma jūs neapmierina, varat izmēģināt citas līdzīgas alternatīvas, piemēram, FreeOCR vai Bezmaksas tiešsaistes OCR.
Optiskās rakstzīmju atpazīšanas (OCR) programmas
Ja nevēlaties modificēt savus dokumentus tiešsaistē un jums ir nepieciešama darbvirsmas lietojumprogramma, varat izmantot tādas lietojumprogrammas kā VueScan (kas ir pieejams arī operētājsistēmām Mac un Linux papildus visuresošajai Windows).
Vēl viena iespēja ir izmantot savu Android vai iOS ierīci, lai skenētu dokumentu un tieši pārvērstu to tekstā. Ir tādas aplikācijas kā Biroja objektīvs (priekš Android un ios) vai CamScanner (priekš Android un ios), kas visu procesu veic no vienas un tās pašas lietojumprogrammas. Šādos gadījumos ir ieteicams notīrīt attēlu pirms tā konvertēšanas tekstā. Ja vēlaties uzzināt vairāk par šo metodi, apskatiet ŠO POSTĪJUMU.
Manuprāt, optiskā rakstzīmju atpazīšanas tehnika, lai arī pēdējos gados ir krietni uzlabojusies, tomēr ir gaismas gadu attālumā no tā, lai tā būtu perfekta tehnika. Daudz detaļu, daudz vārdu, ko tā "tulko" ar nepareiziem burtiem un simboliem, kas piegružo tekstu. Viņam joprojām trūkst šīs papildu inteliģences kas liek tev redzēt, ka «t &! $ olog1a»Nevar būt derīgs neviena vārda tulkojums tekstā. Es joprojām neredzu lasīšanas izpratni, bet gan vienkāršu atsevišķu burtu vizuālu atpazīšanu, kas veido vārdus, neintegrējot tos ar pārējo tekstu. Tomēr esmu pārliecināts, ka brīdis, kad veiksim pēdējo lielo lēcienu, ar katru dienu tuvojas.
Tev ir Telegramma uzstādīts? Saņemiet katras dienas labāko ziņu vietnē mūsu kanāls. Vai arī, ja vēlaties, uzziniet visu no mūsu Facebook lapa.