សេវាទទួលស្គាល់អត្ថបទលើអ៊ីនធឺណិត

ស្វាគមន៍ដល់អ្នកអានទាំងអស់នៃប្លក់!

ខ្ញុំគិតថាអ្នកដែលឧស្សាហ៍ធ្វើការនៅកុំព្យូទ័រ (មិនលេងប៉ុន្តែវាធ្វើការ) ត្រូវតែដោះស្រាយការទទួលស្គាល់អត្ថបទ។ ជាឧទាហរណ៍អ្នកបានស្កេនដកស្រង់ពីសៀវភៅហើយឥឡូវនេះអ្នកត្រូវបិទភ្ជាប់ផ្នែកនេះទៅក្នុងឯកសាររបស់អ្នក។ ប៉ុន្តែឯកសារដែលបានស្កេនគឺជារូបភាពហើយយើងត្រូវការអត្ថបទ - សម្រាប់រឿងនេះយើងត្រូវការកម្មវិធីពិសេសនិងសេវាកម្មតាមអ៊ិនធរណេតសម្រាប់ការទទួលស្គាល់អត្ថបទពីរូបភាព។

អំពីកម្មវិធីសម្រាប់ការទទួលស្គាល់, ខ្ញុំបានសរសេររួចហើយនៅក្នុងការប្រកាសមុន:

- ស្កេនអត្ថបទនិងការទទួលស្គាល់នៅក្នុង FineReader (កម្មវិធីបង់ប្រាក់) ។

- ធ្វើការក្នុង FineReader analogue - CuneiForm (កម្មវិធីឥតគិតថ្លៃ) ។

នៅក្នុងអត្ថបទដូចគ្នានេះខ្ញុំចង់ផ្ដោតលើសេវាលើអ៊ីនធឺណិតដើម្បីទទួលស្គាល់អត្ថបទ។ បន្ទាប់ពីទាំងអស់, ប្រសិនបើអ្នកត្រូវការដើម្បីទទួលបានអត្ថបទយ៉ាងរហ័សជាមួយ 1-2 រូបភាព - វាធ្វើឱ្យយល់បានដើម្បីកុំបារម្ភជាមួយនឹងការដំឡើងកម្មវិធីនានា ...

វាសំខាន់ណាស់! គុណភាពនៃការទទួលស្គាល់ (ចំនួនកំហុស, ភាពងាយស្រួលអានជាដើម) ពឹងផ្អែកយ៉ាងខ្លាំងទៅលើគុណភាពរូបភាពដើម។ ដូច្នេះនៅពេលស្កេន (ថតរូប។ ល។ ) សូមជ្រើសរើសគុណភាពខ្ពស់បំផុតតាមដែលអាចធ្វើទៅបាន។ ក្នុងករណីភាគច្រើនគុណភាពនៃ 300-400 dpi គឺគ្រប់គ្រាន់ (dpi គឺជាប៉ារ៉ាម៉ែត្រដែលបញ្ជាក់ពីគុណភាពរូបភាពនៅក្នុងការកំណត់នៃម៉ាស៊ីនស្កេនស្ទើរតែទាំងអស់ប៉ារ៉ាម៉ែត្រនេះត្រូវបានចង្អុលបង្ហាញជាធម្មតា) ។

សេវាអនឡាញ

ដើម្បីបង្ហាញពីការងារនៃសេវាកម្មខ្ញុំបានបង្កើតរូបថតមួយនៃអត្ថបទរបស់ខ្ញុំ។ រូបថតអេក្រង់នេះនឹងត្រូវបានផ្ទុកឡើងទៅគ្រប់សេវាកម្មដែលការពិពណ៌នារបស់វាត្រូវបានបង្ហាញខាងក្រោម។

1) //www.ocrconvert.com/

ខ្ញុំពិតជាចូលចិត្តសេវាកម្មនេះដោយសារភាពសាមញ្ញរបស់វា។ ទោះបីជាគេហទំព័រនេះជាភាសាអង់គ្លេសក៏ដោយវាក៏ដំណើរការល្អជាមួយភាសារុស្ស៊ីដែរ។ អ្នកមិនចាំបាច់ចុះឈ្មោះទេ។ ដើម្បីចាប់ផ្ដើមទទួលស្គាល់អ្នកត្រូវធ្វើ 3 ជំហាន:

- បង្ហោះរូបភាពរបស់អ្នក។

- ជ្រើសភាសានៃអត្ថបទដែលមាននៅក្នុងរូបភាព;

- ចុចប៊ូតុងចាប់ផ្តើមទទួលស្គាល់។

ការគាំទ្រទ្រង់ទ្រាយ: PDF, GIF, BMP, JPEG ។

លទ្ធផលត្រូវបានបង្ហាញដូចខាងក្រោមនៅក្នុងរូបភាព។ ខ្ញុំត្រូវនិយាយថាអត្ថបទត្រូវបានទទួលស្គាល់យ៉ាងច្បាស់។ លើសពីនេះទៀតយ៉ាងឆាប់រហ័ស - ខ្ញុំបានរង់ចាំព្យញ្ជនៈ 5-10 វិនាទី។

2) //www.i2ocr.com/

សេវាកម្មនេះដំណើរការដូចគ្នាទៅនឹងខាងលើដែរ។ នៅទីនេះអ្នកក៏ត្រូវទាញយកឯកសារជ្រើសរើសភាសាការទទួលស្គាល់ហើយចុចប៊ូតុងទាញយកអត្ថបទ។ សេវាកម្មនេះដំណើរការយ៉ាងឆាប់រហ័ស: 5-6 វិនាទី។ ទំព័រមួយ។

ទ្រង់ទ្រាយដែលគាំទ្រ: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM ។

លទ្ធផលនៃសេវាកម្មអនឡាញនេះគឺមានភាពងាយស្រួលជាងមុន: អ្នកឃើញបង្អួចពីរភ្លាមៗ - នៅក្នុងលទ្ធផលដំបូងនៃការទទួលស្គាល់ក្នុងរូបភាពទី 2 - រូបភាពដើម។ ដូច្នេះវាងាយស្រួលក្នុងការកែសម្រួលក្នុងវគ្គសិក្សា។ ចុះឈ្មោះនៅលើសេវាដោយវិធីនេះក៏មិនចាំបាច់។

3) //www.newocr.com/

សេវាកម្មនេះគឺមានតែមួយគត់តាមរបៀបជាច្រើន។ ដំបូងវាគាំទ្រទ្រង់ទ្រាយថ្មី "DJVU" (ដោយវិធីនេះបញ្ជីពេញលេញនៃទ្រង់ទ្រាយ: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu) ។ ទីពីរវាគាំទ្រការជ្រើសរើសផ្នែកអត្ថបទនៅក្នុងរូបភាព។ នេះមានប្រយោជន៍នៅពេលដែលអ្នកមាននៅក្នុងរូបភាពមិនត្រឹមតែតំបន់អត្ថបទប៉ុណ្ណោះទេប៉ុន្តែវាក៏ជារូបភាពក្រាហ្វិកផងដែរដែលអ្នកមិនចាំបាច់ស្គាល់។

គុណភាពនៃការទទួលស្គាល់មានលើសពីមធ្យមមិនចាំបាច់ចុះឈ្មោះឡើយ។

4) //www.free-ocr.com/

សេវាកម្មសាមញ្ញបំផុតសម្រាប់ការទទួលស្គាល់: ផ្ទុករូបភាពឡើង, បញ្ជាក់ភាសា, បញ្ចូល captcha (ដោយវិធី, សេវាកម្មតែមួយគត់នៅក្នុងអត្ថបទនេះដែលអ្នកត្រូវធ្វើ) ហើយចុចប៊ូតុងដើម្បីបកប្រែរូបភាពទៅជាអត្ថបទ។ តាមការពិតអ្វីៗគ្រប់យ៉ាង!

ទ្រង់ទ្រាយដែលបានគាំទ្រ: PDF, JPG, GIF, TIFF, BMP ។

លទ្ធផលទទួលស្គាល់គឺមធ្យម។ មានកំហុសឆ្គងប៉ុន្តែមិនមែនច្រើនទេ។ ទោះជាយ៉ាងណាក៏ដោយប្រសិនបើគុណភាពនៃរូបថតអេក្រង់ដើមនឹងខ្ពស់ជាងនោះវានឹងមានកំហុសឆ្គងតិចតួច។

PS

នោះជាអ្វីទាំងអស់សម្រាប់ថ្ងៃនេះ។ ប្រសិនបើអ្នកដឹងពីសេវាកម្មដែលគួរអោយចាប់អារម្មណ៍សម្រាប់ការទទួលស្គាល់អត្ថបទ - ចែករំលែកមតិយោបល់ខ្ញុំនឹងដឹងគុណ។ លក្ខខណ្ឌមួយ: វាជាការចង់បានដែលអ្នកមិនចាំបាច់ចុះឈ្មោះនិងសេវាកម្មនេះឥតគិតថ្លៃ។

ទាក់ទងល្អបំផុត!

មើលវីដេអូ: Python - Intro to Computer Science - Harvard's CS50 2018 (ខែមេសា 2024).