364 results found (page 2 of 25)
https://www.academia.edu/145264934/Evaluating_LLMs_for_Historical_Document_OCR_A_Methodolo…

…imilarly, Kim et al. (2025) found general-purpose LLMs outperforming tools like Tesseract and TrOCR on historical tables, and early benchmarks highlight the importance of prompt design (e.g., two-shot prompting, line-by-line input) (Kim et al., 2025). However, recent studies unde…

https://ja.wikipedia.org/wiki/%E5%85%89%E5%AD%A6%E6%96%87%E5%AD%97%E8%AA%8D%E8%AD%98

…ルゴリズムなどの最も近い近隣分類子は、画像フィーチャと格納されているグリフフィーチャを比較し、最も近い一致を選択する [ 23 ] 。 Cuneiform や Tesseract などのソフトウェアは、文字認識に2パス法を使用する。2番目のパスは「適応認識」と呼ばれ、最初のパスで高い信頼を得て認識された文字形状を使用して、2番目のパスの残りの文字をより良く認識する。これは、特殊なフォントやフォントが歪んでいる(例えば、ぼやけた、またはフェードされている)低品質でスキャンされた画像に有利である [ 20 ] 。 OCRopus や Tesseractのよう…

https://archive.org/details/currentsinameric0000bilh

…765618214 9780765618177 0765618176 9780765618191 0765618192 Lccn 2006024935 Ocr tesseract 4.1.1 Ocr_detected_lang en Ocr_detected_lang_conf 1.0000 Ocr_detected_script Latin Ocr_module_version 0.0.5 Ocr_parameters -l eng Old_pallet IA19343 Openlibrary_edition OL17999542M Openlibra…

https://archive.org/details/dancingwithdevil0000wils

…ntifier-ark ark:/13960/t8gg0xp7p Invoice 1652 Isbn 000257103X 9780002571036 Ocr tesseract 4.1.1 Ocr_detected_lang en Ocr_detected_lang_conf 1.0000 Ocr_detected_script Latin Ocr_detected_script_conf 0.9187 Ocr_module_version 0.0.11 Ocr_parameters -l eng Old_pallet IA-NS-2000217 Op…

https://archive.org/details/speakingcultural0000john

… ark:/13960/t3dz9n84s Invoice 2089 Isbn 0803959117 0803959125 Lccn 99006890 Ocr tesseract 4.1.1 Ocr_converted abbyy-to-hocr 1.1.4 Ocr_detected_lang en Ocr_detected_lang_conf 1.0000 Ocr_detected_script Latin Ocr_detected_script_conf 0.9850 Ocr_module_version 0.0.12 Ocr_parameters …

https://archive.org/details/primeministersfr0000thom_l8z5

…ntifier-ark ark:/13960/t82k6dm4q Invoice 1652 Isbn 9780436520457 0436520451 Ocr tesseract 4.1.1 Ocr_detected_lang en Ocr_detected_lang_conf 1.0000 Ocr_detected_script Latin Ocr_detected_script_conf 0.9654 Ocr_module_version 0.0.10 Ocr_parameters -l eng Old_pallet IA-WL-2000018 Op…

https://archive.org/details/sim_journal-of-business-ethics_2010-11_96_4/page/534

…rg Next_item sim_journal-of-business-ethics_2010_96_supplement Noindex true Ocr tesseract 4.1.1 Ocr_detected_lang en Ocr_detected_lang_conf 1.0000 Ocr_detected_script Thai Ocr_detected_script_conf 0.5239 Ocr_module_version 0.0.10 Ocr_parameters -l eng Page_number_confidence 95.00…

https://archive.org/details/queenelizabethqu0000shaw_r7u5

…1405048590 140504859X 9780330434300 0330434306 Lccn 2010398131 Noindex true Ocr tesseract 4.1.1 Ocr_detected_lang en Ocr_detected_lang_conf 1.0000 Ocr_detected_script Latin Ocr_module_version 0.0.4 Ocr_parameters -l eng Old_pallet IA18101 Openlibrary_edition OL26808961M Openlibra…