ocr 是什麼
科技

什麼是OCR,它的用途是什麼?

身為一個上班族,在辦公室不免會需要用到掃描,將紙本文件掃到電腦。這樣看似一個普遍到不行的功能,其實就是來自於,你可能聽過的一種神奇的技術 -「光學字元識別(OCR)」。但是到底 OCR 是什麼 ?光學字元識別的作用又是什麼呢?以下文章就來為你介紹OCR的含義,並帶你來看看 OCR 除了大家所熟悉的掃描技術外,現在最先進的應用方式。

到底什麼是OCR?

從字面上看,OCR代表光學字元識別,識別圖像中的文本例如掃描的文檔和照片,並且是一項廣泛的技術。OCR技術可以用於將手寫文本,像是打字、手寫或影印的幾乎任何類型的圖像,轉換為機器可讀的文本數據。

OCR技術在1990年代初開始流行,同時還嘗試了對歷史報紙進行數據化處理。從那時開始,這項技術就持續在進步、升級,如今,OCR 幾乎可以說是已經到到了完美的等級。

OCR 技術的應用

OCR最著名的應用,應該就是是將打印的紙質文檔轉換為機器可讀的文本文檔。但現在一旦掃描的紙質文檔經過OCR處理,就可以輕易使用文字編輯器編輯該文檔的文本,例如:

  • 微軟Word
  • Google Doc.

在使用OCR技術之前,數據化打印紙質文檔的唯一選擇,是手動重新鍵入文本。這不僅非常耗時,而且還可能有不准確和鍵入錯誤的狀況發生。

OCR 的應用其實比你想的還要廣泛很多,通常被用作「隱藏技術」,為我們日常生活中的許多知名系統和服務提供支持。OCR技術的鮮為人知,但重要的應用技術,包括數據輸入自動化、搜索引擎的索引文檔、自動車牌識別以及為盲人和視障人士提供幫助。

事實證明,OCR技術在對歷史悠久的報紙和文本進行數據化方面非常有用,這些報紙和文本現在已轉換為完全可搜索的格式,並使得訪問這些早期文本變得更加容易和快捷。