OCR (Optical character recognition) 是光學字元識別,是將圖片文件進行分析處理,已獲得其內容的文字的過程。
最近阿德的表姐請阿德幫忙翻譯論文,給了很多掃描的圖檔。由於不是自己的專業,
再加上掃描圖片模糊不清楚。只好來請求google大神的幫忙。以下是大概的流程:
- 先到google學術找尋相關的論文。http://scholar.google.com.tw/
- 將論文下載,然後將論文轉換成tiff圖檔。
- 透過Free Online OCR 擷取文字內容。http://www.newocr.com/
- 在到google翻譯,轉換成中文。http://translate.google.com.tw/
雖然google中文翻譯沒有辦法很流暢,但是至少有了一些中英對照。可以加速閱讀的速度。
最後也順利的完成這個任務。
接下來也把這個不錯的網站介紹給大家,如果沒有購買OCR系統的話,也可以透過這個網站來進行文字擷取的動作。
如何使用Free Online OCR來擷取圖片上的文字
目前能夠轉換的格式
- JPEG
- PNG
- GIF
- BMP
- TIFF
- DjVu
操作方式如下
1.目前也支援繁體中文和簡體中文。
進入網站: http://www.newocr.com/
2. 選擇上傳的檔案/語言,然後點選預覽,就會看到預覽結果
3. 點選OCR,就會擷取圖片的文字內容
4. 擷取文字內容
近期留言