文章

【實測】3 個免費 OCR 辨識 (圖片轉文字) 到底哪一個好用?

OCR辨識

讀紙本書做數位筆記,難免需要用到 OCR 辨識功能,也就是傳說中的「圖片轉文字」,之前試過好幾個免費的 OCR 辨識功能,但我覺得最好用的只有 3 種: LINE、GOOGLE 和蘋果手機。

在這篇文章中,我會列出用手機實測 LINE 、 GOOGLE 和蘋果手機等 3 種 OCR 辨識的效果究竟如何,但要提醒你的是,我這邊只做單張的評測,如果是多張 OCR 辨識,你可能要另外找喔!

以下用同一張照片來實測效果。

LINE的 OCR 辨識功能 (圖片轉文字)

LINE 的 OCR 辨識功能是眾所皆知的,所以我用了一年多,期間也曾經好奇其他的 OCR 辨識怎麼樣,雖然 LINE 的 OCR 抓繁體老跳簡體,但其他 OCR 抓中文的效果更糟糕,最後只能乖乖回來用 LINE 的 OCR 辨識功能。

LINE-OCR1

在對話框裡面,點開最下面的照相和圖片的小圖示,都可以使用 OCR 辨識功能,如下圖:

LINE-OCR2
LINE-OCR3

最後的效果是:

A.沒有採取行動
個原因是最容易發現的,KPI由KDI累積而
未能達成KDI,當然也無法達成PI、這時就要使
楚過的WHY輯樹。但是,有些CASE除了沒有採
、還有其他的原因。因為問題發現得晚,所以仔細地
TODO層級的進度管理,同時確實達成DI就顯得很
B.有行動,但不夠
這是屬於就算達成KDI,但不足以達成KPI的
種可預期的現象。照說.在D階段應該篩
了,所以只要保留到調整階段,再追新的DO就可以了
C.課題遺漏
這種情況通常發生在計畫階段就該掌握的課題卻遺漏
了,例如,為了獲得參加新加坡某企業的合作經營討論會
的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發
現,原來對方正在放農暦年假。
要發現課題遺漏,主要是看團隊成員的障礙排除能力典
經驗值多寡,但是最應該率先懷疑的是自己的「念」·
計畫階段,每個人都會覺得自己的假設沒問題,結果
不再只是假設,而是事實。

如上所示,LINE 的 OCR 辨識圖片上的文字會有部分的字和標點跳掉,但抓繁體字的效果還可以。據我的經驗,有些頁面還是會跳一些簡體字或跳成近似字,總之,需要再校稿過。

Google Keep 的 OCR 辨識功能 (圖片轉文字)

本來一直都是在用 LINE 做 OCR 辨識,後來才知道 google 文件或 google keep 也可以,但因為我在手機上一直找不到 google 文件 App 的 OCR 辨識功能在哪(有誰知道的話,留言告訴我),就使用 google keep 來做實際測試。

先打開 google keep 的 App,按下圖示,可以「拍攝相片」或從相簿「選擇圖片」:

20231027 googlekeep OCR1

拍好相片或選好圖片後,就會直接存在新記事裡:

  1. 點開這個記事,一直按住照片,就會進入編輯模式。
  2. 點選右上角的「…」,會有「擷取圖片文字」的 OCR 辨識功能可選。
google keep OCR1
google keep OCR2

來看看最後的效果:

A. 沒有採取行動
這個原因是最容易發現的,KPI由KDI累積而成,如
果未能達成KDI,當然也無法達成KPI,這時就要使用之前
提過的 WHY邏輯樹。但是,有些CASE 除了沒有採取行動
外,還有其他的原因。因為問題發現得晚,所以仔細地進行
TO DO 層級的進度管理,同時確實達成KDI就顯得很重要。
B. 有行動,但不夠
這是屬於就算達成KDI,但不足以達成KPI的狀況,
是種可預期的現象。照理來說,在DO的階段應該就篩選過
了,所以只要保留到調整階段,再追新的DO就可以了。
C.課題遺漏
這種情況通常發生在計劃階段就該掌握的課題卻遺漏
了,例如,為了獲得參加新加坡某企業的合作經營討論會
的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發
現,原來對方正在放農曆年假。
要發現課題遺漏,主要是看團隊成員的障礙排除能力與
經驗值多寡,但是最應該率先懷疑的是自己的「執念」。在
計畫階段,每個人都會覺得自己的假設沒問題,結果演變成
不再只是假設,而是事實。

可以看到除了換行問題、標點符號半形外, google keep 的 OCR 辨識功能居然沒什麼跳字的問題,我前後試了幾次,真的在跳字和抓繁體中文方面的表現比 LINE 好上許多。

蘋果手機的 OCR 辨識功能 (圖片轉文字)

如果你的蘋果手機是 iOS 15 以上,直接開相機,當它感測到鏡頭前有文字,就會出現黃色框,將要轉錄的文字用黃框對準,按下右下角的紙張小圖示,就會出現它抓到的文字,你可以選取部分,也可以按左下角的全部拷貝。

20231027-apple-OCR1
20231027-apple-OCR2

最後的成果:

A. 沒有採取行動
這個原因是最容易發現的,KPI由 KDI累積而成,如果末能速成 KDI,當然也縣法達成KP福時就要使用之的擔過的 WHY 選輯樹。但是,有些 CASE 除下沒有採取行動外,還有其他的原因。因為問題發現得晚,所以仔細地進行T0O DO層級的進度管理,同時確質達成KDI 就顯得很重要。
B. 有行動,但不夠
這是屬於就算達成 KDI,但不足以達成 KPI 的狀況,是種可預期的現象。照理來說,在DO的階段應該就篩選過了,所以只要保留到調整階段,再追新的DO就可以了。
C. 課題遺漏
這種情況通常發生在計畫階段就該掌握的課題卻遺漏了,例如,為了獲得參加新加坡某企業的合作經營討論會的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發現,原來對方正在放農曆年假。
要發現課題遺漏,主要是看團隊成員的障礙排除能力與經驗值多寡,但是最應該率先懷疑的是自己的「執念」。在計畫階段,每個人都會覺得自己的假設沒問題,結果演雙成不再只是假設,而是事實。

可以看出,蘋果手機的 OCR 辨識功能在格式上比 google keep 更強,標點符號都是全形,且不會因圖片上的換行而換行,但錯字多一些。

結語

以下就「速度」、「格式」和「錯字」來比較 LINE、GOOGLE 和蘋果手機的 OCR 辨識效果:

  • 速度: google keep > 蘋果手機 > LINE
  • 格式: 蘋果手機 > google keep > LINE
  • 錯字: google keep > 蘋果手機 > LINE

就速度來說,google keep 點下去根本不到一秒就好了,我還在想「有按到嗎」,結果往下一滑就看到了,會存在同一個記事裡。蘋果手機轉圈圈的速度比 LINE 快一半以上,值得一提的是,LINE 做太多 OCR 辨識會很耗電。

以格式來說,蘋果手機真的太完美了,會把斷行的地方補上,雖然最後的成果還是有一句沒補上,但有加上全形標點符號,在格式上都不需要怎麼變動,只要抓錯字就好。

在錯字方面,則是 google keep 大勝,幾乎沒什麼錯字,而蘋果手機則是會有一些近似錯字要抓,至於 LINE,在這邊的錯字看起來比蘋果手機少一點,但掉字較多,我的經驗是,掉字會比較不容易校對。

結論:

  • 需要擷取的文字都是全形符號→選蘋果手機。
  • 不想抓太多錯字→選 google keep。
  • 擷取書面文字是為了部分選取、查詢或翻譯→選蘋果手機。

不過,以修改的方便性來說,應該是 google keep 最好,因為 google keep 可以直接把記事傳到 google 文件上,用「全部取代」功能一口氣把半形標點符號取代成全形。斷行也可以全部取代,用運算式「 \n 」就可以了,但「取代為」的欄位什麼都不要填,如下圖:

google文件全部取代斷行

記得在下方「使用規則運算式」這行要打勾。

結果會變成下面這樣:

20231028 google文件 全部取代2

你可以先把半形標點再全部取代一次,全部整理好了,再慢慢自己斷行。

嗯,其實我覺得只有兩種選擇,一是自己斷行,二是複製蘋果手機的辨識結果,不必整理格式,但需要抓錯字,看你怎麼選擇囉!

對了,聽說 Readwise 也可以做 OCR 辨識,就是不曉得成果如何,以後有機會再來比較。

同場加映1:

電腦版 LINE 的 OCR 辨識功能 (圖片轉文字)

感覺很多人知道,但既然有,我還是列出來講一下步驟:

  1. 在對話框裡按一下圖片,會跳出圖片視窗。
  2. 在圖片視窗上方的功能列會看到「A」的圖示,按下去就會直接開始做 OCR 辨識。
LINE-OCR3
LINE-OCR4
LINE-OCR5

成果跟手機轉出來的差不多,仍然有一些字跳掉了,辨識速度也跟手機差不多,轉出來的成果參考上面的就好,不另外列出來占版面了。

google keep 電腦版 OCR 辨識功能 (圖片轉文字)

要登入 google 上的 google keep 才能執行 OCR 辨識功能,登入後,可以直接新增「附圖記事」或新增一則記事後,在裡面新增圖片。如下面兩張圖片所示:

20231027 googlekeep OCR5
google keep-ocr3

但我試了好幾次,都發現上傳圖片後還需要等一會,點選記事中的「…」才可以點選「擷取圖片文字」的選項。如果直接上傳圖片點開,都還不能選,可能需要讓程式跑一下吧,這樣的話,用手機做 OCR 辨識會跑得比電腦快。

20231027 googlekeep OCR6

google keep 電腦版的 OCR 辨識結果跟手機一樣,也是不到一秒就跑完,而且基本沒什麼錯字,參考上面的成果即可。

同場加映2:叫 ChatGPT 幫你整理斷句、改標點符號

以前,我會先把跳掉的字補上,再丟進 ChatGPT 整理格式。但要注意跳掉的標點符號如果會干擾語意,也還是要補一點,讓 AI 可以弄對前後句的意思,免得斷錯句。

其實校對不是什麼很難的指令 (prompt) ,只是 ChatGPT 會很多餘的幫我順句子,我總覺得那個機器人語氣真的很怪,所以必須在指令中加入「保持原句」的字樣,讓它不要幫我順句子。

具體的校對指令 (prompt) 如下:

下面這段話保持原來的句子,不需整理格式,只需加入標點符號。

  • 任務指定範圍:下面這段話。
  • 任務執行內容:保持原來的句子,不需整理格式,只需加入標點符號。

ChatGPT 來說,很小的任務只需要指定範圍和執行內容就好了。把最上面比較亂的 LINE OCR 辨識結果拿來試,效果如下:

整理前

A.沒有採取行動
個原因是最容易發現的,KPI由KDI累積而
未能達成KDI,當然也無法達成PI、這時就要使
楚過的WHY輯樹。但是,有些CASE除了沒有採
、還有其他的原因。因為問題發現得晚,所以仔細地
TODO層級的進度管理,同時確實達成DI就顯得很
B.有行動,但不夠
這是屬於就算達成KDI,但不足以達成KPI的
種可預期的現象。照說.在D階段應該篩
了,所以只要保留到調整階段,再追新的DO就可以了
C.課題遺漏
這種情況通常發生在計畫階段就該掌握的課題卻遺漏
了,例如,為了獲得參加新加坡某企業的合作經營討論會
的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發
現,原來對方正在放農暦年假。
要發現課題遺漏,主要是看團隊成員的障礙排除能力典
經驗值多寡,但是最應該率先懷疑的是自己的「念」·
計畫階段,每個人都會覺得自己的假設沒問題,結果
不再只是假設,而是事實。

整理後

A. 沒有採取行動:

  • 個原因是最容易發現的。KPI由KDI累積而未能達成KDI,當然也無法達成PI。這時就要使楚過的WHY輯樹。但是,有些CASE除了沒有採取行動之外,還有其他的原因。因為問題發現得晚,所以仔細地TODO層級的進度管理,同時確實達成DI就顯得很重要。

B. 有行動,但不夠:

  • 這是屬於就算達成KDI,但不足以達成KPI的種可預期的現象。照說,在D階段應該篩選了,所以只要保留到調整階段,再追新的DO就可以了。

C. 課題遺漏:

  • 這種情況通常發生在計劃階段就該掌握的課題卻遺漏了,例如,為了獲得參加新加坡某企業的合作經營討論會的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發現,原來對方正在放農暦年假。要發現課題遺漏,主要是看團隊成員的障礙排除能力典經驗值多寡,但是最應該率先懷疑的是自己的「念」。計劃階段,每個人都會覺得自己的假設沒問題,結果不再只是假設,而是事實。

如果沒有把容易干擾語意的跳字補上、錯字改掉的話,就會像上面這樣,只是幫你補好全形標點符號而已。

需要的話,複製上面的指令試試看。

Share this post

「閱讀很重要,但生活也是。」相信閱讀是生活的一部分,而生活也是閱讀的一部份,目前的身分是文字工作者二度就業中。有任何合作事宜,請聯繫:[email protected]

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *