讀紙本書做數位筆記,難免需要用到 OCR 辨識功能,也就是傳說中的「圖片轉文字」,之前試過好幾個免費的 OCR 辨識功能,但我覺得最好用的只有 3 種: LINE、GOOGLE 和蘋果手機。
在這篇文章中,我會列出用手機實測 LINE 、 GOOGLE 和蘋果手機等 3 種 OCR 辨識的效果究竟如何,但要提醒你的是,我這邊只做單張的評測,如果是多張 OCR 辨識,你可能要另外找喔!
以下用同一張照片來實測效果。
本文目錄
LINE的 OCR 辨識功能 (圖片轉文字)
LINE 的 OCR 辨識功能是眾所皆知的,所以我用了一年多,期間也曾經好奇其他的 OCR 辨識怎麼樣,雖然 LINE 的 OCR 抓繁體老跳簡體,但其他 OCR 抓中文的效果更糟糕,最後只能乖乖回來用 LINE 的 OCR 辨識功能。
在對話框裡面,點開最下面的照相和圖片的小圖示,都可以使用 OCR 辨識功能,如下圖:
最後的效果是:
A.沒有採取行動
個原因是最容易發現的,KPI由KDI累積而
未能達成KDI,當然也無法達成PI、這時就要使
楚過的WHY輯樹。但是,有些CASE除了沒有採
、還有其他的原因。因為問題發現得晚,所以仔細地
TODO層級的進度管理,同時確實達成DI就顯得很
B.有行動,但不夠
這是屬於就算達成KDI,但不足以達成KPI的
種可預期的現象。照說.在D階段應該篩
了,所以只要保留到調整階段,再追新的DO就可以了
C.課題遺漏
這種情況通常發生在計畫階段就該掌握的課題卻遺漏
了,例如,為了獲得參加新加坡某企業的合作經營討論會
的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發
現,原來對方正在放農暦年假。
要發現課題遺漏,主要是看團隊成員的障礙排除能力典
經驗值多寡,但是最應該率先懷疑的是自己的「念」·
計畫階段,每個人都會覺得自己的假設沒問題,結果
不再只是假設,而是事實。
如上所示,LINE 的 OCR 辨識圖片上的文字會有部分的字和標點跳掉,但抓繁體字的效果還可以。據我的經驗,有些頁面還是會跳一些簡體字或跳成近似字,總之,需要再校稿過。
Google Keep 的 OCR 辨識功能 (圖片轉文字)
本來一直都是在用 LINE 做 OCR 辨識,後來才知道 google 文件或 google keep 也可以,但因為我在手機上一直找不到 google 文件 App 的 OCR 辨識功能在哪(有誰知道的話,留言告訴我),就使用 google keep 來做實際測試。
先打開 google keep 的 App,按下圖示,可以「拍攝相片」或從相簿「選擇圖片」:
拍好相片或選好圖片後,就會直接存在新記事裡:
- 點開這個記事,一直按住照片,就會進入編輯模式。
- 點選右上角的「…」,會有「擷取圖片文字」的 OCR 辨識功能可選。
來看看最後的效果:
A. 沒有採取行動
這個原因是最容易發現的,KPI由KDI累積而成,如
果未能達成KDI,當然也無法達成KPI,這時就要使用之前
提過的 WHY邏輯樹。但是,有些CASE 除了沒有採取行動
外,還有其他的原因。因為問題發現得晚,所以仔細地進行
TO DO 層級的進度管理,同時確實達成KDI就顯得很重要。
B. 有行動,但不夠
這是屬於就算達成KDI,但不足以達成KPI的狀況,
是種可預期的現象。照理來說,在DO的階段應該就篩選過
了,所以只要保留到調整階段,再追新的DO就可以了。
C.課題遺漏
這種情況通常發生在計劃階段就該掌握的課題卻遺漏
了,例如,為了獲得參加新加坡某企業的合作經營討論會
的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發
現,原來對方正在放農曆年假。
要發現課題遺漏,主要是看團隊成員的障礙排除能力與
經驗值多寡,但是最應該率先懷疑的是自己的「執念」。在
計畫階段,每個人都會覺得自己的假設沒問題,結果演變成
不再只是假設,而是事實。
可以看到除了換行問題、標點符號半形外, google keep 的 OCR 辨識功能居然沒什麼跳字的問題,我前後試了幾次,真的在跳字和抓繁體中文方面的表現比 LINE 好上許多。
蘋果手機的 OCR 辨識功能 (圖片轉文字)
如果你的蘋果手機是 iOS 15 以上,直接開相機,當它感測到鏡頭前有文字,就會出現黃色框,將要轉錄的文字用黃框對準,按下右下角的紙張小圖示,就會出現它抓到的文字,你可以選取部分,也可以按左下角的全部拷貝。
最後的成果:
A. 沒有採取行動
這個原因是最容易發現的,KPI由 KDI累積而成,如果末能速成 KDI,當然也縣法達成KP福時就要使用之的擔過的 WHY 選輯樹。但是,有些 CASE 除下沒有採取行動外,還有其他的原因。因為問題發現得晚,所以仔細地進行T0O DO層級的進度管理,同時確質達成KDI 就顯得很重要。
B. 有行動,但不夠
這是屬於就算達成 KDI,但不足以達成 KPI 的狀況,是種可預期的現象。照理來說,在DO的階段應該就篩選過了,所以只要保留到調整階段,再追新的DO就可以了。
C. 課題遺漏
這種情況通常發生在計畫階段就該掌握的課題卻遺漏了,例如,為了獲得參加新加坡某企業的合作經營討論會的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發現,原來對方正在放農曆年假。
要發現課題遺漏,主要是看團隊成員的障礙排除能力與經驗值多寡,但是最應該率先懷疑的是自己的「執念」。在計畫階段,每個人都會覺得自己的假設沒問題,結果演雙成不再只是假設,而是事實。
可以看出,蘋果手機的 OCR 辨識功能在格式上比 google keep 更強,標點符號都是全形,且不會因圖片上的換行而換行,但錯字多一些。
結語
以下就「速度」、「格式」和「錯字」來比較 LINE、GOOGLE 和蘋果手機的 OCR 辨識效果:
- 速度: google keep > 蘋果手機 > LINE
- 格式: 蘋果手機 > google keep > LINE
- 錯字: google keep > 蘋果手機 > LINE
就速度來說,google keep 點下去根本不到一秒就好了,我還在想「有按到嗎」,結果往下一滑就看到了,會存在同一個記事裡。蘋果手機轉圈圈的速度比 LINE 快一半以上,值得一提的是,LINE 做太多 OCR 辨識會很耗電。
以格式來說,蘋果手機真的太完美了,會把斷行的地方補上,雖然最後的成果還是有一句沒補上,但有加上全形標點符號,在格式上都不需要怎麼變動,只要抓錯字就好。
在錯字方面,則是 google keep 大勝,幾乎沒什麼錯字,而蘋果手機則是會有一些近似錯字要抓,至於 LINE,在這邊的錯字看起來比蘋果手機少一點,但掉字較多,我的經驗是,掉字會比較不容易校對。
結論:
- 需要擷取的文字都是全形符號→選蘋果手機。
- 不想抓太多錯字→選 google keep。
- 擷取書面文字是為了部分選取、查詢或翻譯→選蘋果手機。
不過,以修改的方便性來說,應該是 google keep 最好,因為 google keep 可以直接把記事傳到 google 文件上,用「全部取代」功能一口氣把半形標點符號取代成全形。斷行也可以全部取代,用運算式「 \n 」就可以了,但「取代為」的欄位什麼都不要填,如下圖:
記得在下方「使用規則運算式」這行要打勾。
結果會變成下面這樣:
你可以先把半形標點再全部取代一次,全部整理好了,再慢慢自己斷行。
嗯,其實我覺得只有兩種選擇,一是自己斷行,二是複製蘋果手機的辨識結果,不必整理格式,但需要抓錯字,看你怎麼選擇囉!
對了,聽說 Readwise 也可以做 OCR 辨識,就是不曉得成果如何,以後有機會再來比較。
同場加映1:
電腦版 LINE 的 OCR 辨識功能 (圖片轉文字)
感覺很多人知道,但既然有,我還是列出來講一下步驟:
- 在對話框裡按一下圖片,會跳出圖片視窗。
- 在圖片視窗上方的功能列會看到「A」的圖示,按下去就會直接開始做 OCR 辨識。
成果跟手機轉出來的差不多,仍然有一些字跳掉了,辨識速度也跟手機差不多,轉出來的成果參考上面的就好,不另外列出來占版面了。
google keep 電腦版 OCR 辨識功能 (圖片轉文字)
要登入 google 上的 google keep 才能執行 OCR 辨識功能,登入後,可以直接新增「附圖記事」或新增一則記事後,在裡面新增圖片。如下面兩張圖片所示:
但我試了好幾次,都發現上傳圖片後還需要等一會,點選記事中的「…」才可以點選「擷取圖片文字」的選項。如果直接上傳圖片點開,都還不能選,可能需要讓程式跑一下吧,這樣的話,用手機做 OCR 辨識會跑得比電腦快。
google keep 電腦版的 OCR 辨識結果跟手機一樣,也是不到一秒就跑完,而且基本沒什麼錯字,參考上面的成果即可。
同場加映2:叫 ChatGPT 幫你整理斷句、改標點符號
以前,我會先把跳掉的字補上,再丟進 ChatGPT 整理格式。但要注意跳掉的標點符號如果會干擾語意,也還是要補一點,讓 AI 可以弄對前後句的意思,免得斷錯句。
其實校對不是什麼很難的指令 (prompt) ,只是 ChatGPT 會很多餘的幫我順句子,我總覺得那個機器人語氣真的很怪,所以必須在指令中加入「保持原句」的字樣,讓它不要幫我順句子。
具體的校對指令 (prompt) 如下:
下面這段話保持原來的句子,不需整理格式,只需加入標點符號。
- 任務指定範圍:下面這段話。
- 任務執行內容:保持原來的句子,不需整理格式,只需加入標點符號。
對 ChatGPT 來說,很小的任務只需要指定範圍和執行內容就好了。把最上面比較亂的 LINE OCR 辨識結果拿來試,效果如下:
整理前
A.沒有採取行動
個原因是最容易發現的,KPI由KDI累積而
未能達成KDI,當然也無法達成PI、這時就要使
楚過的WHY輯樹。但是,有些CASE除了沒有採
、還有其他的原因。因為問題發現得晚,所以仔細地
TODO層級的進度管理,同時確實達成DI就顯得很
B.有行動,但不夠
這是屬於就算達成KDI,但不足以達成KPI的
種可預期的現象。照說.在D階段應該篩
了,所以只要保留到調整階段,再追新的DO就可以了
C.課題遺漏
這種情況通常發生在計畫階段就該掌握的課題卻遺漏
了,例如,為了獲得參加新加坡某企業的合作經營討論會
的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發
現,原來對方正在放農暦年假。
要發現課題遺漏,主要是看團隊成員的障礙排除能力典
經驗值多寡,但是最應該率先懷疑的是自己的「念」·
計畫階段,每個人都會覺得自己的假設沒問題,結果
不再只是假設,而是事實。
整理後
A. 沒有採取行動:
- 個原因是最容易發現的。KPI由KDI累積而未能達成KDI,當然也無法達成PI。這時就要使楚過的WHY輯樹。但是,有些CASE除了沒有採取行動之外,還有其他的原因。因為問題發現得晚,所以仔細地TODO層級的進度管理,同時確實達成DI就顯得很重要。
B. 有行動,但不夠:
- 這是屬於就算達成KDI,但不足以達成KPI的種可預期的現象。照說,在D階段應該篩選了,所以只要保留到調整階段,再追新的DO就可以了。
C. 課題遺漏:
- 這種情況通常發生在計劃階段就該掌握的課題卻遺漏了,例如,為了獲得參加新加坡某企業的合作經營討論會的機會,公司積極的電郵攻勢,卻遲遲沒有回音,這才發現,原來對方正在放農暦年假。要發現課題遺漏,主要是看團隊成員的障礙排除能力典經驗值多寡,但是最應該率先懷疑的是自己的「念」。計劃階段,每個人都會覺得自己的假設沒問題,結果不再只是假設,而是事實。
如果沒有把容易干擾語意的跳字補上、錯字改掉的話,就會像上面這樣,只是幫你補好全形標點符號而已。
需要的話,複製上面的指令試試看。