Weekly I/O #1
去年八月開始寫週記,都只挑生活中印象比較深刻的事件紀錄。前陣子從一些 Podcast 認識胡程維的 Weekly I/O 後,覺得這是個不錯的形式。自從使用 Readwise Reader 作為獲取資訊的媒介之後,每天 input 的內容和品質有了明顯的提升,同時,由於目前盡量減少使用社群媒體,因此把這些資訊以部落格文章的形式 output 出來,也能滿足自己的分享欲。
Input
台灣放射科不流行用語音辨識打報告的原因或許和口音有關
曼報 EP96 | 每個醫生都需要的 AI 問診神器:Abridge
剛進入放射科時就有聽說,美國的放射科醫師都是用語音辨識軟體打報告。聽完這集 Podcast,特地去找了美國醫療語音辨識中,市佔率最高的 Nuance (Dragon Medical One) 的資料,就 YouTube 上的 Demo 看起來,是真的不錯。
不過我覺得主治們用 AutoHotKey 或 Phrase Express 打報告也沒有慢到哪裡去。台灣雖然是以英文撰寫醫療紀錄,但不是每個人都能操著流利且易於辨識的口音,這大概是這類語音辨識軟體在台灣放射科流行不起來的原因吧。之前有聽過奇美的 A+ 系統、中國醫的智海系統,以及網路上查到的 vocol.ai,不知道這些比較在地化的軟體實際用起來效果如何?
在 Threads 上分享,有前輩留言提到如果在公共空間大家都用語音打報告,辦公室應該會很吵,不過這在每個 VS 幾乎都有獨立辦公室的敝科,大概不會是個問題 XD
Retelling 比起 Shadowing,應該是個更好的英文學習方式
After learning English for 15 years... 十五年学英语 六年英专 最受益的6件事
听力口语同步练|高强度但贼有效👍
學習新語言的人,大概都有聽過 shadowing (影子跟讀) 這種學習方式,也就是「一邊聽,一邊幾乎同步模仿對方講話的方式,像影子一樣跟著說。」據影片中所說,這原本是同步口譯訓練的一種方式,可以訓練即時理解,以及模仿說話的語調和節奏。但我練習 shadowing 常常覺得我只是九官鳥,對英文口說沒有實際的幫助(當然不排除我練習方法有誤或資質駑鈍)。而 Retelling 是在句子結束後,才開始復述,這對於排列英文語詞、學習常見說法,似乎有很大的幫助,因為你必須真的自己重組句子。對於英文有一定基礎能力,但仍無法流利用英文表達想法的人來說,似乎是個好方法。
Domain knowledge 是 Vibe Coding 時代最重要的能力之一
Vibe Coding 101 with Replit - Planning and Building an SEO Analyzer
之前週記中提到在完全的 Vibe Coding 時代到來前,還是要先打好穩固的 coding 基礎為妙。在這個教學影片中,工程師在製作一個 SEO 分析器時,必須先和 coding agent 討論及規劃架構。假如一個對 SEO 完全沒概念的人,在第一步就不知道怎麼精準向 AI 提出需求了,更遑論後面的步驟。
Coding 本身是一種手段,而非目的,人類必須要具備高層次的思維 (如 Domain Knowledge),做出像樣的規劃,才知道怎麼和 coding agents 溝通,和 AI 共同合作達成最終目的。
Output
使用 Maker 和 Docling 將 PDF 轉成 Markdown
嘗試了許多方案,從最基礎的 Python 套件,如 pypdf2、pymupdf、pdfplumber,到融合辨識模型和 OCR 的專案,如 deepdoctector、MinerU、Mistral OCR、olmOCR (效果最好,可惜需要 NVIDIA GPU),最終選擇了 Marker 和 Docling。
用 Hammerspoon 做了一個「讀書小幫手」
清明連假訂閱了 Windsurf,把之前幾個 Spoon 的 bug 修一修後,又做了個讀書小幫手,讓我在截圖英文教科書的文字後,自動用 OpenAI API 翻譯並以 Markdown 格式呈現,回傳到剪貼簿,方便我製作 Anki 卡片。