動機 #
我大二以來在批兔寫了四百多篇文,隨著年紀增長有時會忘記哪些內容我寫過了。批兔只能用標題檢索實在太不方便。而既然剛做好部落格,就應該趁現在兩邊內容最少時,搬點東西過來充場面。不然之後批兔文章越多越難搬。
步驟 #
下載文章 #
理論上批兔版主指令可以直接備份全版文章,淩晨會寄一個壓縮檔到指定信箱。但是這個功能壞好幾年沒人修。
我只好一封一封用 F 鍵寄到我的 gmail,然後就遇到下一個問題—— gmail 有十分之一二的機率把它當垃圾信,送回我的批兔信箱。拒絕的邏輯跟寄信頻率也不是直接相關,我用腳本一分鐘寄兩封也被拒。我嘗試寄 proton mail,好像會收不到。
總之我用腳本 F 完所有的文章後,手動把所有被拒的文章再寄一次,有點費工。 後來發現五百篇以內應該先站內信備份到批兔信箱,再在批兔信箱備份信件的功能,一次全寄到 proton mail。雖然隔天淩晨才會收到,但是 proton mail 可以設定信任的信箱,應該就不會被拒了。
轉換格式 #
文章進到信箱後,我就用 thunderbird 全部存到一個資料夾。然後請語言模型幫我各種轉換格式、加時間戳、碼掉其他人的留言……
然而最討厭的是 ptt 寄來的信是 big5,我的文章裡只要出現不在 big5 的符號,編碼就會壞掉。這樣的文章有近七十篇,我打算手動處理。
分類取文章名 #
我把編碼正常的文章用日期和標題命名後,接下來就是要一篇篇幫文章取英文檔名(URL)、分類。確認沒問題再上傳。
現況 #
目前文章下載好了,編碼相容的文也都轉好格式了。如果一週發 50 篇的話,也要兩個月才處理的完。真是漫漫長路。