※ 本文轉寄自 ptt.cc, 文章原始頁面
[分享] ebook-GPT-translator: 開源文件翻譯
https://github.com/jesselau76/ebook-GPT-translator
支援檔案格式pdf、docx、mobi、epub、txt,可選選項有翻譯成指定語言(預設翻簡中)、
支援名詞對照表讓特定名詞優先採用指定翻譯。
使用自掛的GPTAPI Key,串GPT3.5的模型,翻譯結束後還會顯示花了多少的token price
,不用付錢給作者或軟體公司。
程式碼很好懂,可以自己調整翻譯Prompt或把模型改成GPT4。
甚至可以翻成文言文(?)
https://imgs.plurk.com/QD2/oZm/d6hYkn2tdmjzR0KKTetf08zpCou_lg.png
作者還附了個用詞會對照表處理TPRG規則書的例子
https://imgs.plurk.com/QD2/6g0/OAX5bJKJITF7CLF0P9mhiiPtSdd_lg.png
-
剛剛在找串GPT的AI翻譯工具,坊間標榜串GPT的AI工具收的費用還不便宜,
外加如果有套裝工具我也蠻怕他備份我要翻譯的東西或把我的Key外流,
本來想手刻,
後來想想理論上這麼簡單的程式(Python把文件解成純文字、切分、逐段送給GPT API)
應該有人寫好放github上吧... 找了一下果然有。
晚點再來想想如果要更符合我自己的使用習慣要怎麼改Code。
缺點:沒有GUI,至少要自己看的懂怎麼用cmd
試翻AI小鎮的論文
https://arxiv.org/pdf/2304.03442v1.pdf
指定翻成繁體中文還是會出現簡中,不過這gpt3.5老bug了
用了26分鐘有點過分,不過只花了0.16$
成果如下:
https://images.plurk.com/6kvVm6RjHRIVPd7KtKABgd.png
這個程式可以改的地方有點多(畢竟四個多月沒更新了)
GPT3.5升級到GPT4應該效果會更好更穩定,只是花費20倍價錢
然後就是我不知道為什麼他切文用1024的英文字去切,1024個英文字也才不到200token,
加上翻譯回來的中文也才約1000token,現在gpt3.5已經支援到8Ktoken了,應該可以不用
切的那麼細,改這個也能提高翻譯速度跟效果。
我有點忘記最早GPT3.5的模型context多少了,但這麼切是真的很保守。
https://images.plurk.com/62TKUPoimrP0dSDqCZh921.png
https://images.plurk.com/7imHDoLKOtzYW2MqT74xAz.png
--
AI_Art AI藝術與創作板 歡迎各方前來討論AIGC創作與相關議題!
AI情報屋營業中
噗浪:https://www.plurk.com/Zaious
IG :https://www.instagram.com/zaious.design/
日曆:https://zaious.notion.site/zaious/22c0024eceed4bdc88588b8db41e6ec4
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.250.61.231 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1693466097.A.581.html
推
推
推
推
→
→
推
→
→
→
→
→
→
→
推
推
推