2022年8月我們以實習生為主為EmojiAll這個網站做了一個"Emoji翻譯器",能初步實現Emoji到文字、文字到Emoji的雙向轉換,當時記錄了一篇博文《新推出多語言的Emoji翻譯器》。
但是限于當時AI技術的發展和實習學生的水平及所花時間有限,做出來的翻譯器效果是不盡如人意的。為了搞清當時的原理,我去翻看了實習同學留下了的工作日志、設計文檔、測試數據、彙報PPT,他雖然剛開始準備嘗試BERT追加預訓練與微調、畫了好些流程圖、設計圖,但最後采取的是一種簡單的辦法:Emoji符号 --> 英文短名稱 --> 翻譯為中文 --> 再次翻譯為英文,這其中的兩次翻譯是采用了github上開源的多語言翻譯半成品,翻譯出來效果一般,也正是因為效果一般,就造成了emoji到文本的似是而非的效果,也算是用比較少的時間做出了一個還粗看看得過去的産品。一個當時的例子:
原emoji串: 🎤🦆
emoji轉英文: microphone duck
翻譯成中文: 麥克風鴨
再翻譯成英文: Mac-duck.
但2022年11月ChatGPT出現後AI領域的一切都變了,我在OpenAI網站摘錄了《ChatGPT應用實例》,其中有兩個與Emoji有關:
當時自己嘗試了一下,感覺效果很好,這才是Emoji翻譯器應該有的樣子👍
然後我們自己做了Emoji翻譯器的GPTs來,記錄在《為EmojiAll項目添加多個好玩的GPTs》一文中,這個效果很好,可惜隻能在ChatGPT中運行,沒有辦法在我們網站上使用。
随着國内外LLM大模型的發展,GPT-4、GPT-3.5的價格大幅下降,Llama等開源模型也推出、質量不斷提高,最近國内幾大家模型廠商甚至給出了免費的API,這讓我們有了改造網站上原來Emoji翻譯器的條件。
我們近期做了很多工作:
- 模型測試:測試GPT-4o、GPT-3.5、Llama-3-8B、Llama-3-70B、國内各模型與原有emoji翻譯器的效果
- 提示詞調試:不用中文、采用英文system提示詞,輸入/輸出支持多語言,json數據處理細節
- 程序實施:去掉原來的接口程序,改為調用LLM大模型API,對輸出進行例外判斷處理,更改界面增加“翻譯”按鈕
終于是推出了新版的Emoji翻譯器,拿幾個例子截圖如下:
文字轉Emoji:
而且支持的語言也擴展到我們網站上的所有語言。
有用戶提出冷飲怎麼轉換成了咖啡?人工智能偶爾轉換不準,比真人還是差一點😅可以多試幾次,再次點擊“翻譯”,這次☕️變🍹了👍😄。
運用AI在我們網站上的測試非常重要,我們是用各種用例在各種語言、各種模型上都做了相當充分的測試,以便獲得盡可能好的效果。
實踐情況:通過一段時間的觀察,從Google Analytics中看用戶停留時長明顯增加(大約從40秒增加到80秒),來訪用戶也增加,總的交互時長翻了幾倍。
我們自己覺得是一個相當不錯的AI應用例子,後續還會做一些工作:補充完善提示詞,添加用戶輸入/輸出數據展示、打分,添加用戶留言,添加AI解釋等,并做更多其它AI應用。
最後附上鍊接,歡迎嘗試:
评论1
Emoji翻譯器(Emoji轉簡體中文)https:/…
Emoji翻譯器(Emoji轉簡體中文)
https://www.emojiall.com/zh-hans/text-translator-page
功能更新:
1、同步所有最新emoji,不會再遇到AI大模型對新emoji識别不了的情況
2、保護隐私,添加“公開”勾選項,默認是勾選,不希望公開可以取消這個選項
3、添加贊和踩,特别是踩的新功能