2022年8月我们以实习生为主为EmojiAll这个网站做了一个"Emoji翻译器",能初步实现Emoji到文字、文字到Emoji的双向转换,当时记录了一篇博文《新推出多语言的Emoji翻译器》。
但是限于当时AI技术的发展和实习学生的水平及所花时间有限,做出来的翻译器效果是不尽如人意的。为了搞清当时的原理,我去翻看了实习同学留下了的工作日志、设计文档、测试数据、汇报PPT,他虽然刚开始准备尝试BERT追加预训练与微调、画了好些流程图、设计图,但最后采取的是一种简单的办法:Emoji符号 --> 英文短名称 --> 翻译为中文 --> 再次翻译为英文,这其中的两次翻译是采用了github上开源的多语言翻译半成品,翻译出来效果一般,也正是因为效果一般,就造成了emoji到文本的似是而非的效果,也算是用比较少的时间做出了一个还粗看看得过去的产品。一个当时的例子:
原emoji串: 🎤🦆
emoji转英文: microphone duck
翻译成中文: 麦克风鸭
再翻译成英文: Mac-duck.
但2022年11月ChatGPT出现后AI领域的一切都变了,我在OpenAI网站摘录了《ChatGPT应用实例》,其中有两个与Emoji有关:
当时自己尝试了一下,感觉效果很好,这才是Emoji翻译器应该有的样子👍
然后我们自己做了Emoji翻译器的GPTs来,记录在《为EmojiAll项目添加多个好玩的GPTs》一文中,这个效果很好,可惜只能在ChatGPT中运行,没有办法在我们网站上使用。
随着国内外LLM大模型的发展,GPT-4、GPT-3.5的价格大幅下降,Llama等开源模型也推出、质量不断提高,最近国内几大家模型厂商甚至给出了免费的API,这让我们有了改造网站上原来Emoji翻译器的条件。
我们近期做了很多工作:
- 模型测试:测试GPT-4o、GPT-3.5、Llama-3-8B、Llama-3-70B、国内各模型与原有emoji翻译器的效果
- 提示词调试:不用中文、采用英文system提示词,输入/输出支持多语言,json数据处理细节
- 程序实施:去掉原来的接口程序,改为调用LLM大模型API,对输出进行例外判断处理,更改界面增加“翻译”按钮
终于是推出了新版的Emoji翻译器,拿几个例子截图如下:
文字转Emoji:
而且支持的语言也扩展到我们网站上的所有语言。
有用户提出冷饮怎么转换成了咖啡?人工智能偶尔转换不准,比真人还是差一点😅可以多试几次,再次点击“翻译”,这次☕️变🍹了👍😄。
运用AI在我们网站上的测试非常重要,我们是用各种用例在各种语言、各种模型上都做了相当充分的测试,以便获得尽可能好的效果。
实践情况:通过一段时间的观察,从Google Analytics中看用户停留时长明显增加(大约从40秒增加到80秒),来访用户也增加,总的交互时长翻了几倍。
我们自己觉得是一个相当不错的AI应用例子,后续还会做一些工作:补充完善提示词,添加用户输入/输出数据展示、打分,添加用户留言,添加AI解释等,并做更多其它AI应用。
最后附上链接,欢迎尝试:
评论1
Emoji翻译器(Emoji转简体中文)https:/…
Emoji翻译器(Emoji转简体中文)
https://www.emojiall.com/zh-hans/text-translator-page
功能更新:
1、同步所有最新emoji,不会再遇到AI大模型对新emoji识别不了的情况
2、保护隐私,添加“公开”勾选项,默认是勾选,不希望公开可以取消这个选项
3、添加赞和踩,特别是踩的新功能