Emoji是一个“可玩性”很高的领域,我们在几年前招聘了一批计算机专业的实习同学使用人工智能为我们开发了Emoji翻译器、Emoji图像融合两个功能,想法很领先,但说实话效果很一般,Emoji与文字之间的双向翻译很智障,Emoji融合图片也很难
emoji
这是 emoji 分类的页面,点击下面标题查看详细文章内容:
前段时间升级以前的Emoji翻译器之后,效果还是比较明显的,Emoji到文本和文本到Emoji转换的质量绝对比以前好很多,顺着考虑用户的需求,我们又推出一个有点类似又有不同的功能:Emoji推荐师。
在网站中推出之前我们也做了一个GPTs来验证想法:
我们的EmojiAll.com网站中一些网址采用的是对Emoji进行直接URL编码,一些对于UTF-8编码处理不完善的爬虫容易把我们正确的网址变换错误,导致我们的Drupal日志中总是看到404报错。百度爬虫以前对网址都识别为GB2312,我们后来转换纠正过,还有URL一次解码、二次解码变换我们都尝试过,纠正了不少错误、跳转到正确的网址。 但下面这种报错一直存
今天接到邮件Unicode® Emoji Charts v15.0正式发布了🎉
其实我们emojiall.com网站在上个月已经提前进行了Unicode 15.0和Emoji 15.0内容的添加,以前的12.0、13.0、14.0基本都是Unicode官方正式发布后,我们延迟一段时间添加和更新的,而这次同事们通力合作,提前进行了,而且在解
我们从2019年开始做emojiall.com这个网站,我对于汉字和Emoji之间的转换很感兴趣,在网上没有找到其他人做这项工作,我们就自己来做,虽然工作量很大,这是我2019年8月记录的《独创:汉字转Emoji的功能》,以及后续又记录了几篇:
- 更多网站添加中文转Emoji的功能
- PHP生成
Emoji的结构比想象的要复杂一些,一个简单的要求是从一段包含Emoji表情符号的文本中提取出Emoji,我以前的做法是拿几千个Emoji按照从长到短排序后循环比对,这样基本上可以实现需求,不过运算量很大,在单个Emoji的HTML页面中循环几千次的耗时还是可以忍受的(与数据库读写时间的零点几到几毫秒、网络传输时间的几十到几百毫秒比起来,PHP或者Python
今年2月份我们就在EmojiAll网站上推出了Emoji关系图,为每一个Emoji展示与其有关的其它Emoji。如果是人工来为每一个Emoji添加与其有关的其它Emoji将是一个很费力的事情,因此我们当时也使用了一些算法来解决,从多个数据源、不同的角度来分析出相关Emoji及远近关系,在展示的时候也适当添加了第二级、第三级的关系,如下图:
<去年上半年我们进行了Emoji 13.0内容的更新和添加,而下半年更新和添加Emoji 13.1版本内容,我们往往都拖后了一段时间,几个月后才进行补充和更新,而这次Unicode 14.0和Emoji 14.0的发布时间是在推出前我们就了解到的,并提前做了准备工作
去年2月份我们更新和添加Emoji 13.0内容,11月份我们更新和添加Emoji 13.1内容,并且添加Emoji v13.0和v13.1的图片。添加后的版本可以在我们EmojiAll网站上查看:Emoji版本13.0,Emoji版本13.1。
而E