我们的EmojiAll.com网站中一些网址采用的是对Emoji进行直接URL编码,一些对于UTF-8编码处理不完善的爬虫容易把我们正确的网址变换错误,导致我们的Drupal日志中总是看到404报错。百度爬虫以前对网址都识别为GB2312,我们后来转换纠正过,还有URL一次解码、二次解码变换我们都尝试过,纠正了不少错误、跳转到正确的网址。
但下面这种报错一直存
这是 emoji 分类的页面,点击下面标题查看详细文章内容:
我们的EmojiAll.com网站中一些网址采用的是对Emoji进行直接URL编码,一些对于UTF-8编码处理不完善的爬虫容易把我们正确的网址变换错误,导致我们的Drupal日志中总是看到404报错。百度爬虫以前对网址都识别为GB2312,我们后来转换纠正过,还有URL一次解码、二次解码变换我们都尝试过,纠正了不少错误、跳转到正确的网址。
但下面这种报错一直存
今天接到邮件Unicode® Emoji Charts v15.0正式发布了🎉
其实我们emojiall.com网站在上个月已经提前进行了Unicode 15.0和Emoji 15.0内容的添加,以前的12.0、13.0、14.0基本都是Unicode官方正式发布后,我们延迟一段时间添加和更新的,而这次同事们通力合作,提前进行了,而且在解
我们从2019年开始做emojiall.com这个网站,我对于汉字和Emoji之间的转换很感兴趣,在网上没有找到其他人做这项工作,我们就自己来做,虽然工作量很大,这是我2019年8月记录的《独创:汉字转Emoji的功能》,以及后续又记录了几篇:
Emoji的结构比想象的要复杂一些,一个简单的要求是从一段包含Emoji表情符号的文本中提取出Emoji,我以前的做法是拿几千个Emoji按照从长到短排序后循环比对,这样基本上可以实现需求,不过运算量很大,在单个Emoji的HTML页面中循环几千次的耗时还是可以忍受的(与数据库读写时间的零点几到几毫秒、网络传输时间的几十到几百毫秒比起来,PHP或者Python
今年2月份我们就在EmojiAll网站上推出了Emoji关系图,为每一个Emoji展示与其有关的其它Emoji。如果是人工来为每一个Emoji添加与其有关的其它Emoji将是一个很费力的事情,因此我们当时也使用了一些算法来解决,从多个数据源、不同的角度来分析出相关Emoji及远近关系,在展示的时候也适当添加了第二级、第三级的关系,如下图:
去年上半年我们进行了Emoji 13.0内容的更新和添加,而下半年更新和添加Emoji 13.1版本内容,我们往往都拖后了一段时间,几个月后才进行补充和更新,而这次Unicode 14.0和Emoji 14.0的发布时间是在推出前我们就了解到的,并提前做了准备工作
去年2月份我们更新和添加Emoji 13.0内容,11月份我们更新和添加Emoji 13.1内容,并且添加Emoji v13.0和v13.1的图片。添加后的版本可以在我们EmojiAll网站上查看:Emoji版本13.0,Emoji版本13.1。
而E
早在今年2月份,我们的EmojiAll网站就推出了Emoji标签云,从数据的处理到展示的形式还是非常新颖的,我们自己觉得很有特色。这其中用到了统计分析软件,对来自twitter的推文内容进行了处理,为几乎每一个Emoji找出对应的标签,以免人工来写标签工作量太大,另外再辅以其它的数据来源和处理,综合形成当时的数据。
但我记得当时软件从推文中进行统
今年5月份记录了一篇《Emoji动画图片》,当时就只找到了JoyPixels的Emoji动画图片,举的例子是“🎻 小提琴”的图片:
后来的一段时间陆陆续续又找到了一些动画Emji,现在记录下来:
Telegram提供的动画Emoji图片,其特点是GIF的帧数比较高,虽然文件比较大,但动画看起来也更顺畅自然,例如“🤌
很多网友并不是很了解Emoji,在我们EmojiAll对应的一个QQ群(群号:774842773)中总有人问如何添加一个Emoji,请我们帮忙,或者说愿意付费来添加,这些朋友多数是希望在自己的某个软件中增加一个特别的符号。
2002-2023 v4.12 a-j-e-0