我們的EmojiAll.com網站中一些網址采用的是對Emoji進行直接URL編碼,一些對于UTF-8編碼處理不完善的爬蟲容易把我們正确的網址變換錯誤,導緻我們的Drupal日志中總是看到404報錯。百度爬蟲以前對網址都識别為GB2312,我們後來轉換糾正過,還有URL一次解碼、二次解碼變換我們都嘗試過,糾正了不少錯誤、跳轉到正确的網址。
但下面這種報錯一直存
這是 emoji 分類的頁面,點擊下面标題查看詳細文章内容:
我們的EmojiAll.com網站中一些網址采用的是對Emoji進行直接URL編碼,一些對于UTF-8編碼處理不完善的爬蟲容易把我們正确的網址變換錯誤,導緻我們的Drupal日志中總是看到404報錯。百度爬蟲以前對網址都識别為GB2312,我們後來轉換糾正過,還有URL一次解碼、二次解碼變換我們都嘗試過,糾正了不少錯誤、跳轉到正确的網址。
但下面這種報錯一直存
今天接到郵件Unicode® Emoji Charts v15.0正式發布了🎉
其實我們emojiall.com網站在上個月已經提前進行了Unicode 15.0和Emoji 15.0内容的添加,以前的12.0、13.0、14.0基本都是Unicode官方正式發布後,我們延遲一段時間添加和更新的,而這次同事們通力合作,提前進行了,而且在解
我們從2019年開始做emojiall.com這個網站,我對于漢字和Emoji之間的轉換很感興趣,在網上沒有找到其他人做這項工作,我們就自己來做,雖然工作量很大,這是我2019年8月記錄的《獨創:漢字轉Emoji的功能》,以及後續又記錄了幾篇:
Emoji的結構比想象的要複雜一些,一個簡單的要求是從一段包含Emoji表情符号的文本中提取出Emoji,我以前的做法是拿幾千個Emoji按照從長到短排序後循環比對,這樣基本上可以實現需求,不過運算量很大,在單個Emoji的HTML頁面中循環幾千次的耗時還是可以忍受的(與數據庫讀寫時間的零點幾到幾毫秒、網絡傳輸時間的幾十到幾百毫秒比起來,PHP或者Python
今年2月份我們就在EmojiAll網站上推出了Emoji關系圖,為每一個Emoji展示與其有關的其它Emoji。如果是人工來為每一個Emoji添加與其有關的其它Emoji将是一個很費力的事情,因此我們當時也使用了一些算法來解決,從多個數據源、不同的角度來分析出相關Emoji及遠近關系,在展示的時候也适當添加了第二級、第三級的關系,如下圖:
去年上半年我們進行了Emoji 13.0内容的更新和添加,而下半年更新和添加Emoji 13.1版本内容,我們往往都拖後了一段時間,幾個月後才進行補充和更新,而這次Unicode 14.0和Emoji 14.0的發布時間是在推出前我們就了解到的,并提前做了準備工作
去年2月份我們更新和添加Emoji 13.0内容,11月份我們更新和添加Emoji 13.1内容,并且添加Emoji v13.0和v13.1的圖片。添加後的版本可以在我們EmojiAll網站上查看:Emoji版本13.0,Emoji版本13.1。
而E
早在今年2月份,我們的EmojiAll網站就推出了Emoji标簽雲,從數據的處理到展示的形式還是非常新穎的,我們自己覺得很有特色。這其中用到了統計分析軟件,對來自twitter的推文内容進行了處理,為幾乎每一個Emoji找出對應的标簽,以免人工來寫标簽工作量太大,另外再輔以其它的數據來源和處理,綜合形成當時的數據。
但我記得當時軟件從推文中進行統
今年5月份記錄了一篇《Emoji動畫圖片》,當時就隻找到了JoyPixels的Emoji動畫圖片,舉的例子是“🎻 小提琴”的圖片:
後來的一段時間陸陸續續又找到了一些動畫Emji,現在記錄下來:
Telegram提供的動畫Emoji圖片,其特點是GIF的幀數比較高,雖然文件比較大,但動畫看起來也更順暢自然,例如“🤌
很多網友并不是很了解Emoji,在我們EmojiAll對應的一個QQ群(群号:774842773)中總有人問如何添加一個Emoji,請我們幫忙,或者說願意付費來添加,這些朋友多數是希望在自己的某個軟件中增加一個特别的符号。
2002-2023 v4.12 a-j-e-0