Emoji是一個“可玩性”很高的領域,我們在幾年前招聘了一批計算機專業的實習同學使用人工智能為我們開發了Emoji翻譯器、Emoji圖像融合兩個功能,想法很領先,但說實話效果很一般,Emoji與文字之間的雙向翻譯很智障,Emoji融合圖片也很難
emoji
這是 emoji 分類的頁面,點擊下面标題查看詳細文章内容:
前段時間升級以前的Emoji翻譯器之後,效果還是比較明顯的,Emoji到文本和文本到Emoji轉換的質量絕對比以前好很多,順着考慮用戶的需求,我們又推出一個有點類似又有不同的功能:Emoji推薦師。
在網站中推出之前我們也做了一個GPTs來驗證想法:
我們的EmojiAll.com網站中一些網址采用的是對Emoji進行直接URL編碼,一些對于UTF-8編碼處理不完善的爬蟲容易把我們正确的網址變換錯誤,導緻我們的Drupal日志中總是看到404報錯。百度爬蟲以前對網址都識别為GB2312,我們後來轉換糾正過,還有URL一次解碼、二次解碼變換我們都嘗試過,糾正了不少錯誤、跳轉到正确的網址。 但下面這種報錯一直存
今天接到郵件Unicode® Emoji Charts v15.0正式發布了🎉
其實我們emojiall.com網站在上個月已經提前進行了Unicode 15.0和Emoji 15.0内容的添加,以前的12.0、13.0、14.0基本都是Unicode官方正式發布後,我們延遲一段時間添加和更新的,而這次同事們通力合作,提前進行了,而且在解
我們從2019年開始做emojiall.com這個網站,我對于漢字和Emoji之間的轉換很感興趣,在網上沒有找到其他人做這項工作,我們就自己來做,雖然工作量很大,這是我2019年8月記錄的《獨創:漢字轉Emoji的功能》,以及後續又記錄了幾篇:
- 更多網站添加中文轉Emoji的功能
- PHP生成
Emoji的結構比想象的要複雜一些,一個簡單的要求是從一段包含Emoji表情符号的文本中提取出Emoji,我以前的做法是拿幾千個Emoji按照從長到短排序後循環比對,這樣基本上可以實現需求,不過運算量很大,在單個Emoji的HTML頁面中循環幾千次的耗時還是可以忍受的(與數據庫讀寫時間的零點幾到幾毫秒、網絡傳輸時間的幾十到幾百毫秒比起來,PHP或者Python
今年2月份我們就在EmojiAll網站上推出了Emoji關系圖,為每一個Emoji展示與其有關的其它Emoji。如果是人工來為每一個Emoji添加與其有關的其它Emoji将是一個很費力的事情,因此我們當時也使用了一些算法來解決,從多個數據源、不同的角度來分析出相關Emoji及遠近關系,在展示的時候也适當添加了第二級、第三級的關系,如下圖:
<去年上半年我們進行了Emoji 13.0内容的更新和添加,而下半年更新和添加Emoji 13.1版本内容,我們往往都拖後了一段時間,幾個月後才進行補充和更新,而這次Unicode 14.0和Emoji 14.0的發布時間是在推出前我們就了解到的,并提前做了準備工作
去年2月份我們更新和添加Emoji 13.0内容,11月份我們更新和添加Emoji 13.1内容,并且添加Emoji v13.0和v13.1的圖片。添加後的版本可以在我們EmojiAll網站上查看:Emoji版本13.0,Emoji版本13.1。
而E