2023年上半年OpenAI推出ChatGPT Plugin以後我就一直很關注,覺得是未來發展趨勢,在公司内部也做了相關項目推動,不過Plugin此後的發展似乎不會很火,直到11月6日開發者大會上推出的GPTs,看到Sam Al
EmojiAll
這是 EmojiAll 分類的頁面,點擊下面标題查看詳細文章内容:
我們從2019年開始做emojiall.com這個網站,我對于漢字和Emoji之間的轉換很感興趣,在網上沒有找到其他人做這項工作,我們就自己來做,雖然工作量很大,這是我2019年8月記錄的《獨創:漢字轉Emoji的功能》,以及後續又記錄了幾篇:
- 更多網站添加中文轉Emoji的功能
- PHP生成
EmojiAll.com這個網站是2019年開始創辦的,從一開始就在原創性方面下了的我們最大的力氣,專門人員在各種語言撰寫Emoji相關内容,也看到有人模仿或者抄襲我們。
2021年我們EmojiAll網站申請、辦理了軟件著作權登記和作品登記,并且也開始申請注冊商标。™️
而在申請注冊商标的時候,居然在商标局網站上搜索到另外一個廈門的公司申請emojiall的商标,而這個公司也正是模仿或者跟風我們做emoji相關内容的網站之一,模仿、跟風也就罷了,還要申請我們的域名emojiall作為他們的商标就過分了。😠
我們咨詢
EmojiAll.com網站沒有使用Drupal默認的搜索,以前使用我們自己PHP程序寫的搜索,可以在自建的表中進行搜索、匹配,在搜索不到内容的情況下也可以顯示Google Custom Search的結果,基本上可以滿足網友的搜索需求。
但是依然存在很明顯的問題,例如英文不是整個單詞匹配,而是字母匹配,中文也沒有詞組搜索等等,這個問題拖了很久,去年第4季度我們決定來改進,在商議使用辦法的時候主要有兩種:1、使用PHP程序來寫更複雜的搜索;2、使用Elastic Search來做更專業的搜索。
在反複商議權衡、請教公司使用過Elastic Sear
EmojiAll.com是一個多語言網站,我們以前在是根據用戶浏覽器語言設置來進行302跳轉,後來采用CDN後取消了這種做法,用戶進入的時候是什麼語言就留在某種語言浏覽(例如進入網址是https://www.emojiall.com/zh-hans/就留在簡體中文版),當然,也可以自己選擇切換語言。而https://www.emojiall.com/這個不帶語言路徑的網址就默認跳轉到英文版本https://www.emojiall.com/en/。
不過我看維基百科很多年了,覺得其非某種語言的首頁還是很有特點的,讓用戶進入https://www.wikipedia.o
我們公司以前辦理高新技術企業的時候就申報過很多項計算機軟件著作權登記,做EmojiAll.com這個網站的時候我們很重視,不僅申辦軟件著作權,還申請了作品版權來保護寫作的Emoji描述解釋、應用舉例等原創内容。
高新技術企業對軟件著作權的數量有要求,可以每年申請多個,我們本來對Emoji網站也進行了更新,剛拿到的登記證書中些的V2.0。
今年2月份我們就在EmojiAll網站上推出了Emoji關系圖,為每一個Emoji展示與其有關的其它Emoji。如果是人工來為每一個Emoji添加與其有關的其它Emoji将是一個很費力的事情,因此我們當時也使用了一些算法來解決,從多個數據源、不同的角度來分析出相關Emoji及遠近關系,在展示的時候也适當添加了第二級、第三級的關系,如下圖:
<去年底我們就規劃了EmojiAll網站以後要做數據分析和可視化,2月份我們逐步推出了《Emoji排行榜》、《Emoji關系圖》、《Emoji标簽雲》幾個重要功能,這些在内容、設計等方面都有自己獨特的東西,其中SVG圖形技術運用也是為我們網站增色不少。✌️
而此後還有一項更“高端”的功能:Emoji情緒分析,我們一直在做。去年曾經有一位武漢大學在讀博士生與我們見面交流了Emoji方面的信息,她們是對Emoji的社會應用有研究,發表過相關學術論文。我們通過網上搜到國外一些大學也有類似研究和成果,通過大數據分析、人工智能來對社交媒體中的Emoji進行
Emoji在Unicode聯盟中是有規定分類的,分為10個大類和近100個小類。不過我在查看其它一些網站的時候,發現有一部分Emoji還有另外的分類辦法,仔細研究一番後才明白是單個Unicode字符組成的Emoji可以按照Unicode Block和Unicode subhead來進行劃分。
EmojiAll.com網站首頁的10個大分類截圖如下:
<