Unicode 图标 android 兼容性、常用装饰字符一览

1. 自身被检索的 keyword:android, 安卓, unicode, 图标, emoj

2. 服务的目标意义

  1. 视觉标记,跳读、略读、分类别导航的标记点。
    • 帖子的标题、分类、第一个POST,都是为了分类别,方便阅读,一眼看出是不是需要的内容,不需要直接跳过。
    • 同样的还有单词的词性分类、释义简介总分结构、搭配、习语区域的分隔。例句和释义的分开标记等。

3. 服务同一目标的不同工具对比:

  1. unicode 比文字
    1. 更显眼,不需文字进行大脑处理而是简单一眼的就看出的。
    2. 表达更多信息,虽然占用一个字符的位置。(有的信息适合用字母缩写,因为更习惯、无学习成本)
    3. unicode 信息编码虽然是文字,但显示类似图片,图片的优点,少量的图文结合看着不累。
  2. unicode 比 JS
    1. JS易卡退
    2. JS参与渲染时易拖动失帧
    3. 不安全、大量复杂代码难排查时。
    4. JS也可以用分栏、折叠、悬浮球等手段实现跳读、导航
  3. unicode 比图片
    0. 不会失真模糊
    1. 大量的图片加载慢
    2. 可以方便简单的更改 unicode 的颜色、大小,而图片又是另一种改法,需要PS等。缺点是不如图片在各平台统一。
  4. unicode 的选默认兼容的字符,还是安装更大字体来支持更多字符?
    1. ifont 安装失败,要么root,要么一堆操作还失败
    2. root好多年不玩了,现在还要解这解那锁的、工具链各个环节还有各种植入偷跑广告防不胜防。
  5. unicode 相对 CSS
    1. 反色 + border:能造成方形、圆形、叶形等各种背景,但需要CSS
    2. unicode 复制时信息不丢失,兼容性超强!
    3. 反色 + border : 需要额外渲染,容易卡。
    4. transform 或 border 的各种拼凑构成图片。
      • 各平台效果一致,但代码难写,不易复制。有条件可以双重保障,复制时用文字,而为了效果可再覆盖一层css控制的统一效果。

4. 本帖的意义

减少重复适配、选择的工作量

5. 工具的使用

测试支持度所用

  1. unicode.mdx (33.5 KB) 数据来源:Huge List of Unicode Character Symbols
    • 宏观鸟瞰用这个。
  2. unicode_130000.mdx (250.4 KB) 数据来源: SYMBL (◕‿◕)SYMBL (◕‿◕) 中文 。
    • 这个字符数量更大更全,也就意味着更多金子、更多沙子,筛选更费事。
    • 微观解释用这个。
    • 可以直接搜索文字比如 black或 negative 可以搜索出大色块的字符,但是结果不全,不如手动遍历检查。
  3. vim 等编辑器可以快捷键输入 UNICODE;
  4. rime 等输入法可以快捷键输入自定义词、字符。

注意事项

  1. 论坛帖的显示、论坛编辑器、PC的GoldenDict、安卓的Eudict 是四个不同的东西。
    • 同一Unicode 的显示效果都不一样。
    • 本帖主要从安卓的显示效果来筛选,可能在别的地方看起来效果不一或者不明显或者与描述不符,此时可以用在安卓上的Eudict试一试。
    • 先测了Eudict,因为它支持 OED2022。

现状

沧海遗珠,散落各处,不易搜寻,好好爬帖子,还是会有的,有空整理到这帖上。

时间轴整理结果:原形式

有精力再整理成结构更易检索的形式,先有后精。

未处理
css

\0000
\0009
\000A
\000B
\000D

' apostrophe, abbreviation
" quotation
!   pros?
?   cons?
    question
~   verb
    ~- trans verb
-   noun
... adj
@   @v
    @n
#   rank! #1
$   value !
%   relative
    probability
&|   and?why not +
()  explanation in short
[]  harder to write
{}  set?, hardest
\   ??
*   rank set level 1
, + - . ; exist in different same level
/   category
:   explanation in detail
^ result: <=>  compare
_

用来混淆。。。
U+2010
‑
U+2011
‒
U+2012
–
U+2013
—
U+2014
―
U+2015


| ‖

_ ‗ 文件命名?最好ascii127

…

†‡

••‣


⁃
⁃ Hyphen Bullet
U+2043



⁂ * ⁎ ⁑ ⁕

⁋¶

‼

⁍⁌

⧮
10734	⧯
10735	⧰
10736	⧱
10737	⧲
10738	⧳

⧑
10705	⧒
10706	⧓
10707
⧔
10708	⧕
10709	⧖
10710	⧗

☂

2 个赞

筛选标准

  1. 跟所需的能满足才选
    1. 词性、子词性的分隔:用整行黑白背景、灰白span背景长方条。
    2. 释义:用字符123 abc ABC (1) (2) (3) 等 + 换行缩进。如果不用换行和缩进,也要用更多符号导航。
    3. 音标:用自带的双斜线就很好。
    4. 原词拓展
      1. ORIGIN, 类似1.1;ORIGIN下的时间戳用虚线的椭圆 border,词变形用虚底线,
      2. 例句,本帖要解决的
      3. 同义词、反义词: 本帖要解决的
      4. 学科、英美、古今、口语书面等标记也是用来筛选的,可用实线方框 border
  2. 大色块。
    1. 不用眼细看,没那么多脑细胞;
    2. 小屏幕也能分清啥是啥。
  3. 纯色块。只有黑灰白,多平台通用。
  4. 色块大小、墨量深浅代表层级递进。
  5. PC和安卓尽量一致。
    1. 都支持,有一个不支持直接是乱符。
    2. 支持的符号差异不大,比如发音喇叭的兼容性就很差,有时直接破坏原风格,很抢眼、很碍眼。
  6. 雷同的需要细看的只用一个,保证速度。
    1. 和文字难区分的,删。
    2. 彼此很难区分的,删。
  7. PC 和 高分辨率平板的unicode
    1. 安装字体很简单,所以支持符号最多。
    2. 屏幕大,更清晰,可以选更多符号。

黑色背景、灰色背景、黑色涂满、灰色涂满:四层。

⚉⚈⦿⬮⬬⬤⧬ ⧭⧲ ⧳¶⁋☻☯ bullet •
    * 𒊹靠上的圆,不知有什么用。
■⬝⧮ ⧯⬒ ⬓ ⬔ ⬕�🯄❐✚✜𖣯◙
▀ ▄ █ ▌▐ 上下全左右
▲►▼◄ ꔪ 𖠢⧨ ⧩ bullet ‣⁍⁌
⬥⬧⬩⬪ ⧫  ⬖ ⬗ ⬘ ⬙ ⧰ ⧱⧪❖⛖
⧑ ⧒ ⧓ ⧔ ⧕ ⧖ ⧗
⬟⭓⬣⬣⛊☗★
➡ ➠ ➡ ➢ ➣ ➤☚☛   ⏯  ⏮  ⏭ ⏏
✪
✔✘
⛾⛟⚑♠♣♥♦♞
🄫🄬🄭🄮🄯🅏🅍🅌🅋🅊 🆥 🆦 🆛 🆝 🆞 🆟 🆊 🆋 🆌 🆍 🆏 
🅰 🅱 🅲 🅳 🅴 🅵 🅶 🅷 🅸 🅹 🅺 🅻 🅼 🅽 🅾 🅿 🆀 🆁 🆂 🆃 🆄 🆅 🆆 🆇 🆈 🆉
🅐 🅑 🅒 🅓 🅔 🅕 🅖 🅗 🅘 🅙 🅚 🅛 🅜 🅝 🅞 🅟 🅠 🅡 🅢 🅣 🅤 🅥 🅦 🅧 🅨 🅩
🄰 🄱 🄲 🄳 🄴 🄵 🄶 🄷 🄸 🄹 🄺 🄻 🄼 🄽 🄾 🄿 🅀 🅁 🅂 🅃 🅄 🅅 🅆 🅇 🅈 🅉
🄐 🄑 🄒 🄓 🄔 🄕 🄖 🄗 🄘 🄙 🄚 🄛 🄜 🄝 🄞 🄟 🄠 🄡 🄢 🄣 🄤 🄥 🄦 🄧 🄨 🄩 🄪
⒜ ⒝ ⒞ ⒟ ⒠ ⒡ ⒢ ⒣ ⒤ ⒥ ⒦ ⒧ ⒨ ⒩ ⒪ ⒫ ⒬ ⒭ ⒮ ⒯ ⒰ ⒱ ⒲ ⒳ ⒴ ⒵
Ⓐ Ⓑ Ⓒ Ⓓ Ⓔ Ⓕ Ⓖ Ⓗ Ⓘ Ⓙ Ⓚ Ⓛ Ⓜ Ⓝ Ⓞ Ⓟ Ⓠ Ⓡ Ⓢ Ⓣ Ⓤ Ⓥ Ⓦ Ⓧ Ⓨ Ⓩ
ⓐ ⓑ ⓒ ⓓ ⓔ ⓕ ⓖ ⓗ ⓘ ⓙ ⓚ ⓛ ⓜ ⓝ ⓞ ⓟ ⓠ ⓡ ⓢ ⓣ ⓤ ⓥ ⓦ ⓧ ⓨ ⓩ

🄌➊➋➌➍➎➏➐➑➒➓⓫⓬⓭⓮⓯⓰⓱⓲⓳⓴
①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳
㉑ ㉒ ㉓ ㉔ ㉕ ㉖ ㉗ ㉘ ㉙ ㉚ ㉛ ㉜ ㉝ ㉞ ㉟ my god! 这个竟然不支持!
㊱ ㊲ ㊳ ㊴ ㊵ ㊶ ㊷ ㊸ ㊹ ㊺ ㊻ ㊼ ㊽ ㊾ ㊿ 但这个支持!
⑴⑵⑶⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇
⒈⒉⒊⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛
⓵⓶⓷⓸⓹⓺⓻⓼⓽⓾
🄁 🄂 🄃 🄄 🄅 🄆 🄇 🄈 🄉 🄊
🄀
𝟶 𝟷 𝟸 𝟹 𝟺 𝟻 𝟼 𝟽 𝟾 𝟿 等宽
𝟬 𝟭 𝟮 𝟯 𝟰 𝟱 𝟲 𝟳 𝟴 𝟵 S-S Bold
𝟢 𝟣 𝟤 𝟥 𝟦 𝟧 𝟨 𝟩 𝟪 𝟫 S-S
𝟘 𝟙 𝟚 𝟛 𝟜 𝟝 𝟞 𝟟 𝟠 𝟡 Double-Struck
𝟎 𝟏 𝟐 𝟑 𝟒 𝟓 𝟔 𝟕 𝟖 𝟗 Bold

Monospace

𝚊 𝚋 𝚌 𝚍 𝚎 𝚏 𝚐 𝚑 𝚒 𝚓 𝚔 𝚕 𝚖 𝚗 𝚘 𝚙 𝚚 𝚛 𝚜 𝚝 𝚞 𝚟 𝚠 𝚡 𝚢 𝚣 配合i和j:𝚤 𝚥
𝙰 𝙱 𝙲 𝙳 𝙴 𝙵 𝙶 𝙷 𝙸 𝙹 𝙺 𝙻 𝙼 𝙽 𝙾 𝙿 𝚀 𝚁 𝚂 𝚃 𝚄 𝚅 𝚆 𝚇 𝚈 𝚉

Sans-Serif Bold Italic

𝙖 𝙗 𝙘 𝙙 𝙚 𝙛 𝙜 𝙝 𝙞 𝙟 𝙠 𝙡 𝙢 𝙣 𝙤 𝙥 𝙦 𝙧 𝙨 𝙩 𝙪 𝙫 𝙬 𝙭 𝙮 𝙯
𝘼 𝘽 𝘾 𝘿 𝙀 𝙁 𝙂 𝙃 𝙄 𝙅 𝙆 𝙇 𝙈 𝙉 𝙊 𝙋 𝙌 𝙍 𝙎 𝙏 𝙐 𝙑 𝙒 𝙓 𝙔 𝙕

Sans-Serif Italic

𝘢 𝘣 𝘤 𝘥 𝘦 𝘧 𝘨 𝘩 𝘪 𝘫 𝘬 𝘭 𝘮 𝘯 𝘰 𝘱 𝘲 𝘳 𝘴 𝘵 𝘶 𝘷 𝘸 𝘹 𝘺 𝘻
𝘈 𝘉 𝘊 𝘋 𝘌 𝘍 𝘎 𝘏 𝘐 𝘑 𝘒 𝘓 𝘔 𝘕 𝘖 𝘗 𝘘 𝘙 𝘚 𝘛 𝘜 𝘝 𝘞 𝘟 𝘠 𝘡

Sans-Serif Bold

𝗮 𝗯 𝗰 𝗱 𝗲 𝗳 𝗴 𝗵 𝗶 𝗷 𝗸 𝗹 𝗺 𝗻 𝗼 𝗽 𝗾 𝗿 𝘀 𝘁 𝘂 𝘃 𝘄 𝘅 𝘆 𝘇
𝗔 𝗕 𝗖 𝗗 𝗘 𝗙 𝗚 𝗛 𝗜 𝗝 𝗞 𝗟 𝗠 𝗡 𝗢 𝗣 𝗤 𝗥 𝗦 𝗧 𝗨 𝗩 𝗪 𝗫 𝗬 𝗭

Sans-Serif

𝖠 𝖡 𝖢 𝖣 𝖤 𝖥 𝖦 𝖧 𝖨 𝖩 𝖪 𝖫 𝖬 𝖭 𝖮 𝖯 𝖰 𝖱 𝖲 𝖳 𝖴 𝖵 𝖶 𝖷 𝖸 𝖹
𝖺 𝖻 𝖼 𝖽 𝖾 𝖿 𝗀 𝗁 𝗂 𝗃 𝗄 𝗅 𝗆 𝗇 𝗈 𝗉 𝗊 𝗋 𝗌 𝗍 𝗎 𝗏 𝗐 𝗑 𝗒 𝗓

哥特体, 我看不明白,不用它。
双线钩勒体,残缺字母,不用它。这个地方很奇怪,为什么一起的字母,部分不支持??
花体,很漂亮,但太小了,不用它。
衬线的大小写,粗体、斜体,跟上面的无衬线重复了。
64个卦,我大概用不上,不记。在更前的CD40区,也有八卦图。
16b60 附近有很多有意思的符号,但色块不够大,用来细读时的标记还行,不过这种标记用英文文字的标签更合适,毕竟少嘛,多几个字符也应该。

一对。

突然发现标题起大了,这么多字符。
꫞ 这跟个地图一样。
꧂ 超大。

Summary

Basic Latin

0000 控制字符不显示

  • 特殊字符,控制字符之换行符的:“\A":可以通过CSS的before content对HTML进行换行,具体用法google一下。

0010 控制字符不显示

0020 ! " # $ % & ’ ( ) * + , - . /

  • 0020 为 space, 一行共16个
  • 剩下15个,ASCII 数字+标点+标号

0030 0 1 2 3 4 5 6 7 8 9 : ; < = > ?

  • ASCII 数字+标点+标号
  • 首位是0030的0,即3*16 + 0 = 48,即第48个。
  • 这里比较奇怪,如果数字比字母更重要所以排在前面,那么为什么标点符号更前面 ?

0040 @ A B C D E F G H I J K L M N O

  • 这个16进制的0041的A,经常考试用,4*16+1 = 65,即第65个,ASCII 和 UNICODE 编码,众所周知,小写字母可以全部大写没毛病,所以大写字母更有兼容性,更普遍适应性,更兼容小写,所以编码在小写字母前。我们可以没有小写字母,但不能没有大写字母!(虽然它们在信息上等同,但已形成的习惯是大写更普遍,也就更重要,也就先编码)

0050 P Q R S T U V W X Y Z [ \ ] ^ _

0060 ` a b c d e f g h i j k l m n o

  • 0061的a, 6*16+1 = 96+1 = 97,很奇怪,即便是16进制,a也不是0开头的在第一个,而是1开始编码的第一个。真是又当又立。一会更人性,一会更计算机性。

0070 p q r s t u v w x y z { | } ~ ␡

  • ␡ 这个符号
    1. PC GD, Android EUD, forum.freemdict均显示一致
    2. 编码127,从0开始的第128个编码,即7位2进制全为1
    3. 没看出什么用处,也不能做为CSS before content:“” 来进行删除操作。

Latin-1 Supplement

0080 控制字符不显示
0090 控制字符不显示
00A0 ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ­ ® ¯

  • 第一个是NBSP, mdx 显示时就合并为 space 了,手动复制才能真的是NBSP。
  • ¨ 这个家伙用来表示分开发音,不连一起,可是这玩意标不到字母头上!只是作为解释字符。
  • § :Section, 在LDOCE的分隔装饰中看过,单独不明显,配合其他使用。
  • « 左引用,难辨认。
  • ¬ 比 not 3 个字母好,跟数学一致
  • 有个soft hyphen, 哪个平台都不显示。

00B0 ° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿

  • 度数
  • 上标就23?1在后面,0又不是
  • ¶ :Paragraph,还有个反着的⁋。不用换行+缩进时可用这个来表示,手机上更大一些。PC上也比较大,唯有在论坛的网页上这个黑头比较小。
  • º 不是0 上标。
  • 其他分数呢1/3 1/5 /1/6 2/3 2/4…

01C0 ǀ ǁ ǂ ǃ DŽ Dž dž LJ Lj lj NJ Nj nj Ǎ ǎ Ǐ

  • 你敢相信,这两个字母是一个字符!!!我以后不再是6lj6,而是6lj6。增加反爬、垃圾短信群发、数据化难度,只对人眼无差别,但信息难以检索、加工、自动化处理。

查阅词典时的成本,是点一下更爽,还是眼瞄一下更爽。是眼瞄好几下,还是手点一下,还是手翻好几下。

尽量通过提前的一次设计,避免查词时多次的不必要的不爽、繁琐。

这样对不同的标记点的需求频率、对不同人、不同设备、不同需求、不同时期、不同阶段等也是可能不一样的,所以需要用户配置,这样要准备多套方案:从用户喜好、到渐近熟悉后,交互都应是改进的,有时侧重一致性保证易用性,有时侧重图个新鲜要一直换保证可持续性,有时要针对某场景优化保证效率性。

多平台的兼容还是不兼容,效率设计和人性设计配比是多少,怎么量化进行优化尝试。

⬤ 最爽的一个,当然用来主力,我个人选它作为例句的标志,但纯黑又太显眼,所以把它降成 rbga 0.1~0.3 灰度的样子。0.6 灰度是留给次词性的,verb 下的子分类:transitive verb 和 intransitive verb.

  1. 最常用的。(常用的还有不同词性视觉导航用了背景黑白、灰白)
  2. 不仅是自身的标记,也是作为多个同类事物的分隔的标记。
1 个赞

不知道高手怎么做词典结构修改的。
如果靠regex的话,图标一多,步骤一多,不就容易错、乱 吗

还要考虑 emoji 编码。
我想搜没搜到,散步呢。但是我知道谷歌搞了个noto emoji字体,唯一可以后装的emoji了可以说

我知道表格可以被pbi读取,微软有做客户端和app,
当时我都可以从手机端快速读取快递单号等

就是这么词典转表格,我不会

买了几本书,看着都简单,一概而过,那种。
但是。还是不会。
我有点想搞个本地机子,把 okayer大 的TIO 自己假设起来。
不知道怎么搞便宜,据说云主机一年 两千只羊呢

我有点觉得我不会是我没买够……

不知道JS卡顿是指什么,我歪个楼,说个最近发现的一种卡顿现象。

很多mdx源文件都会把html内容压缩成单行,像这样

词头
正文(长长的一整行内容)
</>

然后我发现在GD的webkit版里,如果在源文件里不把正文压缩成单行,像这样:

词头
正文1
正文2
....
</>

这样生成的mdx用F12 inspect调试的时候打开速度会缩减到原来的15%左右,就是原来可能5~6秒才能展开调试窗口的词典,现在只需要不到一秒

这可能是受了GD webkit 版的限制。webengine 版没有这个问题

3 个赞

我也想去培训班,

分享个笑话

一个日本人用英文和上海司机说要去花园酒店,最后送到了嘉定沪太路。

我叉,不搞mdx啦

image
新图标比旧的好看:doge:

ASCII 编码顺序是怎么确定的?请看 Mackenzie 的书 Coded Char Sets 第十四章:The Sequence of ASCII

1 个赞

Mackenzie - Coded Character Sets History and Development.pdf (17.9 MB)

尝试过程:

  1. baidu.com 失败
  2. bing.com 失败
  3. 磁力搜 失败
  4. libgen.ee 失败
  5. yandex.com Yes!Yes!Yes!! :sparkling_heart:

启发:

有问题时,不要止步于问题,多找解决方案

  1. 比如借鉴前人经验:搜索论文、杂志、书籍是否有相关关键字
  2. 不要被工具束缚、限制、定义,发掘更多的工具拓展自身的视野。
  3. 一个设计可以有多种,是这种而不是那种一定有他自己的考量。自我猜测、批评它,很有趣;但跟实际的商业考量相去甚远,这种有趣和批评来自自身对外界的无知。

多谢 爱好者amateur的指引!很硬,好难啃 :laughing:

我完整看了一遍。不需要前置知识,只要懂简单的位运算就行。很有收获。

什么书

好看吗