6lj6
1
1. 自身被检索的 keyword:android, 安卓, unicode, 图标, emoj
2. 服务的目标意义
- 视觉标记,跳读、略读、分类别导航的标记点。
- 帖子的标题、分类、第一个POST,都是为了分类别,方便阅读,一眼看出是不是需要的内容,不需要直接跳过。
- 同样的还有单词的词性分类、释义简介总分结构、搭配、习语区域的分隔。例句和释义的分开标记等。
3. 服务同一目标的不同工具对比:
- unicode 比文字
- 更显眼,不需文字进行大脑处理而是简单一眼的就看出的。
- 表达更多信息,虽然占用一个字符的位置。(有的信息适合用字母缩写,因为更习惯、无学习成本)
- unicode 信息编码虽然是文字,但显示类似图片,图片的优点,少量的图文结合看着不累。
- unicode 比 JS
- JS易卡退
- JS参与渲染时易拖动失帧
- 不安全、大量复杂代码难排查时。
- JS也可以用分栏、折叠、悬浮球等手段实现跳读、导航
- unicode 比图片
0. 不会失真模糊
- 大量的图片加载慢
- 可以方便简单的更改 unicode 的颜色、大小,而图片又是另一种改法,需要PS等。缺点是不如图片在各平台统一。
- unicode 的选默认兼容的字符,还是安装更大字体来支持更多字符?
- ifont 安装失败,要么root,要么一堆操作还失败
- root好多年不玩了,现在还要解这解那锁的、工具链各个环节还有各种植入偷跑广告防不胜防。
- unicode 相对 CSS
- 反色 + border:能造成方形、圆形、叶形等各种背景,但需要CSS
- unicode 复制时信息不丢失,兼容性超强!
- 反色 + border : 需要额外渲染,容易卡。
- transform 或 border 的各种拼凑构成图片。
- 各平台效果一致,但代码难写,不易复制。有条件可以双重保障,复制时用文字,而为了效果可再覆盖一层css控制的统一效果。
4. 本帖的意义
减少重复适配、选择的工作量
5. 工具的使用
测试支持度所用
-
unicode.mdx (33.5 KB) 数据来源:Huge List of Unicode Character Symbols
-
unicode_130000.mdx (250.4 KB) 数据来源: SYMBL (◕‿◕) 或 SYMBL (◕‿◕) 中文 。
- 这个字符数量更大更全,也就意味着更多金子、更多沙子,筛选更费事。
- 微观解释用这个。
- 可以直接搜索文字比如 black或 negative 可以搜索出大色块的字符,但是结果不全,不如手动遍历检查。
- vim 等编辑器可以快捷键输入 UNICODE;
- rime 等输入法可以快捷键输入自定义词、字符。
注意事项
- 论坛帖的显示、论坛编辑器、PC的GoldenDict、安卓的Eudict 是四个不同的东西。
- 同一Unicode 的显示效果都不一样。
- 本帖主要从安卓的显示效果来筛选,可能在别的地方看起来效果不一或者不明显或者与描述不符,此时可以用在安卓上的Eudict试一试。
- 先测了Eudict,因为它支持 OED2022。
现状
沧海遗珠,散落各处,不易搜寻,好好爬帖子,还是会有的,有空整理到这帖上。
时间轴整理结果:原形式
有精力再整理成结构更易检索的形式,先有后精。
未处理
css
\0000
\0009
\000A
\000B
\000D
' apostrophe, abbreviation
" quotation
! pros?
? cons?
question
~ verb
~- trans verb
- noun
... adj
@ @v
@n
# rank! #1
$ value !
% relative
probability
&| and?why not +
() explanation in short
[] harder to write
{} set?, hardest
\ ??
* rank set level 1
, + - . ; exist in different same level
/ category
: explanation in detail
^ result: <=> compare
_
用来混淆。。。
U+2010
‑
U+2011
‒
U+2012
–
U+2013
—
U+2014
―
U+2015
| ‖
_ ‗ 文件命名?最好ascii127
…
†‡
••‣
⁃
⁃ Hyphen Bullet
U+2043
⁂ * ⁎ ⁑ ⁕
⁋¶
‼
⁍⁌
⧮
10734 ⧯
10735 ⧰
10736 ⧱
10737 ⧲
10738 ⧳
⧑
10705 ⧒
10706 ⧓
10707
⧔
10708 ⧕
10709 ⧖
10710 ⧗
☂
2 个赞
6lj6
3
黑色背景、灰色背景、黑色涂满、灰色涂满:四层。
⚉⚈⦿⬮⬬⬤⧬ ⧭⧲ ⧳¶⁋☻☯ bullet •
* 𒊹靠上的圆,不知有什么用。
■⬝⧮ ⧯⬒ ⬓ ⬔ ⬕�🯄❐✚✜𖣯◙
▀ ▄ █ ▌▐ 上下全左右
▲►▼◄ ꔪ 𖠢⧨ ⧩ bullet ‣⁍⁌
⬥⬧⬩⬪ ⧫ ⬖ ⬗ ⬘ ⬙ ⧰ ⧱⧪❖⛖
⧑ ⧒ ⧓ ⧔ ⧕ ⧖ ⧗
⬟⭓⬣⬣⛊☗★
➡ ➠ ➡ ➢ ➣ ➤☚☛ ⏯ ⏮ ⏭ ⏏
✪
✔✘
⛾⛟⚑♠♣♥♦♞
🄫🄬🄭🄮🄯🅏🅍🅌🅋🅊 🆥 🆦 🆛 🆝 🆞 🆟 🆊 🆋 🆌 🆍 🆏
🅰 🅱 🅲 🅳 🅴 🅵 🅶 🅷 🅸 🅹 🅺 🅻 🅼 🅽 🅾 🅿 🆀 🆁 🆂 🆃 🆄 🆅 🆆 🆇 🆈 🆉
🅐 🅑 🅒 🅓 🅔 🅕 🅖 🅗 🅘 🅙 🅚 🅛 🅜 🅝 🅞 🅟 🅠 🅡 🅢 🅣 🅤 🅥 🅦 🅧 🅨 🅩
🄰 🄱 🄲 🄳 🄴 🄵 🄶 🄷 🄸 🄹 🄺 🄻 🄼 🄽 🄾 🄿 🅀 🅁 🅂 🅃 🅄 🅅 🅆 🅇 🅈 🅉
🄐 🄑 🄒 🄓 🄔 🄕 🄖 🄗 🄘 🄙 🄚 🄛 🄜 🄝 🄞 🄟 🄠 🄡 🄢 🄣 🄤 🄥 🄦 🄧 🄨 🄩 🄪
⒜ ⒝ ⒞ ⒟ ⒠ ⒡ ⒢ ⒣ ⒤ ⒥ ⒦ ⒧ ⒨ ⒩ ⒪ ⒫ ⒬ ⒭ ⒮ ⒯ ⒰ ⒱ ⒲ ⒳ ⒴ ⒵
Ⓐ Ⓑ Ⓒ Ⓓ Ⓔ Ⓕ Ⓖ Ⓗ Ⓘ Ⓙ Ⓚ Ⓛ Ⓜ Ⓝ Ⓞ Ⓟ Ⓠ Ⓡ Ⓢ Ⓣ Ⓤ Ⓥ Ⓦ Ⓧ Ⓨ Ⓩ
ⓐ ⓑ ⓒ ⓓ ⓔ ⓕ ⓖ ⓗ ⓘ ⓙ ⓚ ⓛ ⓜ ⓝ ⓞ ⓟ ⓠ ⓡ ⓢ ⓣ ⓤ ⓥ ⓦ ⓧ ⓨ ⓩ
🄌➊➋➌➍➎➏➐➑➒➓⓫⓬⓭⓮⓯⓰⓱⓲⓳⓴
①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳
㉑ ㉒ ㉓ ㉔ ㉕ ㉖ ㉗ ㉘ ㉙ ㉚ ㉛ ㉜ ㉝ ㉞ ㉟ my god! 这个竟然不支持!
㊱ ㊲ ㊳ ㊴ ㊵ ㊶ ㊷ ㊸ ㊹ ㊺ ㊻ ㊼ ㊽ ㊾ ㊿ 但这个支持!
⑴⑵⑶⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇
⒈⒉⒊⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛
⓵⓶⓷⓸⓹⓺⓻⓼⓽⓾
🄁 🄂 🄃 🄄 🄅 🄆 🄇 🄈 🄉 🄊
🄀
𝟶 𝟷 𝟸 𝟹 𝟺 𝟻 𝟼 𝟽 𝟾 𝟿 等宽
𝟬 𝟭 𝟮 𝟯 𝟰 𝟱 𝟲 𝟳 𝟴 𝟵 S-S Bold
𝟢 𝟣 𝟤 𝟥 𝟦 𝟧 𝟨 𝟩 𝟪 𝟫 S-S
𝟘 𝟙 𝟚 𝟛 𝟜 𝟝 𝟞 𝟟 𝟠 𝟡 Double-Struck
𝟎 𝟏 𝟐 𝟑 𝟒 𝟓 𝟔 𝟕 𝟖 𝟗 Bold
Monospace
𝚊 𝚋 𝚌 𝚍 𝚎 𝚏 𝚐 𝚑 𝚒 𝚓 𝚔 𝚕 𝚖 𝚗 𝚘 𝚙 𝚚 𝚛 𝚜 𝚝 𝚞 𝚟 𝚠 𝚡 𝚢 𝚣 配合i和j:𝚤 𝚥
𝙰 𝙱 𝙲 𝙳 𝙴 𝙵 𝙶 𝙷 𝙸 𝙹 𝙺 𝙻 𝙼 𝙽 𝙾 𝙿 𝚀 𝚁 𝚂 𝚃 𝚄 𝚅 𝚆 𝚇 𝚈 𝚉
Sans-Serif Bold Italic
𝙖 𝙗 𝙘 𝙙 𝙚 𝙛 𝙜 𝙝 𝙞 𝙟 𝙠 𝙡 𝙢 𝙣 𝙤 𝙥 𝙦 𝙧 𝙨 𝙩 𝙪 𝙫 𝙬 𝙭 𝙮 𝙯
𝘼 𝘽 𝘾 𝘿 𝙀 𝙁 𝙂 𝙃 𝙄 𝙅 𝙆 𝙇 𝙈 𝙉 𝙊 𝙋 𝙌 𝙍 𝙎 𝙏 𝙐 𝙑 𝙒 𝙓 𝙔 𝙕
Sans-Serif Italic
𝘢 𝘣 𝘤 𝘥 𝘦 𝘧 𝘨 𝘩 𝘪 𝘫 𝘬 𝘭 𝘮 𝘯 𝘰 𝘱 𝘲 𝘳 𝘴 𝘵 𝘶 𝘷 𝘸 𝘹 𝘺 𝘻
𝘈 𝘉 𝘊 𝘋 𝘌 𝘍 𝘎 𝘏 𝘐 𝘑 𝘒 𝘓 𝘔 𝘕 𝘖 𝘗 𝘘 𝘙 𝘚 𝘛 𝘜 𝘝 𝘞 𝘟 𝘠 𝘡
Sans-Serif Bold
𝗮 𝗯 𝗰 𝗱 𝗲 𝗳 𝗴 𝗵 𝗶 𝗷 𝗸 𝗹 𝗺 𝗻 𝗼 𝗽 𝗾 𝗿 𝘀 𝘁 𝘂 𝘃 𝘄 𝘅 𝘆 𝘇
𝗔 𝗕 𝗖 𝗗 𝗘 𝗙 𝗚 𝗛 𝗜 𝗝 𝗞 𝗟 𝗠 𝗡 𝗢 𝗣 𝗤 𝗥 𝗦 𝗧 𝗨 𝗩 𝗪 𝗫 𝗬 𝗭
Sans-Serif
𝖠 𝖡 𝖢 𝖣 𝖤 𝖥 𝖦 𝖧 𝖨 𝖩 𝖪 𝖫 𝖬 𝖭 𝖮 𝖯 𝖰 𝖱 𝖲 𝖳 𝖴 𝖵 𝖶 𝖷 𝖸 𝖹
𝖺 𝖻 𝖼 𝖽 𝖾 𝖿 𝗀 𝗁 𝗂 𝗃 𝗄 𝗅 𝗆 𝗇 𝗈 𝗉 𝗊 𝗋 𝗌 𝗍 𝗎 𝗏 𝗐 𝗑 𝗒 𝗓
哥特体, 我看不明白,不用它。
双线钩勒体,残缺字母,不用它。这个地方很奇怪,为什么一起的字母,部分不支持??
花体,很漂亮,但太小了,不用它。
衬线的大小写,粗体、斜体,跟上面的无衬线重复了。
64个卦,我大概用不上,不记。在更前的CD40区,也有八卦图。
16b60 附近有很多有意思的符号,但色块不够大,用来细读时的标记还行,不过这种标记用英文文字的标签更合适,毕竟少嘛,多几个字符也应该。
一对。
突然发现标题起大了,这么多字符。
꫞ 这跟个地图一样。
꧂ 超大。
Summary
Basic Latin
0000 控制字符不显示
- 特殊字符,控制字符之换行符的:“\A":可以通过CSS的before content对HTML进行换行,具体用法google一下。
0010 控制字符不显示
0020 ! " # $ % & ’ ( ) * + , - . /
- 0020 为 space, 一行共16个
- 剩下15个,ASCII 数字+标点+标号
0030 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
- ASCII 数字+标点+标号
- 首位是0030的0,即3*16 + 0 = 48,即第48个。
- 这里比较奇怪,如果数字比字母更重要所以排在前面,那么为什么标点符号更前面 ?
0040 @ A B C D E F G H I J K L M N O
- 这个16进制的0041的A,经常考试用,4*16+1 = 65,即第65个,ASCII 和 UNICODE 编码,众所周知,小写字母可以全部大写没毛病,所以大写字母更有兼容性,更普遍适应性,更兼容小写,所以编码在小写字母前。我们可以没有小写字母,但不能没有大写字母!(虽然它们在信息上等同,但已形成的习惯是大写更普遍,也就更重要,也就先编码)
0050 P Q R S T U V W X Y Z [ \ ] ^ _
0060 ` a b c d e f g h i j k l m n o
- 0061的a, 6*16+1 = 96+1 = 97,很奇怪,即便是16进制,a也不是0开头的在第一个,而是1开始编码的第一个。真是又当又立。一会更人性,一会更计算机性。
0070 p q r s t u v w x y z { | } ~ ␡
- ␡ 这个符号
- PC GD, Android EUD, forum.freemdict均显示一致
- 编码127,从0开始的第128个编码,即7位2进制全为1
- 没看出什么用处,也不能做为CSS before content:“” 来进行删除操作。
Latin-1 Supplement
0080 控制字符不显示
0090 控制字符不显示
00A0 ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ® ¯
- 第一个是NBSP, mdx 显示时就合并为 space 了,手动复制才能真的是NBSP。
- ¨ 这个家伙用来表示分开发音,不连一起,可是这玩意标不到字母头上!只是作为解释字符。
- § :Section, 在LDOCE的分隔装饰中看过,单独不明显,配合其他使用。
- « 左引用,难辨认。
- ¬ 比 not 3 个字母好,跟数学一致
- 有个soft hyphen, 哪个平台都不显示。
00B0 ° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿
- 度数
- 上标就23?1在后面,0又不是
- ¶ :Paragraph,还有个反着的⁋。不用换行+缩进时可用这个来表示,手机上更大一些。PC上也比较大,唯有在论坛的网页上这个黑头比较小。
- º 不是0 上标。
- 其他分数呢1/3 1/5 /1/6 2/3 2/4…
01C0 ǀ ǁ ǂ ǃ DŽ Dž dž LJ Lj lj NJ Nj nj Ǎ ǎ Ǐ
- 你敢相信,这两个字母是一个字符!!!我以后不再是6lj6,而是6lj6。增加反爬、垃圾短信群发、数据化难度,只对人眼无差别,但信息难以检索、加工、自动化处理。
6lj6
4
查阅词典时的成本,是点一下更爽,还是眼瞄一下更爽。是眼瞄好几下,还是手点一下,还是手翻好几下。
尽量通过提前的一次设计,避免查词时多次的不必要的不爽、繁琐。
这样对不同的标记点的需求频率、对不同人、不同设备、不同需求、不同时期、不同阶段等也是可能不一样的,所以需要用户配置,这样要准备多套方案:从用户喜好、到渐近熟悉后,交互都应是改进的,有时侧重一致性保证易用性,有时侧重图个新鲜要一直换保证可持续性,有时要针对某场景优化保证效率性。
多平台的兼容还是不兼容,效率设计和人性设计配比是多少,怎么量化进行优化尝试。
⬤ 最爽的一个,当然用来主力,我个人选它作为例句的标志,但纯黑又太显眼,所以把它降成 rbga 0.1~0.3 灰度的样子。0.6 灰度是留给次词性的,verb 下的子分类:transitive verb 和 intransitive verb.
- 最常用的。(常用的还有不同词性视觉导航用了背景黑白、灰白)
- 不仅是自身的标记,也是作为多个同类事物的分隔的标记。
1 个赞
不知道高手怎么做词典结构修改的。
如果靠regex的话,图标一多,步骤一多,不就容易错、乱 吗
还要考虑 emoji 编码。
我想搜没搜到,散步呢。但是我知道谷歌搞了个noto emoji字体,唯一可以后装的emoji了可以说
我知道表格可以被pbi读取,微软有做客户端和app,
当时我都可以从手机端快速读取快递单号等
就是这么词典转表格,我不会
买了几本书,看着都简单,一概而过,那种。
但是。还是不会。
我有点想搞个本地机子,把 okayer大 的TIO 自己假设起来。
不知道怎么搞便宜,据说云主机一年 两千只羊呢
我有点觉得我不会是我没买够……
Sunny1
10
不知道JS卡顿是指什么,我歪个楼,说个最近发现的一种卡顿现象。
很多mdx源文件都会把html内容压缩成单行,像这样
词头
正文(长长的一整行内容)
</>
然后我发现在GD的webkit版里,如果在源文件里不把正文压缩成单行,像这样:
词头
正文1
正文2
....
</>
这样生成的mdx用F12 inspect调试的时候打开速度会缩减到原来的15%左右,就是原来可能5~6秒才能展开调试窗口的词典,现在只需要不到一秒
这可能是受了GD webkit 版的限制。webengine 版没有这个问题
3 个赞
mdict6
14
分享个笑话
一个日本人用英文和上海司机说要去花园酒店,最后送到了嘉定沪太路。
ASCII 编码顺序是怎么确定的?请看 Mackenzie 的书 Coded Char Sets 第十四章:The Sequence of ASCII
1 个赞
6lj6
20
Mackenzie - Coded Character Sets History and Development.pdf (17.9 MB)
尝试过程:
-
baidu.com 失败
-
bing.com 失败
- 磁力搜 失败
- libgen.ee 失败
-
yandex.com Yes!Yes!Yes!!
启发:
有问题时,不要止步于问题,多找解决方案
- 比如借鉴前人经验:搜索论文、杂志、书籍是否有相关关键字
- 不要被工具束缚、限制、定义,发掘更多的工具拓展自身的视野。
- 一个设计可以有多种,是这种而不是那种一定有他自己的考量。自我猜测、批评它,很有趣;但跟实际的商业考量相去甚远,这种有趣和批评来自自身对外界的无知。
多谢 爱好者amateur的指引!很硬,好难啃 。
我完整看了一遍。不需要前置知识,只要懂简单的位运算就行。很有收获。