主题:中国文明只有63岁——《大目标》后记 修正技术错误 -- 马前卒
共:💬216 🌺1256 🌵22
也是计算机的痛苦,由于中文字符之间没有空格,不像西方语言中词之间天然的空格分割,所以tokenization是一个问题(当然有不少成熟软件可以做这个尽管不是十全十美)。
- 相关回复 上下关系8
压缩 4 层
🙂我认为英文有类似汉字的因素 4 沫水若水 字91 2012-08-29 23:08:42
🙂嗯,确实如此 2 diamond 字82 2012-08-30 04:14:56
🙂是啊,很难明确区分 4 沫水若水 字609 2012-08-30 05:37:37
🙂这不光是老外学中文的痛苦
🙂不知道如果更改一下书写习惯是否可行 3 沫水若水 字86 2012-08-30 23:49:33
🙂不可能了 2 杨微粒 字532 2012-12-17 13:17:57
🙂中国人学英文时,海量的单词也是痛苦啊 4 沫水若水 字0 2012-08-30 23:25:14
🙂那是你在学中国考试英文 3 配额他 字84 2012-08-31 00:46:48