« 一种对汉字更环保的 Unicode 编码方案 | 返回首页 | 让 Erlang 的控制台支持中文 »

关于词典软件

从去年开始关注 Erlang ,我们组里已经有三个同事学习了好长段时间了,并有一个同事有实际的项目经验。前几天的 erlounge iii 我们有一个人过去听,回来后滔滔不决的跟我又咕叨了许多,这使得我周末突然有兴趣仔细读读 《Programming Erlang》这本书了。

btw, 原来打算去上海参加 erlounge 的。正好那个周末我们北京机房挪地方,导致我的域名解析服务器更换 ip ,那是件麻烦且必须快速处理的事情,迫使我留在办公室哪都没去。

网上订了一本《Erlang程序设计》,要到下周才送到,那么就先下载英文电子版研究一下了。

嗯,不过这篇 Blog 不打算写 Erlang ,只是谈谈电子词典软件的问题。

词典软件我用的 有道词典 桌面版。毕竟是自己公司同事开发的,有意见可以即时反馈。据说在屏幕抓词方面也好过金山词霸。可惜不能抓 Foxit Reader 的。在线问了一下,说是我的 Foxit Reader 版本太老了,而词典早就支持 Foxit Reader 2.2 了。

去官网下载了 Foxit Reader 3.0 版,发现取词还是不太稳定。把 OCR 模式打开好了一些。

我对屏幕抓词的功能本来就没啥兴趣,试了下不太满意,就作罢了。对于我来说,那个弹来弹去的取词框更多的时候是种干扰。我想,连我这种英文单词量极少的人都有这种感觉,那么更多的人相信也会有同感了。

如果我真的满屏幕一半的单词都不认识的话,干脆用翻译软件看好了。词典软件恐怕也帮不了什么忙。

对于这个问题,有道的同事的说法是,活用取词热键。只在需要的时候取一下。这样也不错,但我觉得不是根本的解决方案。

即使对于取词的形式,我也曾经提过一些建议,但是没有得到认同。那就是,提供一种模式,取消弹出的取词框,而是直接显示在词典软件的主窗口里。我自己爱把词典窗口放在哪都可以。最后,针对我的建议,给出的是一种折中的模式,这里就不详细说了。


今天,我想起了 10 多年前自己做的一个 DOS 小软件。打开一个英文文本文件,在屏幕的最下方显示当前光标行上的生僻单词的中文解释。那个软件是没有词典库的,而是靠人工在阅读的时候手工输入。但正是手工输入,可以判定,被输入的词一定是对于我自己的生僻词。

这样,词典对阅读的干扰是很小的,而且集中在屏幕下方的固定位置。当年,我就是这样翻译 Allegro 手册的。手边放一本字典,遇到不认识的词查一下,输入到机器里,下次碰到了,自动在屏幕下方显示出来。

现在,这个想法依然有价值。

如果我们可以根据用户的查询历史,根据整个软件的用户查询习惯,根据生词在网上出现的频率,猜测出哪些词可能是用户不认识且关心的。再根据当前屏幕上出现的英文单词,挑选出 5 个放在屏幕边栏上显示它们的翻译。我想,这是对阅读英文的用户来说干扰最小的方式了。

允许用户方便的点掉那些软件猜测错误的单词(比如显示了他已经认识的),将能协助软件更好的适应他。除了已有的屏幕取词定位功能外,还可以在查询单词的输入框里,结合屏幕上出现的生词,对用户的输入做联想,自动完成用户的输入。

这个模式甚至不需要特别精准的屏幕取词,或许用某种新方法去获得内存里的文本就行了。OCR 模式也可以更有效的在后台工作。用户在使用的时候,遇到不认识的词,第一反应是向词典软件窗口里瞟上一眼,这比动动鼠标要轻松的多,当然对软件实现也更有挑战。


前几年,popo 组的同事跟我闲聊的时候曾经说起,她觉得应该给 popo 的好友列表加上多级分组的功能。现在分组太多,寻找分组都是件麻烦的事情。我说,你的最终目的是找到你想找的那个联系人,定位更细的分组只是你完成这件事情的一个环节,不是你的目的。不如先把利用拼音声母定位用户的功能做出来更有意义一些。

为此,我还专门为 popo 组的同事制作了一份汉字声母的查询表文件。

前天,有个朋友问我,你认为 google talk 和其他 IM 软件的根本区别是什么?

我说,在我看来就两点。1. 智能排列的联系人名单。 2. 可以用不同的方式,同时多处登陆我的同一个 gtalk 帐号。

其他,所谓简洁的界面,开放的标准,和 email 结合,轻量的客户端,都不是重点。

gtalk 可以在我给一个人写过 email 后,接下来的几天,只要这个人上线,立刻窜到我的联系人首页;可以在我多年没联系的朋友上线后,优先停留在名单可见的地方;可以让那些我不常回复的联系人较低频率的出现在我的眼前。

而这些,是不需要我去滚动长长的滚动条,翻阅我的分组的。事实上,google talk 也因为此,“霸道” 的不提供联系人分组,并推荐只显示一页联系人,而在主界面上去掉滚动条。

有时候我发呆的时候,不经意的看着我的 gtalk 联系人列表,看着它缓慢的刷新那七八个名字,每每能给我惊喜。让我心血来潮的跟我那上百联系人中的某一个打个招呼。我几乎有种幻觉,这个软件可以猜到我心里在想什么,我想找个人,那个人就出现在眼前了。而别的 IM ,比如我已经很久不用的 msn ,只会不停的用飘窗骚扰我,XXX 上线了。


对于一个优秀的人机交互界面来说,软件应该尽可能的猜测用户想做什么,自动帮他去完成,从而把 交互 减少到最少;而不是堆砌一大把的工具,提供一套 友好 的交互方式,放在那里等用户自己拿出来组合起来解决问题。

用户需要的是解决问题,而不是欣赏工具。


ps. 写这篇 blog 的过程中 Chrome 崩溃了一次,导致大部分文字丢失,重新写的时候兴致小了很多,对原来想写的东西做了大量了删减。:(

我说,浏览器崩溃的时候,就不能想办法把输入框里的东西找个位置优先备份一下么?输入框里的用户输入,即时的放在内存中固定位置,直到用户离开页面再扔掉。如果一旦发生程序崩溃,Catch 住异常后,把固定位置内存里的数据写到 log 文件里,应该不是啥难事吧?

Comments

哦,总显示不全。
大家可以在chrome插件中搜索smart word

https://chrome.google.com/webstore/detail/odhiddefamddbjhpaoagfkmgkkfhjnkd#

云风,我做了个插件,您帮忙看看。
https://chrome.google.com/webstore/detail/odhiddefamddbjhpaoagfkmgkkfhjnkd#

最有效率的中国人看英文网站插件
(最常用操作,在生词处双击即可)
Highlight the English word matching the current selection,translate it into Chinese,Count the number of the word you selected.

1.选中一个英语生词后,在页面高亮该单词
2.显示英语生词的中文释义,并播放其读音
3.根据页面计算生词的出现频率,先熟悉频率最高的生词
4.选中单词标注生词,再次选中取消标注
5.鼠标移动到页面生词处,就显示其中文释义,播放其读音
6.新打开页面中出现标注过的生词即高亮

大家下载后,可以到 http://www.nytimes.com/skimmer/#/Top+News 双击生词体验

建议程序开发者有敬业精神,和用户多沟通沟通,多多听取用户建议!
辞职敬礼!

最好的办法是把单词背好,就不需要单词软件了,流畅的阅读体验不是那种动不动就要查词典所能比的。

希望你们可以多创造一些新产品

希望你们可以多创造一些新产品

我装了google toolbar for firefox,开启取词,然后把toolbar隐藏……另外还在线查一查www.dict.cn
金山词霸装了,不是翻译,一般不用。

Firefox不需要插件,就可以恢复input内的内容,undo close tab的情况都可以恢复,crash也没问题。WLW确实不错,用Windows的话,可以考虑用。OSX和Linux下暂时没有找到能和WLW媲美的软件,有点遗憾。可见只要M$SF愿意,还是可以做出好东西的。

关于字典,涉及用户使用习惯和词频的想法很好,怎么实现和谁来实现是个问题。金山词霸2009让人失望,虽然放出了for iPhone和OSX版本,但都基本到无用。

现在基本上都用OS X的Dictionary和Linux下的Stardict配E-E的LDOCE字典用。

只有复习生词的时候,才会启动Windows去用词霸的,2009能和社区的online生此本同步了。Stardict的类似功能过于简陋。

有道可以考虑在别人没做好的地方努力一下,应该是有市场的。

应该加进这样的一套模式进去以供不同的用户选择。

显然,现在不少用户对于词典词霸类软件和翻译快译类是混在一起理解的,实际使用中也是拿这类当那类用的。由于这样的“误解”,有些用户明明是需要尽可能大量的文字或段落翻译,他们却照样拿词典类来使,这样屏幕取词就显得很烦人了;而那些只需少量词语翻译的用户,偶尔也还是觉得屏幕取词烦,为了避免有时不经意移动鼠标而引起取词翻译,就得关掉取词开关(尽管可以键盘+鼠标方式,可现在的人就是懒,能用一个手指完成的,你再规定多需要一个指头,他就不爽!),想用的时候又得开。

写长篇最好找个文本编辑器,并时时保存.好习惯也很重要

强烈同感: 鼠标跟随的取词让人感觉很厌烦.

现在更喜欢打开浏览器用雅虎辞典, 虽然没有桌面辞典那么方便, 但是因为需要查的词本就不多, 而且浏览器几乎总是开着的, 所以感觉很习惯

抢个沙发!

可以统计一下常用文章中的单词常用度,然后减去个人已经掌握的单词,将剩余单词按常用度进行排列,这样记的单词更有用些。

请求增加新功能:
1 记录我所屏幕取过的词、词频(表示我对这个单词的不熟悉度,便于复习)
2 记录我所查过的单词、词数(一样)
3 如果可能增加一个帐号,网络同步我的这些陌生词汇,便于多台电脑共享

谢谢

为啥不用babylon?它就没有取词窗口,就一个主窗口。用ctrl+右键取词。

浏览网页我用google toolbar就足够了。不耗资源啊。

原来是IP变了,我说前几天你的网站访问不了。

1. 关于取词窗口
我也是有过云风所说的“那个弹来弹去的取词框更多的时候是种干扰”的这种感觉,所以大部份时候我也是关闭鼠标取词的功能。
后来,我一般是这么处理:
如果需要查的单词少的时候,用热键调出主窗口,动手输入需要查询的单词,同时也可以加深对这个单词的印象。
如果生词比较多时,则使用热键加鼠标取词,同时固定取词的窗口。
还就是生词本的功能也很好用,对于自己查过的单词同时加入生词本,然后定期做下回顾。


2. 关于用户自定义词典
有时,我们在软件提供的词库中,并没有找到我们所需要的内容,这时就需要自己来完善或增加我们自己的记录。
在金山词霸2007中,有“用户词典”的功能,不过存在一些不足,如:不能输入音标,不能插入图片,不能设置字体样式,当用户词库记录多了之后不方便管理等不足;但在2008年出来的谷歌金山词霸中就没有了用户词典的功能。

我想用户自定义词典的功能存在一定的价值,值得开发商去挖掘;
每个人其实都会有自己的想法,自己理解,随着时间的积累,每个人都会形成自己越来越大的词库,再上网络,用户身份登陆, 不同的电脑上可以保持词库的一致性,自己的词库也可以与其它人一起分享...
当词典加上了用户自己东西,词典也就显得更加个性化了。

有道有英英解释的部分来自wordnet,可能不容易发现吧。取词功能很难取舍,还有不少网民回应说希望取词更强,甚至增加划词,我想确实和屏幕空间有关系;另外,我个人的体验是如果在读一整篇文章时,取词不会使得我跳出这个阅读环境,就好比看DVD有同步的中文字幕,远比我暂停后举起打印剧本要方便和体验连续。

用户行为中确实还有更多可以挖掘的宝藏,比如云风讲的智能猜测生词自动翻译,呵呵。

现在有道的屏幕取词是会考虑前后词的相关性的,类似搜索做TYPO的方法,我们管这个叫智能取词,就是说后台会把鼠标位置前后几个词一起提交,看后台log里哪个查询的多且有解释,就返回回来。

最近把词频和四六级做了一个交集的统计还挺有趣,http://cidian.youdao.com/cet,得到了教育网里查询最多的四六级单词表。看来还有很多很多的可能的结合点。

谢谢各位的意见,一一记下。//bow

foxti reader vs adobe reader
gtalk vs msn
chrome vs InternetExplorer
开发者 vs 使用者
Geeker vs 普通用户
Google vs Baidu
babylon vs 金山
培养用户习惯 vs 适应用户习惯
超人类 vs 人类
云风大大 vs 小Dev

屁股决定脑袋,
位置决定角度。
恩,没了。

不同意风云的意见,第一:所有辞典“金山”“有道”都可以把窗口固定在桌面上(弹出窗口右上角的针点下去),但是如果出5个生僻词的话会占用大量面积(不是每个人都会用程序员的多屏)。而现在用辞典的人有时希望的是很详细的解释的辞典还有某些短语和固定用法(更有面积问题)。这样一来金山的搜索功能更好就占了些便宜。而风云提出的最生僻的5个词其实找个词频统计就可以实现(如果想更好些的话加点贝叶斯后验估计,短语分割,中文的分词什么的),但我从用户的角度来说觉得没有这个必要.我看不懂某个词时就习惯的ALT+鼠标点一下。培养用户习惯当然很难,但像gmail有些东西做的让人觉得是画蛇添足

我觉得现在辞典软件最大的问题不是取词窗口到处飘,而是不能正确识别用户想取的词,特别是生词在使用后缀和复数形式的情况下,往往需要我们自己输入。

如果写程序的人都有这种想法和态度就好了。

挖,其实我觉得,chrome 很有潜力,但是目前还是问题多多,所以现在还是用更成熟稳定的FF吧。

你提到的浏览器保存用户输入的问题,firefox就行,firefox会在崩溃或者被关闭的时候,保留你正在浏览的全部页面信息,包括输入框中输入的文字信息。

真是蛮好的想法哦,我甚至想就此做一个。真的

firefox有扩展可以实现对文本框输入内容的保存,不管是FF崩了还是你不小心关掉了页签,输入内容都还在

而且有道不能提供英文解释也是一个缺陷之一。当然lingoese能是因为他不考虑版权问题。

我个人用lingoes比较多。这个软件可以固定取词窗口,这样就很像云风说的显示单词解释在主窗口了。但是功能也很不完整,比如没有生词记录功能。也不提供开发插件的接口。
其实学习一段以后的英语人,主要查个别单词的用法和详细解释。国内因为新东方老师的大力推广,longman的电子词典最流行。
如果有道能实现云风说的功能就更像一个翻译辅助系统了,而不是查词工具。但我觉有道视乎没那么大的野心。如果实现功能太复杂了。对于没有需求的用户又是累赘。

不知道你blog用的是哪个?我因为是在win下,blog用的wordpress,所以我都是用windows live writer发布和修改blog,挺方便的,而且,现在writer支持比较多的blog发布协议

Post a comment

非这个主题相关的留言请到:留言本