[讨论]大家都知道金山快译很弱智,所以你认为做类似的,但更智能的软件的可能性以及方法
rt 问题点数:0、回复次数:4Top
1 楼sliant()回复于 2003-09-04 20:42:44 得分 0
可能性: 基本不可能
方法: 基本没有
因为: 还没有相应的职能理论出来,所以做不出来Top
2 楼lemonade(Wings of Summer)回复于 2003-09-04 21:38:59 得分 0
what kind of algorithms has been used in JinShan?
I guess it should be something for charactor classification and there should be some sentence generating algorithms as well...
Can't be bothered.Top
3 楼saucerman(外星人)回复于 2003-09-04 23:02:09 得分 0
我让金山快译2003翻译个骂人的俚语“Fuck you.”
你们猜他译成了什么?“性交你”!
真的很学术化啊。
以后我生气时就再也不说“我操”了,就说“我性交”!Top
4 楼gafield(加菲)回复于 2003-09-05 21:05:09 得分 0
更智能的东西一定能做出来,但是有很多问题
我提以下的几个需要解决的问题
1.对语言的量化
对语言的量化很重要,对语中的词,字,语法关系都需要量化,如果能量化得很清楚而且很全面的时候,使用机器来说话只除下语言本身组织意思的量化了.
2.运算速度需要大大的提高,现在P4的速度,远远不够做即时的数据库查询,因为语言的关系是复杂的,以简单的表达关系来表示两个语言的关系肯定是无法精确的对照出真实的意思,所以,两个语言之间一定是很复杂的对应关系,这种复杂的对应关系精确对应的时候是很消耗CPU的时间的,所以,我们需要更快的计算机.
3.上面已经提到就是两个语言之间词的对应关系,这个对应关系可能比起财务来并不是很复杂,但是需要参考的内容很多,我们还需要一个合理的结构,这个结构可以很容易的表达一个词对应到另一个词时的所有的可能的关系,不要小看这个关系的对应,可能包罗万象,如果使用一套格式化的关系,可能会很复杂,如果作适当的量化,对相似的东西做结构化,就这个工作量也是很惊人.
我现在正在做一个小词典,我现在使用的数据结构是一个自己设计的数据结构,使用的是一个很一般的查找算法,因为对应关系的复杂性,不得不使用access 数据库,来解决一些技术问题.因为一个人做太麻烦了,如果有兴趣,就来看看我的软件,不过,我做得很不好,但是还是有一点自己的特点吧,现在正在做第二版的英文边看边学,就是一个对应英文单词的软件,一开始计划加入很复杂的词汇的关系,但是现在我被计算速度,程序效率等问题给堵住了.在向下继续看来是不容易了.
其实,我感觉在数据存储方面,数据检索方面如果做的好,速度还应能有很大的提高,但是一个人的力量实太是微不足道,而且个人的能力和精力有限,很想去好好的研究一下一些高级的存储,检索算法,
顺便说一句,我的词库很小,只有3万左右的英文单词,与中文的对应关系有20万,只是一个标准的小词库,如果哪位兄弟也有词库的话,兄弟愿意与他交换词库和心得.
我的程序正在升级,个人网站是 http://gafield.yeah.net
新的边看边学近期在上传吧,今天有了一些新的升级Top




