14Jul/09

智能机器人的学术探讨

下文是转我的老板的博客, 地址是http://www.sylvainpaillard.com/wordpress/?page_id=284 他在卡内基梅陇待过, 这个学校是人工智能的全球领先者之一。人有点呆,哈哈,他看不到中文的,写的文章也有点呆气。不过他给了我们绝好的一个世界的视角和最领先者的视角来看待这些问题和历史。其中的聊天机器人Elbot的例子很有趣,玩赏性极高的。针对商业问题, 你可以看到卡内基梅陇的校内试验系统RoomLine application惊人的成熟和智能。 网络/智能机器人是国内新兴起的名词,通过网络或其他媒体,用一个仿生的类人去做客服的工作。国内知名的小艾就是其中一家。 看过此文后, 大家应该有能力鉴别chatterbot和对话管理的区别,即把握Elbot和RoomLine application的区别,最终根据自己的需要选择合理的解决方案,chatterbot或者对话管理。 June 25, 2009 对话系统的历史 对话系统的思想也许自计算机科学领域产生以来就存在了。我们无从得知Charles Babbage在19世纪30年代发明分析机和差分机的时候是否已经思考过这个问题;但是我们可以明确地知道,Alan Turing在1950年的论文《计算机与智能》中介绍图灵测试时就定义了终极对话系统。 据维基百科 – 图灵测试的“标准定义”,C(询问者)通过问题来判断A和B谁是人,谁是机器。为做出判定,询问者仅限于使用书面问题来回复。 Turing曾预测机器最终能通过图灵测试,到2000年,30%的询问者在5分钟的测试中可能会被愚弄。未来学家Raymond Kurzweil在1990年将这个期限更改为2020年;2005年时又做出修改,期限推至2029年。 最后的这个预测跟先前的一样,对我而言都是不确定的,不过很多有趣的对话系统先于预测的年限就已经得以开发,市场并不需要通过图灵测试才开始采用对话系统。 Turing Test version 3.png 聊天机器人与对话管理的根本区别: 谈及对话系统自1950年以来的历史之前,考虑过去几十年中两个不同的趋势是极为重要的:一个是外观模拟对话(称其为聊天机器人方式),一个是模拟真实的对话,并动态产生合适答案(称其为对话管理方式)。在图灵测试的定义中我们可以直接发现这两种方式共存的原因,因为图灵测试仅重视所提供答案的感官的有效性,而不去验证回答是否基于理解。 现实中,开发出来的系统有时结合这两种方式,但是其中一个总是明显地占主导地位(在一定程度上,我们可以说聊天机器人里有对话管理,即使它通常基于简单的模式匹配规则)。以下给出一个简例以示说明: 用户询问:“你能给我买一瓶牛奶吗?” 利用对话管理方式,计算机可以(只是举例)创建一个模型:[type:Question;Read More…

12Jul/09

GIOS蓝精灵处男行

俺的蓝精灵回家后还没出去过, 今天得空,打足气到90psi,穿戴好帽子眼睛还有卫生裤就出发了,还有Garmin 305. 出门后在开发区的路中瞎转了一会,找到马驹桥的方向就一头扎出了南六环。 俺的户外原来都贴在豆瓣的跑步论坛, 结果因为西北的事也被GFW了。 现在看来只有自己找一方净土,自娱自乐了。Garmin的轨迹如下。

12Jul/09

不仅晚餐,午餐也免费?

No Free lunch没有免费的午餐,是商业价值的基石。记得2000年去硅谷见老同学,现在大家知道他走了狗屎运到某IC公司。该公司号称是泡沫破了之后在湾区仅有的两家发达了的公司之一,另一家就是google。也的确如此,99年入职,一直做一线的IC设计工程师,去年已经退休了。当时聊起来并没有觉得他入职的公司怎么样:每天跟老婆回公寓做午饭睡午觉,下午再练场网球,晚上把公司的免费晚餐吃了再回家。伟大领袖谈论共产主义的时候都没敢像他们这样啊。转过味道来, 就想起了no free lunch这句话,共产主义也不会免费午餐。在互联网时代,这一切都在转变。 15年前有人预言了新的现实。Esther Dyson在google, wiki, podcast…之前已经做出了预言“内容创造者们要竭尽全力去吸引注意力,才能得到报酬。市场变得极具竞争性,越来越多的免费知识产品通过互联网传播,知识的创造者数目也同时剧增。将强版权保护也没用,因为你在跟众多的免费或近似免费的知识产品竞争。” Chris Anderson的新书FREE-the future radical price,中文可以翻成“免费–未来的基价”将这个理论上升为“互联网之道”。纽约时报今天也发了该书的书评what you pay for $0.00, 这也是Chris一早推客给我的。 不过这本书还是不符合潮流, 至少没有符合Chris自己的理论, 还是要收$26.99(Chris发布了两个地方可以免费阅读,我去访问,被告知我不在允许的地区,下面的地图清楚表面了只有美国人民才有此权利)。Chris称:几个技术的飞跃决定了整个互联网内容的价格趋势:计算技术,数据存储,数据传输,以及数字内容的复制和送达, 这个趋势的尽头都指向$0.00. 事实也的确如此。 比如Freemium模式, 采取基本服务免费,但需要向额外功能付费的方式,达成免费的的模式。即使免费,数字商品跟传统的商品还是有本质的区别–数字商品是眼球经济,每一个产品的目的就是让用户更多的时间消耗在自己身上。看看博客, 在线游戏,音乐,视频。。无一不是在争取占有更多的用户时间。不幸的是人的时间是有限的, 一天24小时,一年365天, 这是自然地法则。可以想见,在数字内容领域, 进入的门槛几乎不存在,竞争会变得你死我活,越来越细分。只有在细分市场占据第一的公司才有机会攫取相当的利润。 没有免费的午餐,或者傻瓜才干活不要报酬,这个几千年的传统在互联网时代被颠覆了。互联网里充斥了各式各样的傻瓜们,毫无报酬,去创造,去贡献,去影响,去被确认为某个领域的专家,这些带给他们的乐趣远远大于传统的有报酬的工作带来的乐趣。正是这些傻瓜的无私贡献,我们的生活水准得到了真正的提高,大众可以享受更快捷更方便更廉价更多样的娱乐和信息—这才是大众真正寻求的快乐。Read More…