04Nov/09

在云中搜索

自从07年米国上空升起了云,谷歌将亚马逊的云概念放大提升,云就主宰了互联网的上空。 这团云1年多后飘到了神奇国,有嘴喷上天的,有图上画的,有扔泥巴拍张泥巴空中飘浮的有图有真相的泥巴云,还有昨天搜狗拼音的云输入法,这个是近期看起来最靠谱的云了。自从搜狗发布了搜狗拼音,搜狐在俺的心目中地位直线上升,拜托了过去烧钱吹牛催肥的路数,走上了创新的道路,俺甚至觉得假以时日,百度都将败于搜狐体系-看看百度最近的各种创新,无不是追风之举。 借着团团热云,俺也从搜索性能的角度也云一把, tag cloud search, 通过标签云的搜索。典型的TCS是 Quintura, 也有人称之为有视觉的搜索(Visual Search), 看看针对俺的网名的搜索的视觉效果吧。   可以看到的云,不是么?choubb是初次的搜索词, 根据这个搜索词,引擎动态生成了一个相关性的标签云。可以在这个标签云里继续拓展搜索的内容。让我们来看看到底会发生些什么结果。光标移到标签“购物”, 标签变得高亮, 同时搜索列表也自动变化了。光标离开,则高亮消失,返回上一个页面-不论搜索结果还是标签云。 返回到第一次搜索choubb的页面, 点击另一个标签“9月,1st”,标签高亮保持,同时搜素结果跟随变化。点击搜索流程导航的返回箭头(向左),可以返回上一个画面。 如下图(注意标签大小的跟上一个搜索的不同对比): 继续搜索-选择第三个标签,试了差不多一大半的标签,都没有结果(如下图)。既然没有结果,为什么还要显示这一层的标签?第一个bug发现了,哈哈 观察,Quintura有两个创举 标签云的搜索, 有点类似搜索鼻祖雅虎的目录是搜索,但是雅虎做的是树状结构,Quintura采用的是标签,是平行的,并列式的关系。目录和标签云的UI也截然不同 搜索流程。将搜索根植于应用之中 的博客中阐述的概念类似。在线行为无非是三种:在一个有限开放的环境中搜索知识,人机信息交互;其二,在一个封闭环境中完成人机信息的交互;其三则完全利用在线环境做人与人的信息互动。那么第一种在线流程从本质来说都是搜索。 初初感觉Quintura 非常直观易用,不像google有cheat sheet之类,把搜索变成了很专业很神秘的事情。来Quintura上手就用,眼见为实,不藏猫腻。 发散性搜索。恰好今天看了篇博客,责备谷歌搜索局限了人们的思维。而在Quintura,标签和标签的关系是发散的。 搜索结果。可以说不尽如意,搜索的相关性比较低。这也很自然,发散性的搜索自然相关性比较低。。相信Quintura还有大量的细节需要发展和优化。 再来看看Quintura公司本身 05年8月创立:有些历史了Read More…

01Nov/09

翻译练习:Twitter, 提纲, Lists, 目录, Y!ou

很喜欢看Anil Dash的博客,就如这一篇。时而细细的抚摸着互联网的脉搏,突然又将互联网的部分解剖开来;时而跳动在最潮的浪尖,一转身也可以回到互联网的侏罗纪。大洋彼岸的互联网已经柳暗花明又一村,中国的互联网任重道远仍然踯躅在原始的丛林里。就像本篇,互联网已经进入到了chapter3, 从人工到机器再到人工,而看看国内,大部分的站点甚至还未明辨人工还是机器方法区别。同发译言:http://www.yeeyan.com/articles/view/56852/66168?yeeyan=1 人类创造的web,但我们已经在很大程度上放弃了构建web的内容的权利, 而把它留给了软件。 此种现状可能会改变。 本周全面推出了新功能-列表(Lists)。 列表,可以让你列举了一些你所跟从的Twitter用户,然后轻松地阅读这些帐户的更新。 其他人可以查看您的列表,也可以选择订阅它们。 不仅如此,名单也可用被其他应用程序所使用,修改和共享。 从另一个角度来看,名单可以看成是给任意实时网络的聚合(feeds)打的一个标签(Tag) 。 我刚刚添加的列表作可以被看做是描述我的twitter聚合的一组标签。 共享聚合的(非实时)早期概念来自提纲,并由 的工作创造出了OPML。 虽然最初设计它的作用是交换提纲,OPML已经变成了用于共享任意聚合的最流行的方法。 (尽管专业计算机人士仍然诟病OPML的技术问题,就像丘吉尔的对民主的评论-这是最糟糕的形式,除了任何其他的可选形式。)有意思的是,这个协议用在twitter类似的实时聚合是,竟然不用做任何协议的改变。 事实上,在几个星期前,我曾将150个所跟随的聒噪,无足轻重的Twitter用户转移到了谷歌阅读器,将他们输出成OPML文件。 Twitter开始变得更令人愉悦,同时我仍然可以保持跟踪那些用户的动静,点进谷歌阅读器就成了。 名单有一些特点,比看起来还要有趣;我们可以把这些当成列表的定律。 首先,你必须登录一个有效的Twitter帐户才能创建它们。 (这似乎是显而易见的,但非常重要的。)其次,将一个Twitter的用户加入你的列表,你将在查阅该列表的时候看到该用户的更新。 将账户认证和关系的绑定 ,是一个减少垃圾邮件的好方法。 最早的分类组织网站的内容的方法之一是人工编辑目录。 类似开放式目录项目(Open Directory Project)的计划依然存在,但该模型侧重于定义主题和结构,以及为所确定的编辑确定各自的编辑权限。 这跟默认公开编辑权限的项目-比如维基百科形成了鲜明对比,可能是“编辑的内容”和“用户生成内容”的web时代的重大的区别-从来都不缺乏人们贡献内容,区别是我们是否信任信任他们及他们产生的内容。同样,越来越多的提纲式的目录内容出现了,像已经停服Halley Suitt的十大主题,都是基于主题的聚合内容的思维。在任何情况下,试图招募一个编辑队伍去支撑不断成长的web被证明是注定失败的。但是,我们已经看到像美味(Delicious)的网站通过给网页或者帖子打标签所显示出的价值-一个新一代的目录已经显示出给所有的帖子打标签的价值,或者如我们所称,聚合。 谈到web的目录和列表, 我们不能不谈到雅虎。雅虎的原罪是在试图建立一个人工编辑的网站目录,在实现成为唯一成功的门户网站的不幸的目标之前,目录就是雅虎的标签。(即使到今天,雅虎一直维持了一个类似雅虎最初格式的目录页,即使这成了一个跟博客差不多的东西。)非但没有采用账户验证和关系绑定,以免网络垃圾压垮了网站,雅虎主要依靠向列表的公司收费,因而限制了它的功用。人工编辑目录差不多成了雅虎的脚注,也同时成了web历史的脚注。Read More…

27Oct/09

翻译练习:宏达电有Android2.0;本周发布?

翻译练习:同发译言http://www.yeeyan.com/articles/view/56852/65492 Hero也入手了,昨晚初见,今天下午入手,颜色如下。球友短短10分钟的的演示,将按从symbian转到了Android的甜品家族。 看起来摩托罗拉并不是唯一的尝到了美味小饼(Eclair,小饼,android2.0的谷歌代号-译者)的人,就是那个传说中的Andriod 2.0的小饼。 Andriod 2.0的发布很令人费解。 谷歌还没有发布操作系统(OS)或SDK,但Verizon已经表示 , Motorola Droid将运行的该操作系统。 不管怎样,运行Andriod2.0的Droid将于10月28日正式发售 。 我的问题因此出来了,三星的Moment 本星期发售,运行的却是Andriodd1.5系统。 不像摩托罗拉CLIQ,Moment上运行的Andriod不是针对三星的定制化版本。 这令人费解 , Verizon公司和摩托罗拉公司已经大谈Andriod2.0,而Sprint和三星似乎仍然停留在1.5的版本。 难道是摩托罗拉公司优先获得了Andriod 2.0? 于是我问了另外两个在美国的Andriod手机制造商,三星和HTC,是否也在Andriod 2.0的平台上忙碌。 三星拒绝透露,但宏达电(HTC)证实 , 他们的实验室里获得Andriod 2.0有一阵子了 , 并以此研发未来的手机。 这个问题非常重要 , Andriod作为开源软件,必须建立在谷歌没有偏好的基础上。 宏达电的G1是个特例,那是Andriod的概念验证产品;当下Andriod优势之一在于Read More…

25Oct/09

将搜索根植于应用之中

Embedded Search in Apps-内置于应用中的搜索,没听说过? 别谷歌百度了, 这个词是俺造出来的。最近哮喘复发,医生开了小菜四碟,水剂,粉剂,片剂尽有,说话也简洁。 “这个血象知道什么意思?” “知道,不是第一次了,离开北京症状就退了。。。” “只有去海南了, 今天开的药治表不治根。” 前后大概就这么几句话,没有安慰,也不夸张,平平淡淡,跟早市买菜买鱼一样。过去是万万不接受这样的方式,今天这个半瘸的中年大夫却让我感觉很对味。开的药也很有效,晚上能气顺能睡着了,白天也昏昏的,隐约记得大夫问过你开车的问题。 早晨无意发现了一个网站。有点俺说的ESIA的意思,www.splunk.com。号称是下一代的IT搜索, 企业内部无处不在的IT搜索。维基的解释很直白:is a monitoring and reporting tool for IT system administrators with search capabilities。以我高度的理论功底,这个Splunk在俺的ESIA的理论框架之下,IT日常的log管理和经常性(错误诊断和维修)trouble shooting and recovery就是Apps, 搜索是贯穿整个Apps的筋络。只有搜索才有能力提供在一个复杂的企业环境里信息的提取,整合,梳理和知识库的检索和方案的行动的形成。当然,这个已经被诸多知名企业采用的系统,在我看来还仅仅在ESIA的理念上开了个头, 原因是它目前的搜索和搜索跟业务流程的集成度还远远做的不够深入,不够完美。可以看出,系统的设计者是资深的IT项目专家和运维专家, 但对搜索的理解和技术的把握还在一般的软件应用水平。 有意思的是,俺实际是在找一个能线上共享知识的网站,从角色关系可以是单个分享者,多个受众,也可以使多个分享着,多个受众,必须有事件时间点(timeRead More…