文章摘要:北京时间7月21日《商业周刊》文章指出,谷歌正在进行收购ITASoftware的交易,后者虽然只是一家名不见经传的飞机票价信息供应商,但它却可以帮助谷歌进入垂直旅游搜索领域。此外,收购该公司还可能会让... |
北京时间7月21日《商业周刊》文章指出,谷歌正在进行收购ITA Software的交易,后者虽然只是一家名不见经传的飞机票价信息供应商,但它却可以帮助谷歌进入垂直旅游搜索领域。此外,收购该公司还可能会让谷歌与ITA的客户如Kayak和必应展开竞争。
旅游并非ITA唯一专注的领域,早在几年之前,ITA的研究部门就开始研究一种能够让用户利用网络资料来创建自己的数据库的工具。那款名为Needlebase的工具可以将杂乱无章且经常变化的信息变得结构清晰和井井有条。
Needlebase从1月份开始进行免费测试,它利用机器习得技术将从网站和其他来源获得的数据汇编成一个托管数据库,供垂直搜索引擎使用。 它与谷歌本月收购的另一家语义网络/结构化数据公司Metaweb开发的Freebase工具很相似,但是与类似于Freebase的大型公共数据库不同的是,Needlebase每一位用户的帐户都是不公开的。不管是否具备专业技术知识,任何人都可以用Needlebase来组织和利用网络数据建立自己的数据库。它的功能非常强大,而且可靠性也很强,足以作为部分后台资源用于商业化垂直搜索引擎。
从收购Needlebase可以看出谷歌的垂直搜索战略。谷歌以前从未收购过象ITA这样专注于某些特定领域的公司,但是Needlebase并非专注于特定领域的工具。 正如笔者在以前发表的一篇关于谷歌进入垂直搜索领域的文章中提到:谷歌可能会将ITA作为一块跳板,帮助它进军更多的垂直搜索领域,而且它不用再收购更多的公司或开发新产品。 也许谷歌对垂直搜索很感兴趣,但是它可能对轻松获得海量非结构化数据并让它们变得结构清晰更感兴趣一些。 这种技术简直具有点石成金之效。
Needlebase的开发团队共有14位成员,由ITA网络数据集成副总裁Justin Boyan领导。他是美国国家航空航天局阿梅研究中心(Ames Research Center)的一位不定期的匿名网络研究员,他在ITA已经工作了近10年的时间。 Boyan最近在接受一次电话采访时表示,他认为Needlebase符合谷歌对ITA的未来规划,他对Needlebase未来的发展表示乐观,Needlebase将继续为现有用户和新用户服务。
Needlebase可以说是ITA主要的飞机机票信息产品QPX背后的某些技术的普遍版本,Boyan在描述Needlebase的动力时说:它不需要解决AI问题。 也不需要花费人力去维护Perl脚本。 它似乎可以很好地与我们已经非常熟悉的机器习得技术相互配合。
基于云的Needlebase配备了一款从网站收集数据的向导工具。不管是使用了大量脚本语言或表格的网页还是CSV、XML和Excel文件,Needlebase都能从中收集数据。 而且Needlebase在从已经读取过的数据来源更新数据的时候,它还可以记住用户编辑、清除和复制的信息,并自动将它们应用到新数据的收集过程中。 Needlebase可以自动修改不正常的数据,给数据添加地域符号,修复大写和进行其他修改,最终让数据能够被合并到数据库中并能被用户查询。
Boyan表示,到目前为止,Needlebase一直被普遍应用于各种信息的管理,包括电影、求职、酒店、新闻、天气和石油泄漏等等。 2010年世界杯各项数据统计和重金属乐队就有很多应用Needlebase来管理信息的例子。 Boyan称,Needlebase被定性为一款商业级工具。 他说:我们正在寻找从事信息聚合工作的公司,他们建立垂直搜索引擎,从事数据收集、分析和商业分析。他说他希望很快就能宣布Needle获得首批付费用户的消息。 Needlebase将采用类似于云产品的即付即用型定价模式,根据客户获得、托管和发布的数据量来定价。
实际上,到目前为止,Needlebase并未公开发布过。 获得谷歌的支持后,情况将会发生变化。 这项交易可能还会对某些潜在客户造成影响,因为它们担心谷歌将与它们争夺垂直搜索市场。