Yioop! 0.94 增加了一个简单的名为 Page Rules 的语言用来控制从网页抽取数据的方法,同时可索引来自数据库查询结果和文本导入,支持 Atom 抓取;更好的分发归档数据的算法等等。
Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, 以及 sitemaps.
项目主页:http://www.seekquarry.com/
下载地址:http://www.seekquarry.com/?c=main&p=downloads
来自:开源中国社区