搜索引擎根据原Sphider的脚本修正后的 Sphider-plus 2.2
标签: 搜索引擎脚本search数据库authorizationjavascript
-- : 1412人阅读 评论() 收藏 举报
分类: PHP文章()
版权声明:本文为博主原创文章,未经博主允许不得转载。 搜索引擎根据原Sphider的脚本修正后的 Sphider-plus 2.2 http://www.sphider-plus.eu/ Sphider是一个轻量级的网络搜索引擎蜘蛛和PHP编写的,以它的后端数据库软件MySQL。 这是一个搜索功能添加到您的网站或建立您自定义搜索引擎很好的工具。 Sphider小巧,易于安装和修改,并在世界各地数以千计的网站上使用。 Item项目 Description描述
UTF- support UTF - 8支持 Index and search for Chinese, Cyrillic, Georgian, Hebrew etc. charsets.索引和中文,西里尔语,格鲁吉亚语,希伯来语等字符集搜索。
Media support 媒体支持 Index and search for images, audio and video.索引和图像,音频和视频搜索。 EXIF and ID3 information are also indexed and herewith become searchable, thumbnails for images, open the media with player software.的EXIF和ID3信息,也成为索引和搜索函,对图像的缩略图,打开媒体播放器软件。
RDF, RSD, RSS and Atom feed support RDF的,精密度,RSS和Atom供稿支持 Index and search of feed content, inclusive RDF 'Dublin Core' tags.指数和饲料的内容,包括RDF的'都柏林核心'标签搜索。 Obey / ignore 'preferred' tags in RSD feeds.服从/忽略'优先'的区域市政总署标签供稿。
Follow / ignore CDATA directives.按照/忽略CDATA指示。
Various search modes 多种搜索模式 Search with wildcards, Tolerant search, Search strict, Search only in one domain, Search for all links of a site, Search for media (link-specific).带有通配符搜索,宽容搜寻,搜寻严格,只在一个领域,对于所有的网站链接,媒体搜索(链接特定的)。
Result cache 结果缓存 Extremely reduced response time for queries already cached.非常缩短查询响应时间已经缓存。 Controller to keep the 'Most Popular Queries' always in cache.控制器保持'最热门查询始终在缓存中。 Separate caches for text and media results.文本和媒体的单独缓存。 Admin configurable.管理配置。
Different sort modes 不同的排序模式
for result listing 对结果列表 Admin selectable: -By relevance (weight %) -By hit counts in full text -Most popular links on top -By indexdate -By URL names -Main URL (domain) on top -Like Google (Top per URL)管理员可选择:由相关(重量%)由击中全文计数顶级按indexdate最受欢迎链接上按网址的名称,主要网址(域名)在最前面,像谷歌(顶部2每网址)
Same results for queries with and without quotes 为与不带引号查询相同的结果 Admin selectable; will deliver the same results for queries like:管理员可选择;将提供像查询相同的结果:
d'information <-> information and dei'largi <-> largi新闻社“ - ”信息和dei'largi“ - ”largi
Admin selectabe: equalization for different quotes like: ' ` ´管理员selectabe:像不同的报价均衡:'`'
Extensive user statistics 广泛的用户统计 Most popular text links, Most popular media links, User IP, Country code, Host name, Last queried, etc.最流行的文字链接,最流行的媒体链接,用户的IP,国家代码,主机名,最后质疑,等
Multiple database support 多数据库支持 Individual config and activation of databases for Admin, Search User and Suggest URL User.配置和个人的管理,搜索用户和用户推荐网址数据库激活。 Support of multiple table sets in each db, MySQL query cache, individual index for each db, individual or bulk search in predefined databases.每个分贝多个表集支持,MySQL查询缓存,个别指数为每分贝,单项或批量在预定义的数据库搜索。
Segmentation of Chinese and Korean words 分割中国和韩国的话 Will divide phrases like 帽子和服装 into the base words 帽子 and 和 and 服装 , so that all will become searchable.像帽子将划分为基础的话帽子和和和服装,让大家可以搜索和服装词组。
Index of password protected sites 指数密码保护的网站 Index also .htacces protected sites (basic authorization).指数还。htacces保护区(基本授权)。
Up to different zones could be registered and will be indexed.多达3个不同的区域可以进行登记,将被编入索引。
Index framesets 指数框架集
and iframes 和内部框架 If enabled, both options will index html and image frames.如果启用,两个方案都将指数的HTML和图像帧。
Not available for dynamically reloaded frames (eg JavaScript).不适合用动态加载帧(如JavaScript)的。
Follow redirections and cannonical links 按照重定向和规范链接 Automatical forwarding for the indexer.全自动转发的索引。
Index of ZIP compressed files and archives 指数ZIP压缩文件和档案 Supports compressed (X)HTML, XML and also PDFs, all kind of feeds, frames and iframes in archives.支持压缩(X)HTML的,也XML和PDF文件,所有的一种饲料,框架和档案内部框架。
Links found in the compressed files are followed.链接在压缩文件中得到遵守。
Included PDF converter 包括PDF转换器 Converting also non-Latin text like Arabic, Cyrillic, Chinese, Greece and Hebrew documents.转换,也有非如阿拉伯语,西里尔语,中国,希腊和希伯来文的文件拉丁文字。 Configurable for Windows, Linux/Unix operating systems.配置在Windows,Linux / Unix操作系统。
Debug mode 调试模式 Offering detailed information during index/re-index:在提供索引/重新索引的详细信息:
New links, keywords, frames and media found per link.新的链接,关键字,框架和媒体发现,每个环节。
Follow Sitemap files 按照Sitemap文件 If available sitemap.xml as well as gzip compressed files will be used to follow the links of a site.如果可用sitemap.xml的以及gzip压缩文件将被用于跟踪一个网站的链接。 If <sitemapindex .如果“sitemapindex。 . 。 . 。 > “
is detected also multiple Sitemap files are processed.还发现多个Sitemap文件处理。
Erase & Re-index 擦除和重新编制索引 Individual (site specific) or bulk update of database.个人(具体地点)或批量更新数据库。
User URL suggest 用户的网址建议 User may suggest new sites to become part of database.用户可以提出新的网站,成为数据库的一部分。
With Admin approval, reject and banned domains manager.随着管理的批准,拒绝,并禁止域经理。
顶 踩