Twiceler是一個網(wǎng)絡(luò)爬蟲程序,曾經(jīng)被用于收集和索引網(wǎng)頁內(nèi)容以支持搜索引擎。Twiceler爬蟲由Cuil(一家曾經(jīng)存在的搜索引擎公司)開發(fā)和使用。
Twiceler爬蟲主要用于抓取網(wǎng)頁內(nèi)容,并將這些內(nèi)容存儲在搜索引擎的數(shù)據(jù)庫中,以提供搜索結(jié)果。它遵循網(wǎng)絡(luò)爬蟲的基本原則,即通過訪問網(wǎng)頁并抓取其中的信息來建立搜索引擎的索引。
不過對于國內(nèi)網(wǎng)站來說不會帶來什么流量,可以選擇robots.txt協(xié)議禁止。
User-agent: twiceler
Disallow: /
如果還是禁止不了,可以選擇nginx規(guī)則禁止訪問,如下:
if ($http_user_agent ~* "twiceler") {
return 403;
}