ia_archiver是Internet Archive(互聯(lián)網(wǎng)檔案館)的網(wǎng)絡(luò)爬蟲程序。Internet Archive 是一個(gè)非營(yíng)利性組織,致力于建立互聯(lián)網(wǎng)的數(shù)字檔案館,保存歷史上重要的網(wǎng)頁內(nèi)容、多媒體資料等信息,并使其對(duì)公眾開放。
ia_archiver爬蟲被用于抓取網(wǎng)頁內(nèi)容,并將這些內(nèi)容存檔在Internet Archive的數(shù)據(jù)庫中,以便長(zhǎng)期保存和檢索。這有助于保留互聯(lián)網(wǎng)上的重要信息,使其對(duì)后人、研究人員和其他用戶可見。
不過對(duì)于國(guó)內(nèi)網(wǎng)站來說不會(huì)帶來什么流量,可以選擇robots.txt協(xié)議禁止。
User-agent: ia_archiver
Disallow: /
如果還是禁止不了,可以選擇nginx規(guī)則禁止訪問,如下:
if ($http_user_agent ~* "ia_archiver") {
return 403;
}