wget – Công cụ download siêu tốc trên Linux

Có nhiều người đã hỏi mình về một chương trình quản lý download tương tự như Internet Download Manager (IDM) của Windows, và câu trả lời của mình là khó có chương trình nào có thể làm tốt bằng IDM ngay cả trên Windows. Để thay thế IDM trên Linux thì có rất nhiều lựa chọn như Flashget, JDownloader hay Wget…Trong những chương trình trên mình đặc biệt thích Wget, đây là một chương trình download đơn giản nhưng cực kỳ hiệu quả. Nó có thể được dùng để download các tập tin riêng lẻ hay download toàn bộ một website (crawler). Bây giờ chúng ta sẽ xem một vài ví dụ về wget để thấy được các chức năng của nó:

Download một tập tin: 
Mã:
wget download-url

Restore download khi bị ngắt (thêm tham số -c khi bắt đầu download)
Mã:
  wget -c download-url
\
Nhìn vào hình ảnh trên ta thấy được file tải về đã bị ngắt ở thời điểm 19%, tuy nhiên ban đầu chúng ta đã dùng tham số -c (–continue) nên có thể tiếp tục tải về mà không bị mất dữ liệu đã tải trước đó. Chúng ta có thể thấy file tải về sẽ được tiếp tục tải ở 19%, quá trình bắt đầu từ dấu (+) cuối cùng và tiếp đó là dấu (=). Tham số này rất hữu ích khi bạn muốn tải về một file nhưng kết nối của bạn không ổn định.

Để crawler một website chúng ta dùng tham số -r ( –recursive)
Mã:

wget -r url_website
Khi crawler bạn có thể giới hạn các định dạng tải về bằng tham số -A (–accept). Ví dụ chỉ tải về các file định dạng htm,html,jpg ta làm như sau:
Mã:
 wget -r -A.jpg,.html,.htm http://www.vnexprees.net #hoặc wget -r --accept=jpg,html,htm http://www.vnexpress.net

Dùng wget để phân tích một địa chỉ bằng –spider, nếu địa chỉ đúng sẽ hiển thị như sau: 
Ma:

 wget --spider download-url

Spider mode enabled. Check if remote file exists. 
request sent, awaiting response... 200 OK
 Length: unspecified [text/html]

 Remote file exists and could contain further links,
 but recursion is disabled -- not retrieving.

Nếu địa chỉ không tồn tại thì kết quả là:
Mã:
wget --spider download-url 
Spider mode enabled. Check if remote file exists. 
HTTP request sent, awaiting response... 404 Not Found 
Remote file does not exist -- broken link!!!

Tải về nhiều file đồng thời. Chúng ta có thể dùng một danh sách file cần tải về rồi tham số -i:
Mã:


 wget - i file_list.txt

Tự động download bằng Wget với Add-on FlashGot Mass Downloader của Firefox:

Một trong những nhược điểm của Wget là không tự bắt link trình duyệt, mà bạn phải tự get direct link rồi add vào. FlashGot sẽ giúp bạn khắc phục nhược điểm này. Đầu tiên bạn cần phải download và cài FlashGot Mass Downloader trên kho tiện ích của Mozilla. Hơi buồn một chút là tiện ích này mới chỉ hỗ trợ Firefox.



Sau khi cài đặt xong, các bạn vào Tools > FlashGot > More Options





Mục Download Manager bạn đổi thành Wget và OK để xác nhận.




Và bây giờ, khi bạn tải một tệp tin bất kỳ, sẽ có thêm mục FlashGot:





Bạn chọn mục này rồi nhấn Save File để tiến hành tải tệp tin về với Wget. 





Đối với lần tải đầu tiên, bạn sẽ được yêu cầu chọn và xác nhận đường dẫn lưu tệp tin:



Ưu điểm và nhược điểm:

Ưu điểm
  • Tốc độ cao tương đương IDM
  • Đơn giản, dễ sử dụng
  • Có sẵn, không cần cài đặt
  • Free 

Nhược điểm
  • Không tự bắt link tải nếu không có sự hỗ trợ của FlashGot.
  • Không tự bắt link video
  • Ít tùy biến, tùy chọn
  • Sử dụng Command Line gây khó khăn cho Newbie
  • Không Resume được 

Nhìn sơ thì nhược điểm có vẻ lớn hơn ưu điểm nhưng dẫu sao thì Wget cũng là một công cụ hay không nên bỏ qua Về việc download Video thì mặc dù Wget chưa hỗ trợ nhưng có một tiện ích khác sẽ giúp bạn làm việc này, có lẽ mình sẽ để dành cho bài viết khác


Chúc các bạn thành công
Nguồn: Sưu tầm

Reactions