Um guia para iniciantes no uso do wget no Windows

Muitos usuários do Windows estão tão acostumados com a interface gráfica e o navegador da web como a ferramenta universal de escolha que esquecem que há uma série de outras ferramentas por aí. Wget é um utilitário de linha de comando GNU popular principalmente nas comunidades Linux e Unix, usado principalmente para baixar arquivos da Internet. No entanto, existe uma versão do wget para Windows e, com ela, você pode baixar o que quiser, de sites inteiros a filmes, músicas, podcasts e arquivos grandes de qualquer lugar online.

Um guia para iniciantes no uso do wget no Windows

Poucos usuários da Microsoft conhecem essa ferramenta bacana, e é por isso que escrevi este guia para iniciantes sobre como usar o wget no Windows. Temos a tendência de usar nosso navegador para tudo, o que é bom, mas nem sempre é a maneira mais eficiente de conseguir algo. Wget é apenas uma das muitas ferramentas que existem há eras, mas que poucas pessoas conhecem.

Obter wget para Windows

Obter o wget é muito fácil. Siga este guia para instalar e configurar o wget.

  1. Baixe o wget aqui e instale-o. Certifique-se de que é o programa de configuração e não apenas a fonte, caso contrário, não funcionará.
  2. Uma vez instalado, você agora deve ser capaz de acessar o comando wget a partir de uma janela de linha de comando. Abra uma janela CMD como administrador e digite ‘wget -h’ para testar. Se funcionar, você está certo, se receber "comando não reconhecido", você baixou o pacote errado. Tente novamente.
  3. Defina um diretório de download para salvar todos os seus arquivos. Digite ‘nome do diretório md’ para criar um diretório de download. Chamei o meu 'downloadz' para ser reconhecível.

a-beginners-guide-to-using-wget-in-windows-2

Depois de instalado, você está pronto para trabalhar. Abaixo, listei uma seleção de comandos wget populares que podem realizar uma ampla variedade de coisas.

Baixe um único arquivo

wget //website.com/file.zip

Baixe um único arquivo, mas salve-o como outra coisa

wget ‐‐output-document = newname.html website.com

Baixe para uma pasta específica

wget ‐‐directory-prefix = pasta / subpasta website.com/file.zip

Retomar um download interrompido

wget ‐‐continue website.com /file.zip

Baixe uma versão mais recente de um arquivo

wget ‐‐continue ‐‐timestamping website.com/file.zip

a-Beginners-guide-to-using-wget-in-windows-3

Baixe várias páginas da web

Para isso, você precisa criar uma lista no Bloco de notas ou outro editor de texto. Adicione um novo URL completo (com //) em uma linha separada. Em seguida, aponte o wget para o arquivo. Neste exemplo, chamei o arquivo Filelist.txt e salvei na pasta wget.

wget ‐‐input Filelist.txt

Baixe um site inteiro

wget ‐‐execute robots = off ‐‐recursive ‐‐no-parent ‐‐continue ‐no-clobber //website.com

Você pode descobrir, como sempre faço, que os hosts da web bloqueiam os comandos wget. Você pode tentar falsificar esses bloqueios se passando por Googlebot. Experimente digitar isto:

wget –user-agent = ”Googlebot / 2.1 (+ // www.googlebot.com/bot.html)” -r //website.com

Baixe um tipo de arquivo específico de um site

wget ‐‐level = 1 ‐‐recursive ‐‐no-parent ‐‐accept FILETYPE //website.com / FILETYPE /

Por exemplo, altere FILETYPE para MP3, MP4, .zip ou o que quiser.

Baixe todas as imagens do site

wget ‐‐diretório-prefixo = arquivos / imagens ‐‐ sem diretórios ‐‐recursivo ‐‐no-clobber ‐‐ aceitar jpg, gif, png, jpeg //website.com/images/

Verifique se há links quebrados em um site

wget ‐‐output-file = logfile.txt ‐‐recursive ‐spider //website.com

Baixe arquivos sem sobrecarregar o servidor web

wget ‐‐limit-rate = 20k ‐‐wait = 60 ‐‐random-wait ‐‐mirror //website.com

Existem centenas, senão milhares de comandos wget e só mostrei alguns deles aqui. Agora que você está familiarizado com a ferramenta e como ela funciona, depende de você para que serve ela!

Você tem comandos interessantes que podem realizar maravilhas? Compartilhe-os conosco abaixo!