Muitos usuários do Windows estão tão acostumados com a interface gráfica e o navegador da web como a ferramenta universal de escolha que esquecem que há uma série de outras ferramentas por aí. Wget é um utilitário de linha de comando GNU popular principalmente nas comunidades Linux e Unix, usado principalmente para baixar arquivos da Internet. No entanto, existe uma versão do wget para Windows e, com ela, você pode baixar o que quiser, de sites inteiros a filmes, músicas, podcasts e arquivos grandes de qualquer lugar online.
Poucos usuários da Microsoft conhecem essa ferramenta bacana, e é por isso que escrevi este guia para iniciantes sobre como usar o wget no Windows. Temos a tendência de usar nosso navegador para tudo, o que é bom, mas nem sempre é a maneira mais eficiente de conseguir algo. Wget é apenas uma das muitas ferramentas que existem há eras, mas que poucas pessoas conhecem.
Obter wget para Windows
Obter o wget é muito fácil. Siga este guia para instalar e configurar o wget.
- Baixe o wget aqui e instale-o. Certifique-se de que é o programa de configuração e não apenas a fonte, caso contrário, não funcionará.
- Uma vez instalado, você agora deve ser capaz de acessar o comando wget a partir de uma janela de linha de comando. Abra uma janela CMD como administrador e digite ‘wget -h’ para testar. Se funcionar, você está certo, se receber "comando não reconhecido", você baixou o pacote errado. Tente novamente.
- Defina um diretório de download para salvar todos os seus arquivos. Digite ‘nome do diretório md’ para criar um diretório de download. Chamei o meu 'downloadz' para ser reconhecível.
Depois de instalado, você está pronto para trabalhar. Abaixo, listei uma seleção de comandos wget populares que podem realizar uma ampla variedade de coisas.
Baixe um único arquivo
wget //website.com/file.zip
Baixe um único arquivo, mas salve-o como outra coisa
wget ‐‐output-document = newname.html website.com
Baixe para uma pasta específica
wget ‐‐directory-prefix = pasta / subpasta website.com/file.zip
Retomar um download interrompido
wget ‐‐continue website.com /file.zip
Baixe uma versão mais recente de um arquivo
wget ‐‐continue ‐‐timestamping website.com/file.zip
Baixe várias páginas da web
Para isso, você precisa criar uma lista no Bloco de notas ou outro editor de texto. Adicione um novo URL completo (com //) em uma linha separada. Em seguida, aponte o wget para o arquivo. Neste exemplo, chamei o arquivo Filelist.txt e salvei na pasta wget.
wget ‐‐input Filelist.txt
Baixe um site inteiro
wget ‐‐execute robots = off ‐‐recursive ‐‐no-parent ‐‐continue ‐no-clobber //website.com
Você pode descobrir, como sempre faço, que os hosts da web bloqueiam os comandos wget. Você pode tentar falsificar esses bloqueios se passando por Googlebot. Experimente digitar isto:
wget –user-agent = ”Googlebot / 2.1 (+ // www.googlebot.com/bot.html)” -r //website.com
Baixe um tipo de arquivo específico de um site
wget ‐‐level = 1 ‐‐recursive ‐‐no-parent ‐‐accept FILETYPE //website.com / FILETYPE /
Por exemplo, altere FILETYPE para MP3, MP4, .zip ou o que quiser.
Baixe todas as imagens do site
wget ‐‐diretório-prefixo = arquivos / imagens ‐‐ sem diretórios ‐‐recursivo ‐‐no-clobber ‐‐ aceitar jpg, gif, png, jpeg //website.com/images/
Verifique se há links quebrados em um site
wget ‐‐output-file = logfile.txt ‐‐recursive ‐spider //website.com
Baixe arquivos sem sobrecarregar o servidor web
wget ‐‐limit-rate = 20k ‐‐wait = 60 ‐‐random-wait ‐‐mirror //website.com
Existem centenas, senão milhares de comandos wget e só mostrei alguns deles aqui. Agora que você está familiarizado com a ferramenta e como ela funciona, depende de você para que serve ela!
Você tem comandos interessantes que podem realizar maravilhas? Compartilhe-os conosco abaixo!