Wget is de niet-interactieve netwerkdownloader die wordt gebruikt om bestanden van de server te downloaden, zelfs als de gebruiker niet op het systeem is ingelogd, en die op de achtergrond kan werken zonder het huidige proces te belemmeren.
- GNU wget is een gratis hulpprogramma voor het niet-interactief downloaden van bestanden van internet. Het ondersteunt HTTP-, HTTPS- en FTP-protocollen, evenals ophalen via HTTP-proxy's.
- wget is niet-interactief, wat betekent dat het op de achtergrond kan werken, terwijl de gebruiker niet is ingelogd. Hierdoor kunt u het ophalen starten en de verbinding met het systeem verbreken, zodat wget het werk kan afmaken. De meeste webbrowsers vereisen daarentegen een constante aanwezigheid van de gebruiker, wat een grote belemmering kan zijn bij het overbrengen van veel gegevens.
- wget kan links in HTML- en XHTML-pagina's volgen en lokale versies van externe websites maken, waarbij de directorystructuur van de originele site volledig opnieuw wordt gecreëerd. Dit wordt ook wel recursief downloaden genoemd. Daarbij respecteert wget de Robot Exclusion Standard (/robots.txt). wget kan de opdracht krijgen om de links in gedownloade HTML-bestanden naar de lokale bestanden te converteren voor offline weergave.
- wget is ontworpen voor robuustheid over langzame of onstabiele netwerkverbindingen; Als een download mislukt vanwege een netwerkprobleem, wordt het opnieuw geprobeerd totdat het hele bestand is opgehaald. Als de server hervatten ondersteunt, zal deze de server instrueren om de download voort te zetten vanaf het punt waar deze was gebleven.
Basissyntaxis:
De basissyntaxis van de Wget-opdracht is als volgt:
wget [option] [URL]>
Hier
[options]> vertegenwoordigt verschillende opdrachtregelopties die het gedrag van Wget wijzigen
[URL]> is het adres van het bestand of de website die moet worden gedownload.
JavaScript-tekenreeks vervangen
Opties:
Hier zijn de beschikbare opties in de wget-opdracht in Linux.
| Keuze | Beschrijving | Syntaxis |
|---|---|---|
| -v / –versie | Geef de versie van Wget weer die op uw systeem is geïnstalleerd. | $wget-v |
| -h / –hulp | Druk een helpbericht af waarin alle beschikbare opdrachtregelopties voor Wget worden weergegeven. | $ wget -h [URL] |
| -o logbestand | Stuur alle door het systeem gegenereerde berichten naar het opgegeven logbestand. Als er geen logbestand is opgegeven, worden berichten doorgestuurd naar het standaardlogbestand (‘wget-log’). | $ wget -o logbestand [URL] |
| -b / –achtergrond | Stuur het proces naar de achtergrond zodra het start, zodat andere processen kunnen doorgaan. Als er geen uitvoerbestand is opgegeven, wordt de uitvoer standaard doorgestuurd naar ‘wget-log’. | $ wget -b [URL] |
| -A | Voeg uitvoerberichten toe aan het huidige uitvoerlogbestand zonder dit te overschrijven. Hierdoor blijft het logbestand van eerdere opdrachten behouden, waarbij het huidige log erna wordt toegevoegd. | $ wget -a logbestand [URL] |
| -i | Lees URL's uit een bestand. Indien opgegeven als bestand, worden URL's gelezen uit standaardinvoer. Als URL's zowel in de opdrachtregel als in het invoerbestand aanwezig zijn, hebben de URL's op de opdrachtregel voorrang. Het bestand hoeft geen HTML-document te zijn. | $ wget -i invoerbestand $ wget -i invoerbestand [URL] |
| -t nummer / –pogingen=nummer | Stel het aantal nieuwe pogingen in. Geef ‘0’ of ‘inf’ op voor oneindig opnieuw proberen. De standaardinstelling is 20 nieuwe pogingen, met uitzonderingen voor fatale fouten zoals het weigeren van de verbinding of het niet vinden van een link. | $ wget -t nummer [URL] |
| -C | Hervat een gedeeltelijk gedownload bestand als het bestand hervatten ondersteunt. Als hervatten niet wordt ondersteund, kan de download niet worden hervat. | $ wget -c [URL] |
| -In | Stel het systeem zo in dat het het opgegeven aantal seconden wacht tussen het ophalen. Deze optie helpt de serverbelasting te verminderen door verzoeken te spreiden. De tijd kan worden opgegeven in seconden, minuten (m), uren (h) of dagen (d). | $ wget -w aantal_in_seconden [URL] |
| -R | Maak het recursief ophalen van gespecificeerde links mogelijk, zelfs in het geval van fatale fouten. Deze optie volgt recursief links binnen de opgegeven URL. | $ wget -r [URL] |
Voorbeeld :
1. Om eenvoudig een webpagina te downloaden:
Om één bestand van een URL te downloaden, geeft u eenvoudigweg de URL als volgt op:
wget http://example.com/sample.php>
2. Om het bestand op de achtergrond te downloaden
Voer het downloadproces op de achtergrond uit met behulp van de-b>of--background>keuze:
wget -b http://www.example.com/samplepage.php>
3. Om het logboek te overschrijven tijdens de wget-opdracht
Leid de uitvoerberichten om naar een logbestand met behulp van de-o>keuze:
wget http://www.example.com/filename.txt -o /path/filename.txt>
4. Om een gedeeltelijk gedownload bestand te hervatten
Als een download wordt onderbroken, kunt u deze hervatten met behulp van de-c>keuze:
wget -c http://example.com/samplefile.tar.gz>
5. Om een bepaald aantal keren te proberen
Geef het aantal nieuwe pogingen op met behulp van de--tries>keuze:
wget --tries=10 http://example.com/samplefile.tar.gz>
6. Wachttijd tussen ophalingen instellen:
Stel de wachttijd tussen ophalingen in met behulp van de-w>optie (in seconden, minuten, uren of dagen):
wget -w 10 http://example.com/large_file.zip>
7. Recursief ophalen inschakelen:
Schakel recursief ophalen in om een volledige website te downloaden met behulp van de-r>keuze:
een array in Java
wget -r http://example.com/>
8. Lees URL's uit bestand:
Lees URL's uit een bestand en download ze met behulp van de-i>keuze:
wget -i urls.txt>
Wget-opdracht – Veelgestelde vragen
Waar wordt het wget-commando voor gebruikt?
De opdracht wget is een krachtig opdrachtregelprogramma dat wordt gebruikt in Linux- en Unix-gebaseerde systemen om bestanden van internet op te halen via HTTP-, HTTPS- en FTP-protocollen. Het is met name handig voor niet-interactieve downloads, gespiegelde websites en recursieve downloads.
Hoe download je een bestand met wget?
Om een enkel bestand te downloaden met wget, kunt u eenvoudigweg de opdracht uitvoeren, gevolgd door de URL van het bestand dat u wilt downloaden.
Bijvoorbeeld:
wget https://example.com/file.zip>
Hoe kan ik een volledige website downloaden met wget?
Om een volledige website recursief te downloaden, gebruikt u de
-m>of--mirror>optie samen met de-p>of--page-requisites>optie om alle benodigde bestanden te downloaden.Bijvoorbeeld:
wget -m -p https://example.com>
Hoe beperk ik de downloadsnelheid of bandbreedte bij het gebruik van wget?
U kunt gebruik maken van de
--limit-rate>optie om de downloadsnelheid of het bandbreedtegebruik te beperken.Bijvoorbeeld: Om de downloadsnelheid te beperken tot 500 KB/s, kunt u het volgende uitvoeren:
wget --limit-rate=500k https://example.com/file.zip>
Hoe kan ik een onderbroken download voortzetten met wget?
Als een download wordt onderbroken, kunt u de
-c>of--continue>optie om de download te hervatten vanaf het punt waar deze was gebleven.Bijvoorbeeld:
wget -c https://example.com/file.zip>
Conclusie
In dit artikel hebben we de Wget-opdracht besproken, een handig hulpmiddel in Linux voor het downloaden van bestanden van internet zonder gebruikersinteractie. Het werkt stil op de achtergrond, wat betekent dat je een download kunt starten en andere dingen kunt doen terwijl het werkt. Wget kan verschillende soorten webadressen verwerken en kan zelfs hele websites kopiëren. Het is handig voor langzame of onbetrouwbare internetverbindingen, omdat het blijft proberen te downloaden totdat het lukt. Bovendien biedt het handige functies, zoals het hervatten van onderbroken downloads en het instellen van wachttijden tussen het ophalen. Door de eenvoudige opdrachten en opties te leren, kunnen gebruikers hun downloads efficiënt beheren en tijd besparen.