Bygg en nedlastingsplanlegger med lite programmeringsevner

Innholdsfortegnelse:

Bygg en nedlastingsplanlegger med lite programmeringsevner
Bygg en nedlastingsplanlegger med lite programmeringsevner

Video: Bygg en nedlastingsplanlegger med lite programmeringsevner

Video: Bygg en nedlastingsplanlegger med lite programmeringsevner
Video: Generate Studio Quality Realistic Photos By Kohya LoRA Stable Diffusion Training - Full Tutorial - YouTube 2024, April
Anonim

Vi elsker alle å laste ned ting fra internett, og det finnes massevis av flotte nedlastingsbehandlingverktøy som vi kan bruke til å planlegge nedlastingene våre. Det kan bare være lettere å bruke en nedlastingsbehandling, men det er ingen skade i å utforske verktøyene som allerede kommer med vår Ubuntu og gjøre det fullt ut av det.

I denne artikkelen vil vi vise deg en innebygd programvare i Ubuntu som vi kan bruke til å laste ned ting fra internett ved hjelp av wget. På toppen av det vil vi vise deg hvordan du planlegger nedlastingen ved hjelp av Cron.

Last ned ved hjelp av Wget

Wget er en gratis programvarepakke for å hente filer ved hjelp av HTTP, HTTPS og FTP, de mest brukte internettprotokollene. Det er et ikke-interaktivt kommandolinjeverktøy, slik at det lett kan kalles fra skript, cron-jobber, terminaler uten X-Windows-støtte, etc.

Åpne terminalen din og la oss utforske hvordan vi kan bruke wget til å laste ned ting fra nettet. Den grunnleggende syntaksen for nedlasting med wget er følgende:

wget [alternativ] … …

Denne kommandoen laster ned wget-håndboken til din lokale stasjon

wget https://www.gnu.org/software/wget/manual/wget.pdf

Linux Cron

Ubuntu kommer med en cron-demon som brukes til å planlegge oppgaver som skal utføres på et bestemt tidspunkt. Crontab lar deg angi handlinger og tider som de skal utføres. Slik planlegger du vanligvis en oppgave ved hjelp av kommandolinjeverktøyet.

Åpne et terminalvindu og skriv inn crontab -e.

Det er grunnen til wget og hvordan Cron fungerer. La oss ta et løp på et ekte eksempel på hvordan du planlegger en nedlasting.

Planlegging Last ned

Vi skal laste ned Firefox 3.6 klokka 2 AM. Siden vår ISP bare gir en begrenset mengde data, må vi stoppe nedlastingen klokka 8.00. Dette er hvordan oppsettet ser ut.

[kode] 0 2 * * * wget -c https://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=no-GB [/kode]

C-alternativene angir at wget skal fortsette den eksisterende nedlastingen hvis den ikke er fullført.

Den fjerde kommandoen vil stoppe wget klokken 8.00. 'Killall' er en unix-kommando som dreper prosesser etter navn.

[kode] 0 8 * * * killall wget [/kode]

Killall wget forteller Ubuntu å stoppe wget fra å laste ned filen ved 8 AM.

Andre nyttige wget-kommandoer

1. Angi katalogen for å laste ned en fil

[kode] wget -output-document = / home / zainul / Nedlastinger / wget manual.pdf https://www.gnu.org/software/wget/manual/wget.pdf [/kode]

alternativet -output-dokumentet lar deg spesifisere katalogen og navnet på filen du laster ned

2. Last ned et nettsted

wget er også i stand til å laste ned et nettsted.

[kode] wget -m https://www.google.com/profiles/zainul.franciscus [/kode]

Kommandoen ovenfor laster ned hele min google profils webside. Alternativet '-m' forteller wget å laste ned et speilbilde av den angitte nettadressen.

Et annet viktig alternativ er å fortelle wget hvor mange lenker det skal følge når det lastes ned et nettsted.

[kode] wget -r -l1 https://www.google.com/profiles/zainul.franciscus [/kode]

Kommandoen ovenfor wget bruker to alternativer. Det første alternativet '-r' forteller wget å laste ned den angitte nettsiden rekursivt. Det andre alternativet '-l1' forteller wget å bare få det første nivået av koblinger fra den angitte nettsiden. Vi kan sette opp til tre nivå '-l2' og '-l3'.

3. Ignorer robotoppføring

Webmaster opprettholder en tekstfil kalt Robot.txt. 'Robot.txt' opprettholder en liste over nettadresser som en webleserbrowser som wget ikke skal gjennomsøke. Vi kan fortelle wget å ignorere 'Robot.txt' med '-erobots = off' alternativet. Følgende kommando forteller wget å laste ned den første siden av min google-profil og ignorere Robot.txt.

[kode] wget -erobots = av https://www.google.com/profiles/zainul.franciscus [/kode]

Et annet nyttig alternativ er -U. Dette alternativet vil maskere wget som en nettleser. Vær oppmerksom på at maskering av et program som et annet program kan være i strid med begrepet og tjenesten til en nettleverandør.

[kode] wget -erobots = av -U Mozilla https://www.google.com/profiles/zainul.franciscus [/kode]

Konklusjon

Wget er en veldig gammel skole, men likevel hackbar GNU-programvarepakke som vi kan bruke til å laste ned filer. Wget er et interaktivt kommandolinjeverktøy som betyr at vi kan la det kjøre på datamaskinen vår i bakgrunnen uten å måtte starte et program. Sjekk ut wget man siden

[kode] $ mann wget [/kode]

å forstå andre alternativer som vi kan bruke med wget.

lenker

Wget Manual Slik kombinerer du to nedlastede filer når wget mislykkes halvveis Linux QuickTip: Nedlasting og un-tarring i ett trinn

Anbefalt: