Kas yra urllibas?
urllib yra „Python“ modulis, kurį galima naudoti URL atidarymui. Jis apibrėžia funkcijas ir klases, padedančias atlikti URL veiksmus.
Naudodami „Python“ taip pat galite pasiekti ir gauti duomenis iš interneto, pvz., XML, HTML, JSON ir kt. Taip pat galite naudoti „Python“ tiesiogiai dirbdami su šiais duomenimis. Šioje pamokoje pamatysime, kaip galime gauti duomenis iš interneto. Pvz., Čia mes naudojome „guru99“ vaizdo įrašo URL ir pasieksime šį vaizdo įrašo URL naudodami „Python“, taip pat atspausdinsime šio URL HTML failą.
Šioje pamokoje mes išmoksime
- Kaip atidaryti URL naudojant „Urllib“
- Kaip skaityti „HTML“ failą savo „Python“ URL
Kaip atidaryti URL naudojant „Urllib“
Prieš vykdydami kodą prisijungdami prie interneto duomenų, turime importuoti URL bibliotekos modulio arba „urllib“ ataskaitą.
- Importuoti urllib
- Apibrėžkite savo pagrindinę funkciją
- Paskelbkite kintamąjį webUrl
- Tada iškvieskite urlopen funkciją URL lib bibliotekoje
- URL, kurį atidarome, yra „guru99“ pamoka „YouTube“
- Tada mes atspausdinsime rezultato kodą
- Rezultato kodas gaunamas iškvietus getcode funkciją mūsų sukurtame webUrl kintamajame
- Mes konvertuosime tai į eilutę, kad ją būtų galima susieti su mūsų eilučių „rezultato kodu“
- Tai bus įprastas HTTP kodas „200“, nurodantis, kad „http“ užklausa sėkmingai apdorota
Kaip gauti HTML failo formos URL „Python“
HTML failą taip pat galite perskaityti naudodami „Python“ funkciją „skaityti“, o paleidus kodą, HTML failas pasirodys konsolėje.
- Iškvieskite „webURL“ kintamojo skaitymo funkciją
- Skaitymo kintamasis leidžia nuskaityti duomenų failų turinį
- Perskaitykite visą URL turinį į kintamąjį, vadinamą duomenimis
- Paleiskite kodą - duomenys bus atsispausdinti HTML formatu
Čia yra visas kodas
„Python 2“ pavyzdys
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
„Python 3“ pavyzdys
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)