Piton ne permite să lucrăm cu fișiere la distanță, poate acest lucru nu sună logic în acest fel, dar fișierele la distanță în acest caz nu sunt altceva decât interogări către pagini Web din programul nostru Python, motivul pentru care se poate face acest lucru este de la interogare la Servicii Web REST care ne permit să obținem valori prin OBȚINE sau interogați direct pagini și manipulați conținutul acestora.
Pentru a realiza acest lucru, vom folosi unele dintre numeroasele biblioteci pe care le oferă Piton pentru lucrul cu rețelele, eliminând astfel obstacolele tehnice și concentrându-ne doar pe cât de important este în logica noastră de programare.
urllib și urllib2
Aceste două librării urllib Da urllib2 Acestea ne permit să facem lucrurile de accesare a fișierelor prin rețea ca și cum ar fi în mediul nostru local, printr-un simplu apel către o funcție, acest lucru ne poate servi pentru multe lucruri, de exemplu că putem folosi un web și cu conținutul său faceți rapoarte în programul nostru despre ceea ce putem găsi în el.
Aceste două biblioteci sunt similare, diferența lor este aceea urllib2 poate fi ceva mai sofisticat, în cazul în care, dacă dorim pur și simplu să facem o interogare fără alte implicații, putem folosi urllib, dar dacă dorim să facem un proces de autentificare sau să folosim cookie-uri, atunci urllib2 poate fi alegerea potrivită pentru programul nostru.
Deoarece știm teoretic de ce avem nevoie și de ce avem nevoie de el, să vedem un mic exemplu de cod, astfel încât să ne fie clar ce putem face, în exemplul următor vom deschide un web din programul nostru și apoi prin expresii regulate vom extrage un link al conținutului său pentru acest lucru pe care îl vom folosi urllib:
>>> din urllib import urlopen >>> pagina web = urlopen ('http://www.python.org') >>> import re >>> text = webpage.read () >>> m = re.search ( „Tutorial”, text, re.IGNORECASE) >>> m.group (1)
Mergem pas cu pas, mai întâi din biblioteca urllib pe care o importăm urlopen, apoi creăm o variabilă numită pagină web care este cel care va conține rezultatul urlopen Ce vom face cu site-ul oficial al Piton, cu aceasta importăm deja re Pentru a lucra cu expresii regulate, spunem că textul este variabila care va avea conținutul citirii paginii, efectuăm o căutare cu o expresie regulată și, în final, grupăm rezultatul, care ar trebui să imprime următoarele:
http://docs.python.org/
Acest lucru se datorează metodei urlopenCeea ce faceți este că ne permite să lucrăm cu pagina Web ca și cum ar fi un obiect de fișier, în acest fel putem aplica multe dintre funcțiile pe care le putem folosi cu acest tip de obiecte, chiar dacă dorim putem descărca pagina și lucrați-l de la localul nostru într-un mod foarte ușor folosind metoda urlretrieve după cum urmează:
urlretrieve ('http://www.python.org', 'C: \ python_webpage.html')Singurul lucru pe care îl facem este să trecem ca al doilea parametru calea în mediul nostru local în care fișierul cu copia paginii ar trebui să fie salvat fără mari dificultăți.
Cu aceasta terminăm acest tutorial, deoarece vedem că a face lucrări mai complexe, cum ar fi utilizarea paginilor în programele noastre, este destul de simplă datorită bibliotecilor din Piton.
V-a plăcut și ați ajutat acest tutorial?Puteți recompensa autorul apăsând acest buton pentru a-i oferi un punct pozitiv