Посты с тэгом urllib2


[Из песочницы] Доставка свежей прессы с помощью Python прямо в почтовый ящик

В данной статье будут освещены следующие возможности python'a:

  • парсинг web-страницы с помощью простого регулярного выражения;
  • скачивание файла с web-страницы;
  • отправка скаченного файла через smtp-сервер;
  • написание небольшого обобщающего скрипта.

Все это будет сопровождено работающими примерами.
Читать дальше →


Авторизация на сайтах через urllib2

sdСтандартная библиотека питона для работы с вебом — urllib2, позволяет с помощью использования различных хэндлеров добавлять различный функционал. Будь то обработка ssl, работа с cookies либо какие-то расширения http протокола. А если есть работа с cookies, то значит можно авторизироваться на различных сайтах и ходить по «закрытой» их части

Для примера, залогинимся на лоре

Сначала нам требуется создать объект, который будет хранить наши куки, этот объект создается из библиотеки cookielib

import cookielib
 
cookie = cookielib.CookieJar()

После этого, создаем объект opener из urllib2, собственно, для общения по протоколу http с добавлением cookie хэндлера

import 


Python / Библиотека для упрощения HTTP-запросов

Requests — библиотека Python, которая элегантно и просто выполняет HTTP-запросы. Теперь не нужно осваивать urllib2 с излишне сложными программными интерфейсами.

Вот как выглядит HTTP-запрос с авторизацией с помощью requests:

>>> r = requests.get('https://api.github.com', auth=('user', 'pass'))
>>> r.status_code
200
>>> r.headers['content-type']
'application/json'