Доступ в Интернет Python с использованием Urllib.Request и urlopen ()

Содержание:

Anonim

Что такое urllib?

urllib - это модуль Python, который можно использовать для открытия URL-адресов. Он определяет функции и классы, помогающие в действиях URL.

С помощью Python вы также можете получать доступ и извлекать данные из Интернета, такие как XML, HTML, JSON и т. Д. Вы также можете использовать Python для работы с этими данными напрямую. В этом уроке мы увидим, как мы можем получать данные из Интернета. Например, здесь мы использовали URL-адрес видео guru99, и мы собираемся получить доступ к этому URL-адресу видео с помощью Python, а также распечатать HTML-файл этого URL-адреса.

В этом уроке мы узнаем

  • Как открыть URL-адрес с помощью Urllib
  • Как читать HTML-файл для вашего URL-адреса в Python

Как открыть URL-адрес с помощью Urllib

Прежде чем мы запустим код для подключения к Интернет-данным, нам нужно импортировать оператор для модуля библиотеки URL или urllib.

  • Импортировать urllib
  • Определите вашу основную функцию
  • Объявите переменную webUrl
  • Затем вызовите функцию urlopen в библиотеке URL lib.
  • URL-адрес, который мы открываем, - это руководство по guru99 на YouTube.
  • Далее мы собираемся распечатать результирующий код
  • Код результата получается путем вызова функции getcode для созданной нами переменной webUrl.
  • Мы собираемся преобразовать это в строку, чтобы ее можно было объединить с нашей строкой «код результата».
  • Это будет обычный HTTP-код «200», указывающий на успешную обработку HTTP-запроса.

Как получить URL-адрес формы HTML-файла в Python

Вы также можете прочитать HTML-файл с помощью «функции чтения» в Python, и когда вы запустите код, HTML-файл появится в консоли.

  • Вызов функции чтения для переменной webURL
  • Переменная чтения позволяет читать содержимое файлов данных
  • Считайте все содержимое URL-адреса в переменную с именем data.
  • Запустите код - он распечатает данные в формате HTML.

Вот полный код

Пример Python 2

## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()

Пример Python 3

## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)