Что такое urllib?
urllib - это модуль Python, который можно использовать для открытия URL-адресов. Он определяет функции и классы, помогающие в действиях URL.
С помощью Python вы также можете получать доступ и извлекать данные из Интернета, такие как XML, HTML, JSON и т. Д. Вы также можете использовать Python для работы с этими данными напрямую. В этом уроке мы увидим, как мы можем получать данные из Интернета. Например, здесь мы использовали URL-адрес видео guru99, и мы собираемся получить доступ к этому URL-адресу видео с помощью Python, а также распечатать HTML-файл этого URL-адреса.
В этом уроке мы узнаем
- Как открыть URL-адрес с помощью Urllib
- Как читать HTML-файл для вашего URL-адреса в Python
Как открыть URL-адрес с помощью Urllib
Прежде чем мы запустим код для подключения к Интернет-данным, нам нужно импортировать оператор для модуля библиотеки URL или urllib.
- Импортировать urllib
- Определите вашу основную функцию
- Объявите переменную webUrl
- Затем вызовите функцию urlopen в библиотеке URL lib.
- URL-адрес, который мы открываем, - это руководство по guru99 на YouTube.
- Далее мы собираемся распечатать результирующий код
- Код результата получается путем вызова функции getcode для созданной нами переменной webUrl.
- Мы собираемся преобразовать это в строку, чтобы ее можно было объединить с нашей строкой «код результата».
- Это будет обычный HTTP-код «200», указывающий на успешную обработку HTTP-запроса.
Как получить URL-адрес формы HTML-файла в Python
Вы также можете прочитать HTML-файл с помощью «функции чтения» в Python, и когда вы запустите код, HTML-файл появится в консоли.
- Вызов функции чтения для переменной webURL
- Переменная чтения позволяет читать содержимое файлов данных
- Считайте все содержимое URL-адреса в переменную с именем data.
- Запустите код - он распечатает данные в формате HTML.
Вот полный код
Пример Python 2
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Пример Python 3
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)