Zapisy otwarte! Dołącz do kursu Selenium w Javie lub Selenium w C#. Tylko do 23.09.2021 do godz. 21:00. Zapisz się tutaj.

Selenium 6. Tytuł strony, URL i jej źródło

W tej lekcji pokażę Ci jak pobrać tytuł strony, URL i jej źródło.

Selenium zawiera metody umożliwiające nam pobranie takich informacji jak tytuł strony, URL i źródło. Tytuł strony to tekst, który znajdziemy pomiędzy znacznikami <title></title>. Znaczniki te znajdziesz w nagłówku dokumentu HTML, a więc wewnątrz znaczników <head></head>. URL to adres, który możesz zobaczyć w pasku adresu przeglądarki. Z kolei źródło strony, to cały dokument HTML. Możesz go także zobaczyć klikając w Chrome prawym przyciskiem myszy na dowolne miejsce na stronie i wybierając „Wyświetl źródło strony”.

Metody, które omawiam w tym filmie możesz zobaczyć w dokumentacji Selenium pod tym linkiem: WebDriver.

Ukryta treść

Nie masz dostępu do tego kursu. Wykup dostęp albo zaloguj się, by móc zobaczyć pełną lekcję.

Wsparcie merytoryczne

Nie masz dostępu do wsparcia merytorycznego dla tego kursu. Wykup dostęp albo zaloguj się, by móc zadawać pytania.

  1. Hej, przy metodzie getPageSource zauważyłem jedną rzecz. Pewnie jak nagrywałaś tą część to nie było tego problemu, ale teraz w momencie jak odpala się google.pl z drivera to wczytuje się w pierwszej kolejności strona z informacją o plikach cookies gdzie trzeba to zaakceptować. Myślałem, że zalogowanie się w tym momencie rozwiąże problem i kolejny raz już tej informacji nie będzie. Niestety, chrome widzi, że używane jest oprogramowanie do automatycznej kontroli i nie pozwala na zalogowanie. Jesteś w stanie podesłać mi jakieś info na ten temat jak sobie z tym poradzić? Pewnie można by za każdym razem sprawdzać czy wyświetliła się ta informacja i akceptować ją, ale nie wiem czy to jest najbardziej optymalne rozwiązanie. Z góry dzięki! 🙂

    Odpowiedz