Web Semântica com Python: HTTP, HTML e Crawlers

5. Questões de múltipla escolha

Questão 1 (média) — Sobre urllib.request.urlopen()

Resposta correta: C) Retorna um objeto HTTPResponse representando a resposta HTTP

O método urlopen() retorna um HTTPResponse, que encapsula a resposta do servidor e permite ler o conteúdo com read().

Questão 2 (difícil) — Sobre HTMLParser

Resposta correta: B) handle_starttag é o manipulador usado para extrair atributos como href

Para obter o href, o código redefine handle_starttag e procura o atributo href entre attrs.

Questão 3 (difícil) — URL relativo vs absoluto

Resposta correta: C) urljoin(base, relative) transforma relativo em absoluto

Exemplo: urljoin('http://exemplo.org/pagina.html', '/contato') resulta em http://exemplo.org/contato.

Questão 4 (extremamente difícil) — Collector

Resposta correta: B) Coleta apenas URLs HTTP absolutas, transformando hrefs relativos via urljoin

Collector utiliza urljoin para tornar hrefs relativos em absolutos e filtra por http.

Pontuação Total 0.00