query - urllib.urlencode python 3




Como codificar por porcentagem os parâmetros de URL no Python? (4)

É melhor usar o urlencode aqui. Não há muita diferença para o parâmetro único, mas o IMHO torna o código mais claro. (Parece confuso para ver uma função quote_plus ! Especialmente aqueles provenientes de outros languados)

In [21]: query='lskdfj/sdfkjdf/ksdfj skfj'

In [22]: val=34

In [23]: from urllib.parse import urlencode

In [24]: encoded = urlencode(dict(p=query,val=val))

In [25]: print(f"http://example.com?{encoded}")
http://example.com?p=lskdfj%2Fsdfkjdf%2Fksdfj+skfj&val=34

Docs

urlencode: https://docs.python.org/3/library/urllib.parse.html#urllib.parse.urlencode

quote_plus: docs.python.org/3/library/…

Se eu fizer

url = "http://example.com?p=" + urllib.quote(query)
  1. Não codifica / para %2F (quebra a normalização OAuth)
  2. Não manipula Unicode (lança uma exceção)

Existe uma biblioteca melhor?


Dos docs :

urllib.quote(string[, safe])

Substitua caracteres especiais em string usando o escape% xx. Letras, dígitos e os caracteres '_.-' nunca são citados. Por padrão, essa função destina-se a citar a seção de caminho da URL. O parâmetro safe opcional especifica caracteres adicionais que não devem ser citados - seu valor padrão é '/'

Isso significa que a passagem "por segurança resolverá seu primeiro problema:

>>> urllib.quote('/test')
'/test'
>>> urllib.quote('/test', safe='')
'%2Ftest'

Sobre a segunda edição, há um relatório de bug sobre isso here . Aparentemente, foi corrigido em python 3. Você pode contornar isso codificando como utf8 assim:

>>> query = urllib.quote(u"Müller".encode('utf8'))
>>> print urllib.unquote(query).decode('utf8')
Müller

A propósito, dê uma olhada no urlencode

Observe que o urllib.quote movido para urllib.parse.quote no Python3


No Python 3, o urllib.quote foi movido para o urllib.parse.quote e manipula o unicode por padrão.

>>> from urllib.parse import quote
>>> quote('/test')
'/test'
>>> quote('/test', safe='')
'%2Ftest'
>>> quote('/El Niño/')
'/El%20Ni%C3%B1o/'

Se você estiver usando o django, você pode usar o urlquote:

>>> from django.utils.http import urlquote
>>> urlquote(u"Müller")
u'M%C3%BCller'

Observe que as alterações no Python desde que essa resposta foi publicada significam que agora é um wrapper herdado. Do código-fonte do Django 2.1 para django.utils.http:

A legacy compatibility wrapper to Python's urllib.parse.quote() function.
(was used for unicode handling on Python 2)




urlencode